Re: 重複符号化文字 (LE-talk-ja 231) - Legacy Encoding Project

"NARUSE, Yui" <narus****@airem*****> wrote:

> > その対応表の、Unicode でない方の集合は、何と呼べば
> CP* に対応する文字集合、じゃないですかね。
> CP932 でしたら Windows-31J でしょうが。

そうですか、知りませんでした。
Unicode サポートしてなかったころからコードページと言っていた
記憶があったので、「コードページ(code page)とは文字セットのこと」
というマイクロソフトの説明を鵜呑みにしていました。
http://msdn2.microsoft.com/ja-JP/library/2x8et5ee.aspx

> > 裏技的かどうかが重要なのではなく、工夫すれば区別できるものを
> > 区別できなくしてしまう事を仕様とするかどうかが重要でしょう。
> 仕様としてしまうのが妥当かと思います。
> どうしても区別したい場合は、文字コードのレイヤーでなく、
> 一つ上のレイヤーで区別したほうが幸せになれるかなーと。

うーん。round trip や source code separation は
優先順位が高いと私は思いますが、人それぞれなのですね。

> Mule と iconv は少々事情が異なると感じます。
> libiconv の場合は外に流れるケースが少なからずあるかと思います。

どうやって?

> Unicode へのコンバータ作るだけで実装自体は終わりますね。
> それだけで相互変換も可能になりますし。

では iconv が今回対象の文字コードをサポートしているのだから
もういい事になってしまうのでは?
--
のぞみ

Legacy Encoding Project

[LE-talk-ja 231] Re: 重複符号化文字