[LE-talk-ja 231] Re: 重複符号化文字

Back to archive index

Nozomi Ytow nozom****@biol*****
2006年 5月 22日 (月) 06:19:09 JST


"NARUSE, Yui" <narus****@airem*****> wrote:

> > その対応表の、Unicode でない方の集合は、何と呼べば
> CP* に対応する文字集合、じゃないですかね。
> CP932 でしたら Windows-31J でしょうが。

そうですか、知りませんでした。
Unicode サポートしてなかったころからコードページと言っていた
記憶があったので、「コードページ(code page)とは文字セットのこと」
というマイクロソフトの説明を鵜呑みにしていました。
http://msdn2.microsoft.com/ja-JP/library/2x8et5ee.aspx


> > 裏技的かどうかが重要なのではなく、工夫すれば区別できるものを
> > 区別できなくしてしまう事を仕様とするかどうかが重要でしょう。
> 仕様としてしまうのが妥当かと思います。
> どうしても区別したい場合は、文字コードのレイヤーでなく、
> 一つ上のレイヤーで区別したほうが幸せになれるかなーと。

うーん。round trip や source code separation は
優先順位が高いと私は思いますが、人それぞれなのですね。

> Mule と iconv は少々事情が異なると感じます。
> libiconv の場合は外に流れるケースが少なからずあるかと思います。

どうやって?

> Unicode へのコンバータ作るだけで実装自体は終わりますね。
> それだけで相互変換も可能になりますし。

では iconv が今回対象の文字コードをサポートしているのだから
もういい事になってしまうのでは?
--
のぞみ



Legacy-Encoding-talk-ja メーリングリストの案内
Back to archive index