NARUSE, Yui
narus****@airem*****
2006年 5月 19日 (金) 01:59:26 JST
成瀬です。 Tomoyuki Asakawa wrote: > あさかわ > >> 包摂文字かどうか指定する拡張というのもかつて考えてみたことは >> あるのですが、アプリケーション依存 (そんなのマニアしか使 >> わない >> ともいう) になりそうなのでやめました。 > > マニアしか、意味がわからないかもしれないけど > なんのことかわかってない、一般ピープルには、必要だから > わかってるベンダーはそいうい機能があれば使うはずです。 > > 既存コード(じつはレガシーという意識はない)から UNICODE > との、変換で、異なる実装があるのは、事実です。 > > その、違いを、統一するにしても(無理だろけど) > 統一させるには、既存のデータ資産を、統一型に、変換する必要があり > ます。 > そのためには、なんらかの方法で、そういう指定が必要なはずです。 > > また、異なる実装の間での、UNICODE - UNICODE の変換も必要な > はずです。 > > nkfが、ある意味、そういうものに対する「現実解」を、用意してくれ > てはいます。 > > iconvにも、同様なオプションがあればいいと思うのです。 iconv はそのような処理を提供するためのプログラムでは無いように感じます。 例えば改行コードの変換は、iconvは提供していませんしね。 # 提供している実装もありますけれど それは iconv 以外の何かが行うべきでしょう。 ICUで言えば、それは iconv に相当する UConverter でなく、 Transforms の管轄ですし。 http://icu.sourceforge.net/userguide/Transform.html ところで蛇足ですが、メイリオでは U+301C (Wave Dash) は、 U+FF5E (Fullwidth Tilde) と同じグリフになっているんですね。 -- NARUSE, Yui <narus****@airem*****> DBDB A476 FDBD 9450 02CD 0EFC BCE3 C388 472E C1EA