[LE-talk-ja 185] Re: 重複符号化文字

Back to archive index

MORIYAMA Masayuki moriy****@mirac*****
2006年 5月 19日 (金) 18:12:29 JST


森山です。

Nozomi Ytow <nozom****@biol*****> wrote:
> >  このプロジェクトの「現実を見よう!」方針からすると、
> > 必要ないってことになりませんか。
> 
> CP932 -> CP51932 という変換の場合、たとえば
> 0x81BE -> 0xA2C0
> 0x879C -> 0xADFC
> という変換の方が
> 0x81BE -> 0xA2C0
> 0x879C -> 0xA2C0
> よりありがたいという気がするのですが、

MS の変換と異なってしまう事によって問題になるケースも出てくるでしょう
から、ここの所は慎重に考える必要があると思います。

0x879C というデータは、Windows 上で入力する事は困難な状態になってきて
いますので(WindowsNT、WindowsXP ではカットアンドペーストするだけで 
Unicode での正規化が行われます)、0x879C -> 0xADFC という変換が出来ない
ために問題が生じるというケースは、少ないものと思われます。

0x879C -> 0xADFC といった変換を必要とするソフトで個別に対応するのが現実的
なのではないかと思いますが、いかがでしょうか?

--
森山 将之 moriy****@mirac*****
ミラクル・リナックス株式会社




Legacy-Encoding-talk-ja メーリングリストの案内
Back to archive index