[Anthy-dev 1183] Re: uim-xim & ja_JP.UTF-8

Back to archive index

Etsushi Kato ekato****@ees*****
2004年 10月 12日 (火) 22:48:21 JST


こんばんは、加藤です。

On Tue, Oct 12, 2004 at 10:15:48PM +0900,
YamaKen <yamak****@bp*****> wrote:

> FreeBSD 5.3-BETA4 + uim r1474のuim-ximで以下の組み合わせでの正常
> 動作を確認しました。±や÷、〜も問題なく入力できてます。
> 
> LC_ALL=ja_JP.eucJP kterm  anthy,skk
> LC_ALL=ja_JP.eucJP mlterm anthy,skk
> LC_ALL=ja_JP.UTF-8 mlterm anthy,skk,py
> 
> ja_JP.eucJPでの動作確認は/usr/share/locale/ja_JP.UTF-8を削除した
> 状態で行ったのでUTF-8 locale非依存については問題ないと思います。

非依存にしました。

> uim-ximの内部実装については全く把握できていないのですが、以下の
> ような理解で合ってますでしょうか。要はja_JP.eucJP localeで動作さ
> せた場合に文字コードまわりでuim-xim 0.4.3と違った挙動を示す可能
> 性があるかどうかを確認したいと思っています。「内部UTF-8」と聞い
> たユーザの方々も気になるでしょうし。

無いです。日本語専用の以前の uim-xim は libuim の iconv で EUC-JP に変
換 (すどおり?) されたものを、X に送っていたのですが、新しいものは、gtk
immodule と同様に libuim で UTF-8 に変換された文字列を使っているだけで
す。

> ・eucJP → UTF-8(UCS?) → eucJP の変換過程では同じ変換テーブル
>   (iconv?)を使っていていわゆる「文字化け」は発生しない

はい。

> ・eucJP → compound textへの変換処理はuim 0.4.3と同等

そうです。0.4.4 で問題になった ja_JP.UTF-8 から、X の compound text へ
変換では、Xlib が ja locale にも関わらず ÷などの文字については
Unicode のままにしてしまうのが問題でした。

> ・ja_JP.UTF-8 localeで動作させた場合、uim-anthyやuim-skkから渡さ
>   れたEUC-JP文字列はiconv(3)によって"EUC-JP"→"UTF-8"の変換が行
>   われ、他に独自の変換テーブル等は介在しない

これは、libuim の方がやっていることで、uim-xim はそのまま X に送ってい
るだけです。

-- 
Etsushi Kato
ekato****@ees*****



Anthy-dev メーリングリストの案内
Back to archive index