[Anthy-dev 2818] 登録単語内のスペースの扱い

Back to archive index

Hideyuki SHIRAI ( 白井秀行 ) shira****@meado*****
2006年 2月 13日 (月) 15:21:38 JST


白井です。

(予測変換対応した人がいるよ、ってんで)2ch の anthy スレッドを見
ていたら、

『tamago の egg-anthy を使っていると、スペースを含む単語を登録す
ると、その単語がスペースでぶっちぎられてしまう』

という問題が指摘されていました。

たとえば、

% anthy-dic-tool --dump 
 <<snip>>
しらいひでゆき 1 白井 秀行
品詞	=	人名
 <<snip>>

と登録してあると、"しらいひでゆき" => "白井"、"秀行" と出てきて
しまいます。

anthy-7100b では anthy-agent --egg の出力が、以下のようになり、
確かに anthy-egg でぶっちぎっているのでした。

------- anthy-agent --egg (7100b) の出力 -------
GET-CANDIDATES 0 0 0 9999
+DATA 0 3
しらいひでゆき
白井 秀行
シライヒデユキ
------------------------------------------------

また、anthy.el では "白井 秀行" と変換され、問題ありませんでした。

## ここまでは自分で直しますが。。。以下本題です ^^;;;

しかし、anthy-7227, 7307, 7411 で確かめると、anthy-agent --egg
の出力が最初から、

------- anthy-agent --egg の出力 -------
GET-CANDIDATES 0 0 0 9999
+DATA 0 4
しらいひでゆき
白井
秀行
シライヒデユキ
----------------------------------------

とぶっちぎられて出力されています。anthy.el でも "白井" "秀行" と
分割されて候補に出てくるので "anthy-agent" でも同じことが起きて
いるのだと思います。また、UIM でも同様にぶっちぎりでした。

# UIM は Zaurus のしか持っていないので、バージョンすらわからない
# のですが、XMODIFIERS=@im=uim-anthy で動かしています。

というわけで、anthy-7227 以降はスペースを含む登録単語のハンドリ
ングが間違っているように感じるのですが、いかがでしょうか?

-- 
白井秀行 (mailto:shira****@meado*****)



Anthy-dev メーリングリストの案内
Back to archive index