[Anthy-dev 1998] anthy-6331 Re: anthy-6300d Re: anthy-6300

Back to archive index

yusuk****@cheru***** yusuk****@cheru*****
2005年 4月 1日 (金) 19:34:32 JST


田畑です。

> [anthy-dev 1991]の内容は渡辺さんの報告してくださった問題の
> 3つめしか解決してないですね。すみません。他のは今から調査します。
修正したものをanthy-6331としてリリースしました(というより、してもらいました)。

anthyの内部では部分文字列を切り出してから、色々な理由で部分文字列の
構造体(struct metaword)をくっつけていって、ある程度、大きな構造を
作っていきます。(src-splitter/metaword.c参照)
この構造が利用可能かどうかの判断は結合したときの理由(mw->type)に
よるのですが、接頭辞+自立語のパターンの時に文節境界の制約がかかった
時に間違った判断をしてしまっていたようです。

他の変更は
*メモリアロケータのalignを直したつもり(UltraSparcで動くかも、未チェック)
*wtype_tの32bitへの縮小
*dicutil.hへのanthy_dic_search_words_file()というAPIの実験的な追加
*その他、微調整

anthy_dic_search_words_file(const char *words)はちょっとアドホックな
実装になっていますが、/usr/share/dict/wordsを検索するAPIです。
(path名はanthy-confに書いてあります)
「インターネットで」と入力しようとして、「internetde」と打ってしまい
「いんてrねtで」になった時に自動修正するのに使えないかなと
思っています。
anthy_dic_search_words_file("internetde") => "internet"
と最長でマッチした単語がstrdupされて、返り値になります。
フロントエンド側で使ってもらえなかったり、別に実装されたり
した場合には、このAPIは消します。
--
 CHAOS AND CHANCE!
  Yusuke TABATA (yusuk****@cheru*****)




Anthy-dev メーリングリストの案内
Back to archive index