[Anthy-dev 2514] Re: gcanna.ctd の頻度について

Back to archive index

UTUMI Hirosi utuhi****@yahoo*****
2005年 10月 10日 (月) 17:53:50 JST


内海です。

Tabata-san wrote:
> > > #でも、今のやりかただと差分を受け取る方も疲れますね。
> > すぎもとさんがそう思ってらっしゃるのなら非常に申し訳ないです。
> 送るだけなら問題ないかと思います。

その辺りはすぎもとさんが判断なさることだと思いますので。:-)
今後は私のほうからはパッチを送りません。

> でも、僕の場合でも地名の辞書をマージする時に2000語で4時間ほど
> かけてしまっていますが、

人に任せていくことも必要だと思います。
例えば、
1. 先頭の100語ほどを見て、大丈夫そうならそのままコミット。
2. 未踏期間なら薄謝を出して校正者を募集。
3. 地名なら ML で "お住まいの地域の地名を確認してください" と伝える。
など。

あと、辞書の編集についてですが、ツールで解決するにしても
"最新の辞書が公開されている" ことが前提になると思います。

いまの cannadic は一年前のものですし、すぎもとさんの手元では
フォーマットも変わっているようです。
ここから他人の差分を吸収するには、手作業が必要になると思います。
(改変した cannadic を dixchange の イチ見出しイチ読みイチ品詞 にばらしてしまえば、
一語ずつの対応になるので、ツールを使えば統合も容易?)

内容自体のチェックに必要な時間は、ツールであっても diff であっても
変わらないと思います。

> でも、僕の場合でも地名の辞書をマージする時に2000語で4時間ほど
> かけてしまっていますが、

ちなみに私の差分も2週間分合わせて2000語弱でした。


別件ですが、
"きもちいい" と入力しても "気持ちよい" と変換されます。
base.t が typo しているようです。


--------------------------------------
Know more about Breast Cancer
http://pr.mail.yahoo.co.jp/pinkribbon/




Anthy-dev メーリングリストの案内
Back to archive index