Yusuke TABATA
yusuk****@w5*****
2005年 9月 26日 (月) 00:44:41 JST
田畑です。 >>(c)自立語、付属語の接続の統計情報の生成 > 本当はこの情報は分かち書きの時点でも使うべきなのでしょうが、 > そこまで一気には作れないので、とりあえずは候補選択でだけ使うことを考えましょうか。 > > ちなみに分かち書きの時点でも使いたくなるのは次のような例 > 「映画で|揉みにいこう」 => 「映画でも|観に行こう」 > > 自立語x自立語は当然やるとして、自立語x付属語が役に立つのはどういう場合でしょう。 僕は「読みx付属語」で分かち書きの方を考えてました。 今の付属語グラフの中に入っている「弱い接続」の情報が いい加減なので自立語も含めて統計を取っておけば文節に 切る時の精度が向上するのではないかと期待してます。 あと、吉田君と違う方向からアプローチした方がソースを 変更する部分が重ならなくて良いかなと思ってます。 -- 以下はあんまり建設的なこと書いてないので、流し読みでお願いします。 >>(e)開発者の募集 > 僕がHaskellでRubyを実装することができたのも、 > Rubyの内部実装に関する詳細なドキュメントがあったからなので、 > Anthy Hacking Guideのようなデベロッパ向けの文書をきちんと書けば、 > 或いは変換エンジンを作ってみようという方が現れるかもしれません。 確かにドキュメントが足りてないのは確かなんですけど、現状の ドキュメントが足りてないとか、合ってないという不満もあんまり もらってないので、モチベーションがわかないですねえ... 少しずつ努力したいと思います。 > > 多分、評価されていないということは無いと思いますよ。 > anthyに関わったおかげで、僕自身は色々と交流が広がりましたし、 > 全然IMとは関係の無い集まりで、たまたまユーザの方がいらっしゃって、 > その方に感謝されたこともありましたし。 確かにユーザの皆様に感謝されるのは非常に幸せで、開発者やってて 良かったと感じることも多いです。また、最近は外国の方からお礼を 言われることも多くて嬉しいです。 ただ、変換エンジンの開発は頭と集中力と時間を使う難しいものだと いうことを技術者のクセに理解してない人と話した時に評価されてない と感じてしまいます。 僕の技術に対する評価なんてのは(僕以外の人には)どうでも良いの ですけど、一定の評価が得られる(と感じれる)状態でないと変換 エンジンの開発者が出てこないんではないかなと思ったりしてます。 > > それはさておき、コンパイラなどとは違って変換エンジンの教科書が無いのが、 > 変換エンジンの開発者が少ない一つの理由かもしれないですね。 そうですね、僕も教科書欲しいです。 -- -- CHAOS AND CHANCE! Yusuke TABATA