HARUYAMA Seigo
haruy****@queen*****
2005年 10月 16日 (日) 14:40:32 JST
春山です. 2chのAnthy/uimスレで Webを用いた辞書管理について話題になっていたので, http://pc8.2ch.net/test/read.cgi/linux/1122652270/n366- 同じようなことを考えていたのと, 最近 JSF/Hibernate/Spring の勉強をしていたので, 辞書の検索と登録ができるシステムをでっちあげました. (366氏とは関係ありません) http://coderidge.3hands.jp:8080/dm/ で 検索/登録をためせます. #しばらくサービスするつもりですが, こちらの都合で落すかもしれません. 現在 RDBMS(PostgreSQL)には gcanna.ctd と 2ch.tの単語だけを入れてあります. 語のよみ で 単語を検索したり, (よみ, 属性, 語)を登録することができます. 新規に登録した語も検索対象になります. これは叩き台であってまったく作りこんでいません. #文言がちょっとしかないのに置いてから複数箇所間違っているの発見してしまった ・編集や削除はできません. ・単語が登録されてもその管理はしません. ・登録される語の よみや属性の正当性のチェックはしていません. ・いろんな定数がハードコーディングされています. システム一式は http://www.unixuser.org/%7Eharuyama/software/dm/ の dm.war に (ソースごと)入っています. #PostgreSQLのパスワードだけ空にしてあります また このディレクトリに ・cannadic_to_insert.rb (go テーブルへの INSERT文を cannaの形式の辞書から作成する, 辞書名がハードコーディングされているので注意) ・zisyo_dump.sql (zisyo テーブルをダンプしたもの) があります. この種のシステムには SKKの辞書登録・削除希望単語入力フォームという先例があります. http://openlab.jp/skk/registdic.cgi ただ, 品詞をあまり意識しないでいいSKKと 品詞属性を意識する cannaの形式の辞書では 同様にはいかないのではないでしょうか? このようなシステムを導入しても, 辞書の管理はあまり楽にならないかもしれません. 辞書の管理を簡単にするためより, 辞書に対して貢献してくれる人を増やすことに重点を置いて システムを作ったほうがよいかもしれません. テキスト/メール ベースだと 間口が狭いですから. -- 春山 征吾 / HARUYAMA Seigo haruy****@unixu***** haruy****@queen*****