dune
FZH01****@nifty*****
2009年 5月 11日 (月) 19:30:18 JST
極悪こと安田です。 アブドハリリさんからメールをいただいて、morogram のスタンドアロン版 を修正しています。これまでの経緯(メール)を転送します。 Abudo Hariri <abudu****@gmail*****>さんのメッセージを転送します。 安田敏博 さま 突然のメールで大変失礼致します。千葉大学大学院自然科学研究科のアブドハリリと申します。 中国の新疆ウイグル自治区から来日した者です。今ウイグル語の形態論を中心にして研究を行っています。 最近は、安田敏博様が作ったN-gramツール(morogram-0.7.1.exe)を使っています。いろいろな使いやすい環境を提供したことを心から 感謝します。ありがとうございました。 現代ウイグル語を表記している文字がアラビア文字であり、文節単位で 分かち書きされています。ウイグル語は強い膠着性の特徴を持って言語であるので、この分かち書き単位をかなり複雑であり、形態素解析により語幹 を認定する必要があります。そのため、最近日本語形態素解析器MeCab にウイグル語の辞書を追加して、ウイグル語解析ツールを公開しました。 今回は、安田敏博のN-gramツール(morogram-0.7.1.exe)ツールもウイグル語言語学者に紹介したいと思っています。 ここで少しお願いがありますが、考えて頂ければ大変を有難いのです。 一つは、解析するファイル選択する時の「開くと保存」のところを英語に変更して頂きたいのです(本当はウイグル文字にしたいのですが)。 二つ目は、解析するファイルを半角スペースによって分解して、分解した単位のN-gramを取ることが可能でしょうか。 すなわち、今の --W オプションでの、単位を更に分解したいと思ったのです。目的は、語幹と語尾の関係を明らかにすることです。 これを一つのオプションにして頂ければ大変有難いのです。 どうかよろしくお願い致します。 アブドハリリ -- ---------------------------------------------------------------------------------------------------------- アブドレイム・アブドハリリ ABUDUREYIMU/ABUDUHALILI 千葉大学大学院自然科学研究科 博士後期課程 住所: 〒263-8522 千葉市稲毛区弥生町1-33 千葉大学文学部 土屋研究室 電話: 043-290-2277(研究室) FAX: 043-290-2278 (研究室) E-mail: abudu****@gmail***** harir****@cogsc***** HP : http://cogsci.l.chiba-u.ac.jp/~hariri -- 安田敏博 FZH01****@nifty***** http://www.jognote.com/?id=n%B3%C8%8F%FD_%E1%88 http://mixi.jp/show_friend.pl?id=19931031 http://hpcgi1.nifty.com/dune/gwiki.pl