[morogram-users] Fw: N-gramツール(morogram-0.7.1.exe)に関しての要望

Back to archive index

dune FZH01****@nifty*****
2009年 5月 11日 (月) 19:30:18 JST


極悪こと安田です。

アブドハリリさんからメールをいただいて、morogram のスタンドアロン版
を修正しています。これまでの経緯(メール)を転送します。



Abudo Hariri <abudu****@gmail*****>さんのメッセージを転送します。

安田敏博 さま

突然のメールで大変失礼致します。千葉大学大学院自然科学研究科のアブドハリリと申します。
中国の新疆ウイグル自治区から来日した者です。今ウイグル語の形態論を中心にして研究を行っています。
最近は、安田敏博様が作ったN-gramツール(morogram-0.7.1.exe)を使っています。いろいろな使いやすい環境を提供したことを心から
感謝します。ありがとうございました。
現代ウイグル語を表記している文字がアラビア文字であり、文節単位で
分かち書きされています。ウイグル語は強い膠着性の特徴を持って言語であるので、この分かち書き単位をかなり複雑であり、形態素解析により語幹
を認定する必要があります。そのため、最近日本語形態素解析器MeCab にウイグル語の辞書を追加して、ウイグル語解析ツールを公開しました。
今回は、安田敏博のN-gramツール(morogram-0.7.1.exe)ツールもウイグル語言語学者に紹介したいと思っています。
ここで少しお願いがありますが、考えて頂ければ大変を有難いのです。
一つは、解析するファイル選択する時の「開くと保存」のところを英語に変更して頂きたいのです(本当はウイグル文字にしたいのですが)。
二つ目は、解析するファイルを半角スペースによって分解して、分解した単位のN-gramを取ることが可能でしょうか。
すなわち、今の --W オプションでの、単位を更に分解したいと思ったのです。目的は、語幹と語尾の関係を明らかにすることです。
これを一つのオプションにして頂ければ大変有難いのです。
どうかよろしくお願い致します。

アブドハリリ


-- 
----------------------------------------------------------------------------------------------------------
アブドレイム・アブドハリリ
ABUDUREYIMU/ABUDUHALILI

千葉大学大学院自然科学研究科 博士後期課程
住所: 〒263-8522 千葉市稲毛区弥生町1-33
千葉大学文学部 土屋研究室
電話: 043-290-2277(研究室)  FAX:  043-290-2278 (研究室)

E-mail: abudu****@gmail*****
           harir****@cogsc*****
HP  :    http://cogsci.l.chiba-u.ac.jp/~hariri
-- 
安田敏博 FZH01****@nifty*****
http://www.jognote.com/?id=n%B3%C8%8F%FD_%E1%88
http://mixi.jp/show_friend.pl?id=19931031
http://hpcgi1.nifty.com/dune/gwiki.pl




morogram-users メーリングリストの案内
Back to archive index