Foros: 公開討議 (Thread #34265)

日本語からの検索機能を要望 (2013-07-11 00:45 by Kanade #69464)

大久保様

貴重な言語資料をプロジェクトとして公開してくださってありがとうございました。大変便利に使わせていただいております。

ひとつ要望なのですが、日本語からの検索機能が実現できるでしょうか。日英両言語から検索が出来ればこのプロジェクトがもっと強力なものになるに違いないと思います。

Responder al #69464×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Entrar

RE: 日本語からの検索機能を要望 (2013-07-11 21:53 by ohkubo-k #69474)

Kanedeさん、こんにちは。大久保です。
お役に立っているようで何よりです。

もちろん、Tatoebaデータを日本語検索できるするつもりです。
が、今、本業の方で忙しいのと、Tatoebaプロジェクトのデータが膨大でEPWINGデータを作成するのに1回数時間かかる(普通は数分)め、あまり作業が進んでないのが実情です。
申し訳ありませんが、秋頃(10月?)には新データを公開するつもりでおります。
Responder al #69464

Responder al #69474×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Entrar

RE: 日本語からの検索機能を要望 (2013-07-14 00:27 by Kanade #69492)

大久保様

ご返事、ありがとうございます。更新を気長に待っております。


それと、下記のサイトが日本語でキーワードを登録する際に役立つかもしれませんので、リンクを貼らせていただきました。
http://chasen.aist-nara.ac.jp/index.php?%B8%F8%B3%AB%A5%C4%A1%BC%A5%EB
Responder al #69464

Responder al #69492×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Entrar

RE: 日本語からの検索機能を要望 (2013-07-15 09:29 by ohkubo-k #69504)

Kanadeさま

日本語解析のためのお茶シリーズ(?)ソフトは、オライリーの『入門自然言語処理』で名前だけは見たことがあります(が使ったことはありません)。
多分そういうソフトで文節に区切るか、Tatoebaサイトの区切り済みのデータを使うことになるだろうと思っています。

http://tatoeba.org/jpn/sentences/show/2591986
のHTMLページソースを見ると
 <ruby><rb>貴方</rb><rp>(</rp><rt>あなた</rt><rp>)</rp></ruby> が
 フランス語 を <ruby><rb>喋れれ</rb><rp>(</rp><rt>しゃべれれ</rt><rp>)</rp></ruby> ば
 よかっ た のに 。
というように単語(?)に区切れています。でも、これに相当するデータはダウンロードページにはありません。
まあ、日本語例文の各ページを全部個別にダウンロードしてこのデータを取り出す事も出来ます。

もっと簡単には、漢字(+ひらがな)で機械的に分割するとか。
 貴方が・フランス語を・喋れればよかったのに
これだとちょっと区切りが少なすぎるように思います。本家サイトの区切りですと「よかっ・た・のに」で、辞書見出しとしては区切りすぎです。
ここら辺の加減が(機械的に自動分割する際には)難しいかなと思っています。
Responder al #69464

Responder al #69504×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Entrar

RE: 日本語からの検索機能を要望 (2013-07-15 12:29 by ohkubo-k #69506)

上で使った例文は、日本語例文を表示したら、たまたまそれが出ただけです。
他意はございません。

 #フランス語は(その他の現代諸言語も)全く分かりません・・・・・
 つい土曜に、6年通ったアテネ・フランセのラテン語上級クラスの修了証書を頂きました。
 と言っても所詮はただのアマチュアです。
 秋からはフランス語の入門から始めてみようかとは思っております。
Responder al #69464

Responder al #69506×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Entrar

RE: 日本語からの検索機能を要望 (2013-07-17 01:45 by Kanade #69522)

大久保様

ラテン語上級クラスの修了証書獲得、おめでとうございます。

古典言語を勉強されている方が羨ましいです。自分は英語を少しやっているのですが、下手の横好きで、いくら頑張っても進歩していない気がしています(*^。^*大久保様のプロジェクトで少し進歩できたらなぁと思っております。
Responder al #69464

Responder al #69522×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Entrar