Shigeki Moro
s-mor****@hanaz*****
2005年 4月 14日 (木) 14:17:29 JST
師です。 どのようなパソコンの環境なのか等、基本的なことをお教えいただけな いと、充分な回答をすることはできません。以下の回答では、一般論を 述べます。 On Sat, 9 Apr 2005 00:49:16 +0900 "ジョウレントモカ" <55-jo****@ares*****> san wrote: > 漢詩の統計的、数量的に分析したいのですが、使用できるデータは > テキストデータのみ、と考えてよろしいでしょうか? morogram が扱えるのはテキストデータのみです。基本的に、単一のテ キストファイルに対する文字単位のNグラムによる頻度分析しかできま せん。複数テキストの比較や各種統計的な分析については、他のソフト ウェアを組み合わせることになります。 > また結果を分析するよい方法はないでしょうか? いろいろありますが、目的によって変化すると思います。 > また、作者の違う作品を比べて作者ごとに比較したい、ということなのですが > 作者の名前も頻度に数えられるのを()でくくってそこを頻度に加えない、とか > <>で囲われた文字をひとつの文字として認識する、とか > ある文字に限定して頻度を数える > 等出来ましたらご指導いただけますでしょうか? morogram ではできませんので、他の方法でやることになります。上記 の()や<>を使った方法は、それを実現するためのフィルタを書けば 可能でしょう(<>の方は適当に &M......; に割り当てるとか)。 『漢字文献情報処理研究』2号(http://www.jaet.gr.jp/jj/2.html)所 収の拙稿では、XMLを用いた同様の方法について考察していますので、 参考になるかもしれません。 Shigeki Moro Hanazono University s-mor****@hanaz***** http://moromoro.jp