Re: こんばんは！ (morogram-users) - morogram

師です。

どのようなパソコンの環境なのか等、基本的なことをお教えいただけな
いと、充分な回答をすることはできません。以下の回答では、一般論を
述べます。

On Sat, 9 Apr 2005 00:49:16 +0900
"ジョウレントモカ" <55-jo****@ares*****> san wrote:

> 漢詩の統計的、数量的に分析したいのですが、使用できるデータは
> テキストデータのみ、と考えてよろしいでしょうか？

morogram が扱えるのはテキストデータのみです。基本的に、単一のテ
キストファイルに対する文字単位のNグラムによる頻度分析しかできま
せん。複数テキストの比較や各種統計的な分析については、他のソフト
ウェアを組み合わせることになります。

> また結果を分析するよい方法はないでしょうか？

いろいろありますが、目的によって変化すると思います。

> また、作者の違う作品を比べて作者ごとに比較したい、ということなのですが
> 作者の名前も頻度に数えられるのを（）でくくってそこを頻度に加えない、とか
> ＜＞で囲われた文字をひとつの文字として認識する、とか
> ある文字に限定して頻度を数える
> 等出来ましたらご指導いただけますでしょうか？

morogram ではできませんので、他の方法でやることになります。上記
の（）や＜＞を使った方法は、それを実現するためのフィルタを書けば
可能でしょう（＜＞の方は適当に &M......; に割り当てるとか）。

『漢字文献情報処理研究』2号（http://www.jaet.gr.jp/jj/2.html）所
収の拙稿では、XMLを用いた同様の方法について考察していますので、
参考になるかもしれません。

Shigeki Moro

Hanazono University
s-mor****@hanaz*****
http://moromoro.jp

morogram

[morogram-users] Re: こんばんは！