moonw****@moonw*****
moonw****@moonw*****
2007年 4月 11日 (水) 04:40:35 JST
MoonWolfです。 日本語文字列の表記統一のために<http://mecab.sourceforge.net/dic-detail.html >を参考にしながら辞書を作っています。 辞書をUTF-8にしたのと全角記号→半角のエントリを追加しただけなのですが、 漢字の直後の文字が正常に変換されません。 ひらがな、カタカナの直後などでは正常に変換されます。 char.defをいじれば期待したように動くようになるでしょうか? ■ dic.csvに追加したエントリ (,0,0,0,( ),0,0,0,) [,0,0,0,[ ],0,0,0,] {,0,0,0,{ },0,0,0,} +,0,0,0,+ −,0,0,0,- =,0,0,0,= <,0,0,0,< >,0,0,0,> $,0,0,0,$ %,0,0,0,% #,0,0,0,# &,0,0,0,& ■ テスト 入力:(1)(一)(壱)(いち)漢字1一2二3三4よん5五. 出力:(1)(一)(壱)(イチ)漢字1一2二3三4よン5五. 期待する出力:(1)(一)(壱)(イチ)漢字1一2二3三4ヨン5五.