[mecab-users 259] 汎用テキスト変換の不具合

Back to archive index

moonw****@moonw***** moonw****@moonw*****
2007年 4月 11日 (水) 04:40:35 JST


MoonWolfです。

日本語文字列の表記統一のために<http://mecab.sourceforge.net/dic-detail.html
>を参考にしながら辞書を作っています。
辞書をUTF-8にしたのと全角記号→半角のエントリを追加しただけなのですが、
漢字の直後の文字が正常に変換されません。
ひらがな、カタカナの直後などでは正常に変換されます。
char.defをいじれば期待したように動くようになるでしょうか?

■ dic.csvに追加したエントリ
(,0,0,0,(
),0,0,0,)
[,0,0,0,[
],0,0,0,]
{,0,0,0,{
},0,0,0,}
+,0,0,0,+
−,0,0,0,-
=,0,0,0,=
<,0,0,0,<
>,0,0,0,>
$,0,0,0,$
%,0,0,0,%
#,0,0,0,#
&,0,0,0,&

■ テスト
入力:(1)(一)(壱)(いち)漢字1一2二3三4よん5五.
出力:(1)(一)(壱)(イチ)漢字1一2二3三4よン5五.
期待する出力:(1)(一)(壱)(イチ)漢字1一2二3三4ヨン5五.




mecab-users メーリングリストの案内
Back to archive index