Tadamasa Teranishi
yw3t-****@asahi*****
2006年 5月 2日 (火) 12:41:29 JST
寺西です。 Tomoyuki Asakawa wrote: > > もともと、SJISも初代EUCも、X0208のマッピングの > 違いだけです。 > この場合、X0208の、空きエリアの使い方(いわゆる機種依 > 存文字問題)を、どう考えるかの問題 > しかし、この問題は、空きエリアに対して、積極的な対応(エ > ラーにするなど)をしなければ > 8bit環境では、透過的に扱えるので問題をアプリケーション側にゆだね > ることができます。 空きエリアの字形が違うわけですから、何らかの対策をアプリケーションが 行わなければなりません。 問題をアプリケーション側にゆだねられた結果、 > ところが、主流の実装では、X0208の未定義を積極的にエラーに > するので始末が悪い。 アプリケーションがエラーとして処理しているに過ぎません。 別に始末が悪いことではないでしょう。 何もしないと文字化けする環境も多々ありましたから。 > わたしは、この問題は、昔からPC9801にあわせりゃいいと思って > いました。 それは > 15年くらいUNIX系をつかってますが、クライアントマシンは > Windowsでしたから といった環境だったからそう思うのでしょう。 > PC9801がデファクトスタンダードなのは、否定しようがなかったはず。 はい。 しかし、一方で少数派ではあっても、無視できない Mac の存在も (少なくとも当時は)ありましたし、UNIX の各ベンダーはベンダー固有の 機種依存文字を持っていましたし、PC-9801に合わせるというのは 無理だったわけです。各社の思惑もありますから。 # 今なら事情は違うと思いますが...。 > SJISを、採用していたUNIXマシン、SONYのNEWSは、 > ちゃんと98文字がフォントファイルにあった。 > なので、javaの、エイリアス問題は、問題にする方がおかしいと > 思っていました。 既に忘れてしまっていますが、これを見ると HP は違っていたかもしれま せん。(HP はデフォルトが EUC-JP ではなく、Shift_JIS でした。) http://www.opengroup.or.jp/jvc/cde/sjis.html また、NEWS はそれなりに売れた(私も使っていたけど)と思いますが、当時は Sun が主流でしたので、NEWS がこうだったからというのは、あまり重要では ないと思います。 > また、初代のEUCは、SJISと同じく、スクリーンエディタ > の、処理を楽にする為につくられた様なものです。 ... > ところが、半角カナを導入し、バイト数=文字長 ではなくなった時点 > で、内部コード(処理コード)と外部コードを区別するべき > だったのです。 後学のためにお聞きしたいのですが、では、内部コードはどのようなもの で、外部コードはどのようなもので、どう区別するべきだったのでしょう。 > ここできちんと区別していなかったので、X0212拡張で、 > SJIS同様の、ご都合コードになってしまった。 > X0212拡張は、ISO2022で拡張すればよかった。 これはどういう意味でしょう。 > しかし、euc-jp-msを決めた人たちは、なんで、cp932との > 互換をとらず、 > NEC選定IBM拡張漢字をはずしておいて、msなんてサフィッ > クスをつけたのでしょう? NEC選定IBM拡張文字よりIBM拡張文字が優先的に使われる Microsoft Windows 3.51 式の変換だからでしょう。 http://www.opengroup.or.jp/jvc/cde/appendix.html NEC選定IBM拡張漢字をはずすのは、「マイクロソフトのマニュアルでも、 NEC選定IBM拡張文字は使わないように指導している」らしいですから。 その他、詳細は下記を参考に。 http://www.opengroup.or.jp/jvc/cde/sjis-euc.html#cp6 > X0212とNEC選定IBM拡張漢字と重なるから、X0212を > 優先したというのでしょうが > ここでまたもや、混乱を増幅させている。 様々な背景はここに書かれています。 http://www.opengroup.or.jp/jvc/cde/ucs-conv.html#ch4_1 これは私も混乱を増幅させていると思います。 eucJP-ms, eucJP-0201, eucJP-ascii と3通りのコード変換を規定して、 用途によって使い分けるということになってますから。 > euc-jp-msというエンコーディングで書かれた、ファイルは、この世に > どのくらいあるのでしょう? ファイルとして存在するかどうかは重要でしょうか? euc-jp-ms は、eucJP-open のコード変換規則のひとつに過ぎません。 変換に使われているかどうかが重要なのではないでしょうか? -- ===================================================================== 寺西 忠勝(TADAMASA TERANISHI) yw3t-****@asahi***** http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E