このページはWikipedia:井戸端での過去の議論などを保存したものです。
他の過去ログはWikipedia:井戸端/過去ログに保存しています。
ここでの議論を継続するときにはWikipedia:井戸端にてお願いします。
目次
1 文字化け
2 アルファベットの(登録)商標をカタカナ表記にするか
3 小説・映画・漫画等のタイトル
4
//
以前「トウ小平」についての議論の時にも起こりましたが、スペイン語をめぐる議論で、スペイン語表記による「エスパニヨール」も、nに特殊記号がついた部分が文字化けしたようですね。そこで疑問に思ったのですが、
文字化けを防止するよい方法があるか
文字化けを防げないとしたら、化けやすい文字については使用しないべき、とのポリシーを設けるべきなのか、あるいは、「文字化けが起こっても構わないので気にせず書き込んで下さい」とどこかに明記するべきなのか、
といった疑問を持ちました。
ちなみに、このページの履歴から辿ってみたところ、次の2つの投稿の後に文字化けが生じているようで、何か使用環境に関連しているのかとも思います。いずれもGombeさんの投稿に際して起こっています。
僕はこういうことには(も)疎いのですが、こういうことが原因でGombeさんのような活発な方の貢献が減ってしまうというのはプロジェクトにとっても損失だと思うのでみなさんのお知恵を拝借したいところです。 --Tomos 05:11 2003年2月25日 (UTC)「いずれもGombeさんの投稿に際して起こっている」のであれば、Gombeさんの使用環境(OSやブラウザ等)を書いて頂かないことにはどうにもなりませんが…調べたところ、トウ小平のトウは機種依存文字なので、Windows以外の人には見えません。(UNICODEを使えば違いますが…)なので、トウはUNICODEでない限り、他のOSの方のためにも使わないほうが懸命と思います。恐らくGombeさんが、Windows以外のOSを使っている為に、書き込んだ時点で?となってしまったものと思われますが、いかがでしょう。私よりコンピュータに詳しい方も多いと思うので、思い違いだったら、突っ込みを入れてください。G 07:28 2003年2月25日 (UTC)(G 07:41 2003年2月25日 (UTC)修正加筆)
どうもお手数をおかけします。この発言がちゃんと読まれるかは心配ですが……(^^;
実はTomosさんご指摘のいずれの書き込みにおいても、私の環境では正常に読めております。私の環境は以下の通りです。
Windows2000SP3 / Windows98SE (マシンによる)
NetscapeNavigator4.78
基本的にShiftJISでテキストボックスに書き込み・コピー&ペーストなど
もう一つ思い当たるのは、いずれの場合もどうも編集競合があったように思います。うろ覚えで恐縮ですが。
編集競合の時に限り落としてしまうバイトがあって、そのためブラウザが文字コード認識をしくじるとか、そういうことがあるのかも知れません。
以前別の記事でも文字化けの話がありましたし、この話は早く解決したいですね。
- Gombe 07:48 2003年2月25日 (UTC)問題になっているのはチルダ付のnですが、表示されている「n」をそのままコピー&ペーストするのではなく、入力時には「ñ」と書いてみてはいかがでしょうか。下に例を示しておきますので、編集してみてどうなるかテストしてみてください。──Tunabay 08:15 2003年2月25日 (UTC)
直接入力→「?」
「ñ」→「n」
今回の場合は、私の問題かも知れません。
私の環境:
RedHat Linux 8.0
Mozilla 1.0.1
でテキストボックスへ直接書きこみ。今回の場合は、表紙のものをコピー&ペーストしました。
もう一度コピペしてテスト「Espa?ol」 - Cozy 08:23 2003年2月25日 (UTC)
現時点では、正しく表示されますね。
こっちは?「ñ」→「n」 - Cozy 08:32 2003年2月25日 (UTC)
申し訳ありません、一つ勘違いしていました。
特定のコードの文字が化けると言うことであれば、確かに私の環境では起こっています。(ページ全体のコードが「ひっくり返って」しまう現象のことかと思っていました。勘違いです)で、Tunabayさんの提示してくださった例を見てわかったことですが、ブラウジング時にはちゃんと「n+記号」な字として読めているのですが、Edit画面のテキストボックスに入っている文字で既に「*直接入力→「?」」となってしまっていました。(もうひとつは「「ñ」→「n」」)
Edit画面をサーバからクライアントに渡すときに、何らかの理由で(ShiftJISに一度落ちるからか?)、ñ(の半角)が表示していた文字を認識不能と置き換えてしまうのでしょうね。おそらくは、MS-IEだとテキストボックスの中もUNICODEのまま編集できるのではないですか?
UNICODE入力のできない全てのブラウザに共通な問題かもしれません。
- Gombe 08:38 2003年2月25日 (UTC)原因がわかりましたね。テキストボックス内で「?」に置き換えられたあと、それを送信することになるので、実際Gombeさんの書き込みで上記の例も「?」に変換されたようです。私の個人的な感覚では、まだまだテキストボックス内でUnicodeが使える環境の方が特殊だと考えておりますので、文字化けしないような工夫が必要です。
ただ、「n」はいいのですが、「ケ」は「鄧」と記述しなければなりません。文字コードの変換が面倒ですが、どのようにするか検討する必要がありそうです。
直接入力→「ケ」
「鄧」→「ケ」
今度は同じマシンからMS-IE5.5でアクセスしておりま。予想通り、テキストボックスの中でも文字化けしておりません。当分はMS-IEでのアクセスに限定しないとダメですね。
古いNetscapeはCSS解釈やらについてもいろいろ問題を抱えています(ウィキペディアのレイアウトもろくな表示になっていません)し、記事上でも、ブラウジング時にコピー&ペーストした内容をテキストボックスに落とすと(文字コードが一致しないので)文字化けする、と言った不具合もあったりしましたし、確かにあまり適切な動作はしないブラウザです。でも個人的にはわかりやすくて?好きなんですけどねえ。(^^;
- Gombe 09:42 2003年2月25日 (UTC)
Mozillaもしくは、Netscape7はどうでしょう?あまり人にダウンロードを奨めたくは無いですが… - Cozy 14:40 2003年2月25日 (UTC)以上の話を踏まえて、文字化けを防ぐには以下のようなルールが望ましいのではないでしょうか?
直接入力によるShift-JISにはない機種依存文字やUNICODE文字(ケ等)の使用の禁止する。
コード番号(鄧)での入力は問題ない。
UNICODEが使えないブラウザでは特にコピー&ペーストに注意する必要がある。
コード番号で書いてれば、Edit画面でも鄧となるようなので、その場合には文字化けは防げると思われる。あくまでも私案なのでご意見下さい。G 16:25 2003年2月25日 (UTC)もしシステム側で対応できるのなら、
問題のある文字が投稿されたときにコード番号(鄧)に置き換えてしまう。
これだと利用できる環境でもコードで編集しないといけません。
UserAgent等で対応しているか判別、あるいはPreferenceで設定して、特定の人の場合だけ配信時にコード番号に置き換える。
変更が大掛かりになるかも。
そもそも問題のある文字を機械的に判別できるのか?