Tweet

とある web サーバで

HTML の meta タグで

charset=Windows-31J

とか指定しているのを発見.

あと,index.html を application/octet-stream で送ってきたり.

こんなムチャクチャな状態でも,MSIE では何事もなかったかのように表示できている. すばらし過ぎます.

これも一種のプロテクトなんでしょうか.

追記)そのサーバからメイルが飛んでくるんだけど,やっぱし charset=Windows-31J である. しかも本文は Q encoding. が,なぜか Subject の MIME encode の charset だけは Shift-JIS となっている.

うーむ.

更に追記)ここを見ると,Windows-31J というのは,どうやら IANA に登録されてる正式な charset らしい.

ぐはぁ.

で,内容はというと,要するに,日本語 Windows で採用されている文字セット,ということらしい. JIS をシフトした「シフト JIS」 + NEC 拡張漢字 + IBM 拡張漢字,である.

で,困ったことに,同じ文字が複数のコードを持っている文字セットだそうである. で,重複している文字は,Unicode へは単一の文字へと変換されるので,往復変換は保証されないそうで.

ひとつかしこくなったけど,わかっても全然うれしくない知識だなぁ.


トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2004-07-02 (金) 17:17:58 (4950d)