とある web サーバで †HTML の meta タグで
とか指定しているのを発見. あと,index.html を application/octet-stream で送ってきたり. こんなムチャクチャな状態でも,MSIE では何事もなかったかのように表示できている. すばらし過ぎます. これも一種のプロテクトなんでしょうか. 追記)そのサーバからメイルが飛んでくるんだけど,やっぱし charset=Windows-31J である. しかも本文は Q encoding. が,なぜか Subject の MIME encode の charset だけは Shift-JIS となっている. うーむ. 更に追記)ここを見ると,Windows-31J というのは,どうやら IANA に登録されてる正式な charset らしい. ぐはぁ. で,内容はというと,要するに,日本語 Windows で採用されている文字セット,ということらしい. JIS をシフトした「シフト JIS」 + NEC 拡張漢字 + IBM 拡張漢字,である. で,困ったことに,同じ文字が複数のコードを持っている文字セットだそうである. で,重複している文字は,Unicode へは単一の文字へと変換されるので,往復変換は保証されないそうで. ひとつかしこくなったけど,わかっても全然うれしくない知識だなぁ. |