2011年9月27日火曜日

Shift_JIS、UTF-8、EUC-JPなど(文字コード)の話

「カチッ、カチッ・・・」とマウスでクリックすると出てくるWebサイトですが、
実はこれらにはCSSやHTMLの他に「文字コード」というものが存在しています。
まぁ、CSSやHTMLの話は後日にして、今回はこの文字コードについて少しお話します。

・UTF-8:多言語向けの文字コード。

・EUC-JP:UNIX上で日本語の文字を扱う場合にもっとも多く利用されている文字コード。

・SHIFT_JIS: 日本のパソコン(主にWindows)に対応した文字コード。

・・・どれがいいのか、って話は・・・それぞれの環境や目的があるのでここでは割愛しますが、
 2011年9月現在、下記のような有名どころではこのようになっています。

<UTF-8>
Google、Facebook、MSN、Yahoo!Japan、Twitter

<Shift_JIS>
Amazon.co.jp

<EUC-JP>
mixi、楽天市場

とはいうものの、結局、ブラウザでうまく文字エンコードで調整できちゃうから、あんまり深く考えたことがない方も少なくないかもしれません。


しかし、日本の場合、以前はShift_JISを採用しているサイトが多かったようですが、
最近は、徐々にUTF-8を使ったWebサイトも徐々に増えているみたいです。
理由はわかりませんが、どうやら将来的には文字コードが世界共通になるって話もあるようです。

ただし、UTF-8を記述する際は、少なくともWindows標準のメモ帳は使わないこと。
理由は、BOMといって、 ようは通常のHTMLでは問題はなくても、PHPやJAVAでエラーを起こすヘッダが勝手に加えられてしまうそうで・・・
なので、TeraPadなどのテキストエディタを使うのが一番ベターのようです。

なお、当ブログはUTF-8です。
まぁ、googleのブログ「Blogger」だから、当然といえば当然かも・・・。
このブログにおける注意事項

当ブログは、個人が開設・運営をしているブログです。内容については個人的な解釈の範囲内で書いておりますので、あらかじめご了承ください。
また、ブログ内では固有名称等が出てくることがありますが、いずれも個人的な見解です。公式プレスリリースではありませんので、関係各所に問合せなさらぬよう、くれぐれもご注意ください!