文字コードのお話 - UNLIMITED JAVA

今日は文字コードのお話です

jis
Sjis
Unicode
EUC
UTF-8
UTF-16
ISO
と、IEのエンコード見ただけでもいっぱいあります。

どう違うのでしょう。

まず参考に
http://e-words.jp/w/JISE382B3E383BCE38389.html
詳しいっす

◇JIS・・・工業標準化法に基づいて、すべての工業製品について定められる日本の国家規格。
　JIS規格は1978年版、1983年版、1990年版、1997年版、2000年版と4回改訂されており、文字の追加や様々な変更が行われているが、1983年版で採用されている範囲の文字について1997年に改訂を行った「JIS X 0208:1997」に基づく文字コードがよく用いられている。
　７ビットコードらしいです。

◇S-JIS
　日本語文字コードの一つ。Microsoft社によって策定された。文字の1バイト目を見るだけで漢字か1バイト文字(いわゆる半角英数字)か分かる
http://www.kanzaki.com/netfan/nf97-04.html#note
　JISをシフトした。なるほど、上の理由でインタネでは半角カナを使っちゃいけないんですね。

◇Unicode
世界中の文字を一つのコードにする規格
UCS-2とUCS-4の二つがある。
前者は２バイトで構成されるー・・・・が、カンジが入りきらない。
後者は４バイトで構成され、ものすごい量のデータを格納できる。
Windowsでは前者が使われている

◇UTF
Unicodeへ対するマッピングの種類。
一種の圧縮方法と呼べる（呼べるかなぁ）

いじょ
Unicodeあたりが、めさめさややこしい！！！
UTFもややこしい！！！
ちなみに外字はUnicodeでは6400文字らすぃです。

あーつかれた。