UNLIMITED JAVA

WEB技術や普段の生活のブログ

文字コードのお話

今日は文字コードのお話です

jis
Sjis
Unicode
EUC
UTF-8
UTF-16
ISO
と、IEエンコード見ただけでもいっぱいあります。

どう違うのでしょう。

まず参考に
http://e-words.jp/w/JISE382B3E383BCE38389.html
詳しいっす

◇JIS・・・工業標準化法に基づいて、すべての工業製品について定められる日本の国家規格。
 JIS規格は1978年版、1983年版、1990年版、1997年版、2000年版と4回改訂されており、文字の追加や様々な変更が行われているが、1983年版で採用されている範囲の文字について1997年に改訂を行った「JIS X 0208:1997」に基づく文字コードがよく用いられている。
 7ビットコードらしいです。

S-JIS
 日本語文字コードの一つ。Microsoft社によって策定された。文字の1バイト目を見るだけで漢字か1バイト文字(いわゆる半角英数字)か分かる
http://www.kanzaki.com/netfan/nf97-04.html#note
 JISをシフトした。なるほど、上の理由でインタネでは半角カナを使っちゃいけないんですね。

Unicode
世界中の文字を一つのコードにする規格
UCS-2とUCS-4の二つがある。
前者は2バイトで構成されるー・・・・が、カンジが入りきらない。
後者は4バイトで構成され、ものすごい量のデータを格納できる。
Windowsでは前者が使われている

◇UTF
Unicodeへ対するマッピングの種類。
一種の圧縮方法と呼べる(呼べるかなぁ)



いじょ
Unicodeあたりが、めさめさややこしい!!!
UTFもややこしい!!!
ちなみに外字はUnicodeでは6400文字らすぃです。

あーつかれた。