文字コードのお話
今日は文字コードのお話です
jis
Sjis
Unicode
EUC
UTF-8
UTF-16
ISO
と、IEのエンコード見ただけでもいっぱいあります。
どう違うのでしょう。
まず参考に
http://e-words.jp/w/JISE382B3E383BCE38389.html
詳しいっす
◇JIS・・・工業標準化法に基づいて、すべての工業製品について定められる日本の国家規格。
JIS規格は1978年版、1983年版、1990年版、1997年版、2000年版と4回改訂されており、文字の追加や様々な変更が行われているが、1983年版で採用されている範囲の文字について1997年に改訂を行った「JIS X 0208:1997」に基づく文字コードがよく用いられている。
7ビットコードらしいです。
◇S-JIS
日本語文字コードの一つ。Microsoft社によって策定された。文字の1バイト目を見るだけで漢字か1バイト文字(いわゆる半角英数字)か分かる
http://www.kanzaki.com/netfan/nf97-04.html#note
JISをシフトした。なるほど、上の理由でインタネでは半角カナを使っちゃいけないんですね。
◇Unicode
世界中の文字を一つのコードにする規格
UCS-2とUCS-4の二つがある。
前者は2バイトで構成されるー・・・・が、カンジが入りきらない。
後者は4バイトで構成され、ものすごい量のデータを格納できる。
Windowsでは前者が使われている
◇UTF
Unicodeへ対するマッピングの種類。
一種の圧縮方法と呼べる(呼べるかなぁ)
いじょ
Unicodeあたりが、めさめさややこしい!!!
UTFもややこしい!!!
ちなみに外字はUnicodeでは6400文字らすぃです。
あーつかれた。