デジタル

文字コードとは?ASCIIコード、Shift_JIS、UTF-8コードなどわかりやすく解説!

文字コードASCIIコードShift-JISUTF-8UTF-16文字化け

2021/12/23

文字化けになったときに変換するために文字コードで変換をしますよね。この文字コードについてわかりやすく解説いたします。

目次[ 表示 ]

文字コードとは?

文字コードとは大まかにいえば、文字をコンピュータで処理したり通信したりするために、字の種類に背番号のような番号を割り当てたものです。例えば、「あ」は「1」「い」は「2」のような番号を振って、パソコンに文字列データを送受信することができます。

文字コードには、日本で使われるもので主に「符号化文字集合」と「符号化形成」があります。符号化文字集合はUnicodeやJIS X 0208があります。それを基に符号化形成が行われてUTF-8やShift-JISなどの文字コードがつくられます。

代表的な文字コードとは?

ここで先程の符号化形成の代表的な文字コードをご紹介します。

ASCIIコード

最も基礎となっている文字コードです。数字・アルファベット・記号をそれぞれ1バイトで表現しており、これらの文字の他に改行コードやタブ文字、制御コードなどが存在します。

Shift-JIS

先程のASCIIコードの文字に日本語の文字を加えたのが、Shift-JISです。半角カタカナは1バイトで表現して、それ以外の全角文字は2バイトで表現しています。文字コードの領域に外字領域といわれる使ってない文字コードの領域があり、その領域に対してメーカーが独自の文字を設定することができます。

UTF-8

ASCIIコードの文字に世界中の文字を加えたのが、UTF-8です。ASCIIコード以外の文字は、2~6バイトで表現されます。日本語の場合は3バイトで表現されます。ASCIIコードと互換性が良いのでパソコンで扱いやすく世界中の多くのソフトウェアは対応しています。

UTF-16

ASCIIコードを使わず、基本的な世界中の文字の全てを2バイトで表現しています。マイナー文字を4バイトで表現した文字コードです。なので、半角アルファベットや半角数字、全角文字(日本語)のほとんどが2バイトで表現されています。

文字化けの文字コードについて理解をしよう

文字化けが起こる原因の文字コードについてある程度予備知識があれば、パソコン業務などで文字化けしても焦らずに対処できるようになります。難しいかもしれませんが軽くでもいいので理解しておきましょう!

わや

この記事を書いた人

わや

広島出身の「わや」です。 主に、ビジネス・デジタル・お金のジャンルを書いてます。 ガジェットとビジネス本を読むのが大好きです。 スタバ店員とプログラミングの先生の経験あり! 皆様が楽しめる記事をお届けします!

SHARE

この記事をシェアする