デジタル

文字コードとは?ASCIIコード、Shift_JIS、UTF-8コードなどわかりやすく解説!

文字コードASCIIコードShift-JISUTF-8UTF-16文字化け

2023/08/08

文字化けになったときに変換するために文字コードで変換をしますよね。この文字コードについてわかりやすく解説いたします。

目次[ 表示 ]

文字コードとは?

文字コードとは大まかにいえば、文字をコンピュータで処理したり通信したりするために、字の種類に背番号のような番号を割り当てたものです。例えば、「あ」は「1」「い」は「2」のような番号を振って、パソコンに文字列データを送受信することができます。

文字コードには、日本で使われるもので主に「符号化文字集合」と「符号化形成」があります。符号化文字集合はUnicodeやJIS X 0208があります。それを基に符号化形成が行われてUTF-8やShift-JISなどの文字コードがつくられます。

こちらでは、環境(機種)依存文字をご紹介しています。

意味から文字一覧まで紹介しているので本編と合わせてご覧ください!

環境(機種)依存文字とは?一覧も合わせてご紹介!

代表的な文字コードとは?

ここで先程の符号化形成の代表的な文字コードをご紹介します。

ASCIIコード

最も基礎となっている文字コードです。数字・アルファベット・記号をそれぞれ1バイトで表現しており、これらの文字の他に改行コードやタブ文字、制御コードなどが存在します。

Shift-JIS

先程のASCIIコードの文字に日本語の文字を加えたのが、Shift-JISです。半角カタカナは1バイトで表現して、それ以外の全角文字は2バイトで表現しています。文字コードの領域に外字領域といわれる使ってない文字コードの領域があり、その領域に対してメーカーが独自の文字を設定することができます。

UTF-8

ASCIIコードの文字に世界中の文字を加えたのが、UTF-8です。ASCIIコード以外の文字は、2~6バイトで表現されます。日本語の場合は3バイトで表現されます。ASCIIコードと互換性が良いのでパソコンで扱いやすく世界中の多くのソフトウェアは対応しています。

UTF-16

ASCIIコードを使わず、基本的な世界中の文字の全てを2バイトで表現しています。マイナー文字を4バイトで表現した文字コードです。なので、半角アルファベットや半角数字、全角文字(日本語)のほとんどが2バイトで表現されています。

こちらでは、スマホの文字化けの原因と文字化けを変換してくれるサイト・ツールを紹介しています。

文字化けを直すときにはどうすれば良いのか記事を参考に試してみてください!

スマホの文字化けの原因は?解決方法も合わせてご紹介!

文字化けを変換してくれるサイト・ツール12選!原因やメーラー別修復方法

文字化けの文字コードについて理解をしよう

文字化けが起こる原因の文字コードについてある程度予備知識があれば、パソコン業務などで文字化けしても焦らずに対処できるようになります。難しいかもしれませんが軽くでもいいので理解しておきましょう!

この記事を書いた人

わや

広島出身の「わや」です。 主に、ビジネス・デジタル・お金のジャンルを書いてます。 ガジェットとビジネス本を読むのが大好きです。 スタバ店員とプログラミングの先生の経験あり! 皆様が楽しめる記事をお届けします!

SHARE

この記事をシェアする