このページの本文へ

前へ 1 2 次へ

Windows Info 第338回

今更ながらコンピュータにおけるエンディアンの話

2022年07月31日 10時00分更新

文● 塩田紳二 編集● ASCII

  • この記事をはてなブックマークに追加
  • 本文印刷

ビット、バイト、INT

 最近のマイクロプロセッサでは、メモリで8bitを1バイトとして扱い、バイト単位にアドレスを割り振って扱う。つまり、メモリの最小の読み書きの単位はバイト(8bit)となる。しかし、8bitでは、最大でも255(2^8-1)までの整数値しか表現できない。このため、複数のバイトで大きな数を表す。2バイト16bitなら65535まで、4バイト32bitなら4294,967,295となる。

 コンピュータで数値を扱うときには、前提として、数値を表現するのに何バイト(あるいは何ビット)を使うのかを決める必要がある。これにより、メモリ上でのサイズが決まるため、あらかじめ保存位置を確保しておくことができる。数値を表現するのに何バイト必要なのかわからないのでは、確保するために面倒な方法を使わねばならない。

 このとき、数値のビット数で最大値・最小値が決まる。大抵は目的に合わせて決めておいてプログラムを作る。たとえば、小中学校のクラスの出席番号ならば1バイトでも十分かもしれない。しかし、クラスの人数が規制されない学校では1クラスの人数が255人を超えるため、2バイトが必要かもしれない。でも、4バイトでは42億を超えるため、ほとんどの学校ではクラスの出席番号に使う必要はないだろう。

 プログラムの中で扱う数値は、このようにして事前に何ビットで表現するのかが決まる。ただし、CPUの多くは、8/16/32/64ビットという4パターンを基本とするものが多い。これは、メモリアドレスか8ビット単位なので、8ビットの組み合わせになるからだ。もちろん、13ビットや29ビットといったサイズで数値を扱うことは不可能ではないが、少なくともメモリに保存されるとき、13ビットは最低でも2バイト、29ビットなら4バイトを使ってしまう。なので、それぞれ16bit、32bitの数値としておくのが簡単だ。また、こうすることで、CPUの機械語命令で加減算が可能になる。

エンディアンを見る

 バイトオーダーは、メモリの中の状態なので、普通は簡単に見ることはできない。プログラムを書いてメモリをバイト単位で見ていけば並びを見ることはできるが、ちょっと敷居が高い。そこで、Windows PowerShellで簡単にバイト順を見てみることにしよう。まずは、Windowsや.NETの標準であるリトルエンディアンだが、BitConverterクラスのGetBytesメソッドを使うことで、数値をバイト並びに変換できる。標準では、これはリトルエンディアンの並びになる。具体的には、

[System.BitConverter]::GetBytes(数値)

とすれば、数値をバイト並びに変換してくれる。たとえば、16進数で0x01020304という数字(32bitの整数値では270544960)のバイト並びは、16進数で“4 3 2 1”となる。先頭のゼロが省略されていることに注意されたい。

写真02#%BIT%# Windows PowerShellを使って32bit数値のバイト順を調べる。基本はリトルエンディアンなので、16進数0x01020304は、4 3 2 1という並びになる

 ビッグエンディアンの数値に変換するには、TCP/IPのIPアドレスを扱うためのIPAddressクラスのHostToNetworkOrderメソッドを使う。これは、ホスト側の数値を受け取って、ビッグエンディアンに並べ直すものだ。具体的には、前記のGetBytesと組み合わせて、

[System.BitConverter]::GetBytes([IPAddress]::HostToNetworkOrder(数値))

とする。16進数0x01020304をビッグエンディアンに変換して、バイト並びにすれば、逆順の“1 2 3 4”となる。

 数値は、32bitの範囲であれば普通の整数でもいいが、先頭に0xを付けて16進数として表現したほうが関係がわかりやすい。なお、HostToNetworkOrderは、64ビット整数(QWord、ロングロングワーグ)まで対応している。

 これからもわかるように、リトルエンディアンとビッグエンディアンでは、バイトの並びが完全に逆になる。

 エンディアンは直接は見えないものだが、コンピュータを使っているとときどき顔を出す。たとえば、Windowsでは文字コードを16bitのUTF-16でエンコードするが、このときの並びはリトルエンディアンとなる。そこでUTF-16では、文字列の先頭に「バイトオーダーマーク」(BOM)が必要になる。バイトオーダーマークは、0xFEFFというコードを持つ。これをビッグエンディアンでメモリやファイルに書き込むと、0xFE 0xFFという並びになり、リトルエンディアンでは、0xFF 0xFEとなる。これにより読み込む側はリトルエンディアンで書き込んだのか、ビッグエンディアンで書き込んだのかを判定できるわけだ。

前へ 1 2 次へ

カテゴリートップへ

この連載の記事

注目ニュース

ASCII倶楽部

プレミアムPC試用レポート

ピックアップ

ASCII.jp RSS2.0 配信中

ASCII.jpメール デジタルMac/iPodマガジン