キロバイト、メガバイト、テラバイト…まだまだ上があるバイトの単位

PCやスマホの情報機器は日々進化を続け、データ容量やデータ通信量は右肩上がりになっています。 ひと昔前はギガバイトで十分大容量に感じたのに、今やテラバイトも当たり前の世の中になりました。

それではバイトの単位はどこまであるかご存知でしょうか。 テラバイトぐらいまでは聞いたことがあると思いますが、まだまだ上の単位があるんですよ。

キロ・メガ・テラなどの単位はSI接頭辞

大きな数字を表す際に「キロ」や「メガ」などの接頭辞を付けて表現することがあります。 これは「SI接頭辞」と呼ばれる国際規格です。

データ容量やデータ通信量の単位である「バイト」もSI接頭辞を付けて表現されています。 以下はキロより上のSI接頭辞の一覧です。

SI接頭辞10のn乗
キロ103(千)
メガ106(百万)
ギガ109(十億)
テラ1012(一兆)
ペタ1015(千兆)
エクサ1018(百京)
ゼタ1021(十垓)
ヨタ1024(一𥝱)

このようにキロから上の単位は103刻みで増えていきます。 このSI接頭辞にバイトを付ければバイト単位になります。

最大単位は一𥝱バイトである「ヨタバイト」です。 ただし現時点ではそのような巨大データは存在しないので、ヨタバイトが使われることはありません。

バイト単位の目安

メガバイトやギガバイトは普段生活している中でもよく聞くと思います。 昨今ではサーバー容量やデータ通信量にテラバイトが使われることも多いです。

大規模企業ではペタバイト単位のデータのやり取りもあります。 例えば2020年のyoutubeにおいては、毎日1ペタバイトの動画がアップロードされているそうです。

そして世界の2020年のデータ通信量は「エクサバイト」ぐらいだと予想されています。 今のところ見聞きする単位はエクサバイトが最大でしょうか。

このままテクノロジーが発展してデータが増え続ければ、更に上の単位が出てくるのも遠い未来の話ではなさそうです。 2030年にはゼタバイトやヨタバイトが普通に使われているかもしれません。

情報システムのSI接頭辞は1024刻みの場合がある

情報システムにおけるSI接頭辞は103刻みではない場合があります。 コンピュータは2進数で処理するので2の累乗の方が都合が良いため「210=1024刻み」にしている場合があるのです。

その場合1キロバイトは1,024バイト、1メガバイトは1,048,576バイトとなります。 ただし国際標準に従っている場合もあるため、1000刻みか1024刻みかは場合によりけりです。

2進接頭辞

上記の混同を避けるため、国際電気標準会議ではSI接頭辞の真ん中に「i」を付ける「2進接頭辞」が用意されています。

例えば1000刻みの場合は1KB(キロバイト)、1024刻みの場合はKの後にiを付けて1KiB(キビバイト)と使い分けます。 これなら基準がどちらなのか一目瞭然ですね。

ただし2進接頭辞は全く浸透しておらず、1024刻みでも10進接頭辞が使われ続けています。 情報システムのSI接頭辞は割と曖昧でフワフワしているのです。

1バイトは半角文字1文字

情報システムにおける情報の最少単位を「ビット」と言います。 ビットには「0」か「1」のいずれかが格納されています。

ビットが8つ集まると「バイト」(8bit=1byte)となります。 1バイトには0か1が8つあるので、2進数8桁の256パターンの表現が可能です。

1バイトの代表格は1バイト文字と言われる「半角文字」です。 例えば半角文字「a」はビット表示すると「01100001」となります。

ひらがなや漢字などの「全角文字」は、1文字を2バイトで表現する2バイト文字です。 1バイトの256パターンでは足りないから2バイトで表現している訳ですね。

普段何となく使っているバイトですが、文字数で考えると実感が沸きやすいかもしれません。 1キロバイトの保存領域であれば、半角文字なら約1000文字、全角文字なら約500文字を保存できます。

B!

関連記事

HOME