情報の量とは Part1

技術開発部のがーすーと申します。
初投稿ですがよろしくお願いします。

 

では、いきなりですが抽象的な話を少ししたいと思います。
抽象的な話は良いものです。話すのに人生経験や社会経験は必要ありません。
実際は大して中身が無いことでも、それを意味ありげに勿体ぶって言えば、
半分くらいの人は騙せます。まことに良いものです。
2つの量について話しましょう。
情報の量意味の量です。

 

まずは情報量について話します。
情報量は日常でもよく耳にする言葉ですね。
「このサイトは情報量が多いからお薦めやで」とか「このブログの記事は情報量が皆無やな」とか
よく言いますよね。
こういった文脈での「情報量」とは、どれだけ役にたつ情報があるかという意味で使われています。
それでは、そういった情報が役にたつかどうか、つまり”情報の有用さ”とは、どういった尺度から量れるのでしょうか。

 

情報理論においては、情報の有用さは、その事柄の”起こりにくさ”で量られます。
起こりにくい事柄ほど、情報量があるということです。
例えば、「コインを投げて裏表のどちらが出たか」という情報と、
「サイコロを転がしてどの数字が出たか」という情報では、
後者のサイコロの目についての情報のほうが情報量が多いとされています。

 

2分の1の確率で出るコインの裏表と、6分の1の確率で出るサイコロの目とでは、
サイコロの目のほうが、ある1つの目が出る確率が低く、それだけ起こりにくいからです。
例えばギャンブルをしているとして、コインの裏表よりも、サイコロの目の何が出たかがわかる情報のほうが
役に立ちそうだというのは、何となくわかりますよね。

 

こうした情報量という概念は、ITにも深く関わっています。
コンピュータでは、0と1の数字の羅列を内部的に処理することによって、あらゆる表現をしています。
その羅列が長くなればなるほど、コンピュータによる表現は色々な形態を取ることができるようになります。

 

例えば、0と1を8個羅列するだけの1byteでは、半角の数字を1文字だけしか入力できません。
ですが、2000byteほど使えば、このブログの記事くらいの量は書けます。
僕はその2000byteをこんな記事を書くことに消費しましたが、
同じ2000byteを使って、他の色々な記事を書くこともできたわけです。
それらの2000byteを使って書かれた色々な記事は、先ほどの”起こりにくさ”という点から言えば、
どれも2000byte分の”起こりにくさ”を備えているということです。

 

つまり、駄文も名文も、同じ2000byteを使って書かれていれば、
コンピュータにとっては”起こりにくさ”という点で同じだけの価値しかなく、
情報量も同じだと言うことです。随分と融通が利かない奴なんですね。
これは、人間の一般的な感覚とは明らかにズレています。

 

そのズレについて、次回の記事以降で意味の量についても触れながら話したいと思います。