チーム・マネジメント

有人宇宙の運用管制から、チームマネジメント、人間-機械システム、そしてヒューマンファクターズを考える

何気なく扱っているデータと情報の違いは? 【情報エントロピー】

現代ではデジタル化(Digitize)が普及して、多くのことがデジタル変換され、データとして処理されています。情報通信技術(ICT: Information, Communication, and Technology)の発達を受けて、大量なデータが生成され、蓄積され、低コストで世界中を駆け巡っています。その基本原理であるデジタル化とは、事象をゼロ[0]又はイチ[1]で表現することです。

連続的な物理量であるアナログ(Analog)データと比べて、デジタルデータは情報欠損が生じます。例えば、音をデジタル化するとすれば、サンプリング周期(音楽CDでは44.1 kHz)毎に音を記録し、それ以外の間は記録されません。サンプリングした音も限られたデータ量(音楽CDでは16ビット)へ圧縮されます。

デジタル理論における標本化定理(Samling Theorem)によれば、音が含む周波数成分の2倍の周期でサンプリングすれば、元の情報を再現できます。音楽CDでは22 kHzの高音までの再現となり、人間の可聴周波数帯域が低音20 Hzから高音20 kHzである特性からサンプリングレートが設定されています。ただし、個人個人の能力は異なり、それ以上の高音も聞き取れる人もいますし、音楽は聴力のみで感じとっているのではありません。

ハイレゾ(High Resolution)音源では、サンプリングレートを4倍以上の192 kHz、音を24ビットに変換されます。音を表現できるデータ量は多くなり、自然な音に近付きますが、情報欠損は生じています。画像についても有限な画素数及びその色を限られたビット列に圧縮し、動画は1秒間に30フレームの画像を圧縮したデジタルデータへ変換されます。

すなわち、データとは、取得した物理量や情報をある決まった規則に基づいて、変換して表示しただけです。欠損もありますし、誤差も含まれ、データ取得に失敗したり、真実ではないかもしれません。
我々は、ネットを経由して多種多様なデジタル化されたデータを入手でき、何でも知ることができる気になっています。客観的に実情を省みると、デジタル化に伴って失われていることも多々あり、人間の五感のうち、視覚・聴覚のみでしか知覚することができず、嗅覚・味覚・触覚を通じて何も得られていません。また、マスコミからの情報は様々な意志が働いて変質しており、ネット検索でも様々なフィルターがかかった情報しかアクセスできません。

ネットで行き交っているデータが全世界を表現しているのでしょうか? そんな時代が訪れる前から予測してドラッカーは警鐘を鳴らしていました。
コンピュータの論理やコンピュータ言語で表せない情報や刺激を、やがて軽視するようになることである。現実の知覚的な事象が見えなくなり、過去の事象にのみ関心をもつようになることである。こうして膨大な量のコンピュータ情報が、外の現実からの拒絶を招く。マネジメントの用具たるべきコンピュータが、やがて外の世界との隔絶を認識させ、外の事象により多くの時間を割くことができるよう、人間を解放しなければならない。 ピーター・ドラッカー

データ(Data)と情報(Information)とは、違うものだと認識されていますが、日常では明確に使い分けしていません。ここでは、データを「コンピュータが処理できるように記号化・数値化された資料」、情報を「人間が判断を下したり行動を起こしたりするために必要な資料」と区別してみます。

情報理論を初めて研究したシャノンが「あらゆる情報は数値に置き換えて表すことができる」ということを提唱し、情報の不確実性に対して情報エントロピー(Information Entropy)という概念を導入しました。情報エントロピーとは、情報源を観察したときに得られる期待値を示しており、どの事象が起こるのか予測がつかなければ最も大きくなります。

「明日は雨である」という情報があったとします。この情報は予想であり、当たるかもしれませんし、外れるかもしれません。そのため、情報の信憑性が知りたくなるはずです。このように、情報エントロピーが大きい情報に関して、これから得る情報の価値が高くなります。しかし、明日になれば誰もが実際の天気を知っていますので、情報エントロピーはゼロとなり、情報の価値も低下します。

新聞、書籍やインターネットなどで入手できるような一般に公開されている情報を「ドライ情報」とも呼ばれています。一見して正しそうな情報であっても、一度信憑性を疑って裏を取るべきです。事実ではなく推測や思い込みで書かれた情報が大部分かもしれません。更に、ある目的や意図を持って、誤解させるように情報操作が行われ、他の方向に注意を向かわせて真実を隠している可能性もあります。

重要で価値の高い情報は、公開されずにアクセスが制限されているはずです。ウエットな人間関係を利用して、人伝てによって入手できるため、「ウエット情報」とも区別されます。そんなウエットで真実である情報は全体の情報量の5%くらいでしょうか。

膨大なデータや情報が氾濫している今日においても、判断を下したり行動を起こしたりするために必要な情報は多くなく、逆に探し出し難くなってきています。限られた時間で限りある情報から選択していく能力が益々求められることになります。

f:id:fujihisa:20150221002502j:plain

参考文献