ミクロとマクロの世界Excel遊 び(その2);飛行機事故;2004年訂正;2006年微修正)

by 立命館大学理工学部物理科学科 小笠原宏

                           ふりがな
学生証番号 2120160□□□-     氏名

目的:地震・火山噴火・台風・事故・幸運など、ランダムに発生している現象は、ポアソン過程とも呼ばれており、短期間に集中発生する傾向があります。「不幸が重なる」とかあるいは逆に「つきが落ちる」のは、物事がでたらめに発生しているからです。理論によると、ある事象から次の事象までの発生時間間隔が t である事例数は、eの(-t)乗に比例することが知られています。
 例えば、下図は、武者利光先生著、ゆらぎの世界(ブルーバックス)から引用させて頂いた図で、昭和28年から52年までの25年間に発生した145件の 飛行機事故の発生間隔です。横軸は発生時間間隔です。計数する期間幅などを変えたとき、どの程度結果が変わるかが、エラーバーで示されています。図から、例えば、ある事故が発生してから10日以内に次の事故が発生した事例が33ケース、20日以内で発生した事例は33+30=63ケースもあることがわかります。点線は、eの(-t)乗に比例する直線のうち、データに最もフィットするものを示します。比較的よく一致していますから、これから、飛行機事故は基本的にはランダムに発生しているとわかります。しかし、80日以上の間隔で事故が発生した事例数は直線よりもかなり多いことが一目でわかります。何か、原因がありそうです。


 さて、パソコンによってランダムな数列を作るのは非常に容易です。そこで、以下の説明に従って、まず、最初に、25年間に145件の事象が全くランダムに発生した場合、発生時間間隔が t である事例数が本当にeの(-t)乗に比例するかどうかを確認しよう。そして、飛行機事故と、シミュレートした完全ランダム事象とがどう違うかを観察してみよう(設問3)。そして、その違いを説明するための仮説を自分で考え、その仮説に基づいて計算機シミュレーションをして、飛行機事故が持つ謎を明らかにしてみよう(設問4)。
 これは、モンテカルロ・シミュレーションという名前がついている計算機数値実験です。大層な名前ですが、要は、カジノの有名なモンテカルロでサイコロ賭博をしたのを文字ったものです。サイコロは1〜6の整数しか出せませんが、計算機ならば0から25までの任意の実数を出すことができます。0から25までの乱数を計算機で発生させ、それを145件の飛行機事故時期を考え、解析をしてみよう。

 なお、Excelの基本を体得できていない人は、以下の説明がチンプカンプンのはずです。そういう人は、まず、前回配布したExcel手引きを参照して、Excelの基本操作を体得して下さい。

Step 例えば、Microsoft Excelでは、あるセルに=rand()と入力すれば、01の間の乱数(実数)を計算して表示してくれる。それを、下に9個コピーすれば、0から1の範囲の乱数を合計10個得ることができます。例えば、これは、全く独立に1年間に10件発生した飛行機事故の時期をシミュレートしたことに相当します。では、ランダムに25年間に145件発生した飛行機事故の発生時期(単位は日)をシミュレートするためには、セルA2にどういう式を入力して、いくつコピーすればいいでしょうか? このとき一年は365日としましょう。

 設問1 答セルA2に入力すべき式=       コピーすべき数=

 

Step 上の方法で作ったデータは、発生時期順に並んでいないので、後処理をするためには、発生時期順に並べ替えねばならなりません。そこで、列Aのデータを全部選択してコピーし、列Bに「値だけ貼りつけ」「並べかえ」よう。ただし,このとき,選択した範囲のみを並べ替えることに注意すべし。この結果、例えば、セルB2の値は、25年間で一番最初に起こった飛行機事故の発生時期(単位は日)になります。次の図の例では,114.5日目に最初の事故が発生したことになります。

Step 例えば、下図の例において、セルB3からセルB2を引き算すれば、一番最初の事故から次の事故までの発生時間間隔が得られます。そこで、セルC3に「=B3-B2」と入力しよう。これを下のセルにズルズルとコピーをすれば、全 145件の飛行機事故の発生間隔の144個のデータが出来上がります(次の図参照)。

 

Step 事故発生間隔が、10日以内、1020日、、、、のケースの数を数え、 グラフにしてみよう。いちいち数えてグラフに書くのは面倒ですから、、Excelの便利なツールを使ってみよう。このような数え方をしたい場合、上に示した様に、準備としてセルE2に10日、すなわち,「=10」を入力します。そして、E3以下には10ずつ増えるように、E3に「=E2+10」と入力して、下に連続コピー。とりあえず200日までということで、E21まで連続コピーをしよう。あとは、ツール→分析ツール (註1、上図参照)→ヒストグラム(註2、下図参照)とします。

註1:分析ツールがない時はp.4の「分析ツールが見えないときの対策」を参照
註2:ヒストグラム:テストの点数別人数が棒グラフで表示されることがあります。例えば、90点以上10人、80から89点5人、、、0から10点5人というように。得点区間ごとの人数を調べることを、ヒ ストグラムをとるといいます。エクセルでは、各人の得点データの所在(例えばA1からA30)を指定してやれば、あとは、自動的に区間を分割してヒストグラムを作ってくれる。もし、集計する得点区間の刻みを自分で指定したいときには、区間データの所在(上の試験成績の例だと、10,20,30、、、90,100 という値を、例えばB1からB10に予め入力し、エクセルのヒストグラム機能を呼び出し、「データ区間」のところにB1:B10と入力すればよい)

 飛行機事故解析の場合、下図の「入力範囲(黄色表示)」の欄に、事故発生間隔のデータのセル範囲(C3:C146)を入力します。ま た、カウントする発生時間間隔を刻みは、E2:E21に入力済みだから、「データ区間(黄色表示)」の欄に 「E2:E16」を指定すればよい。OKボタンを押せば、エクセルが自動的に数えて、次のページの図の左側のような結果を出してくれます。この例では、0〜10日間隔で事故が発生した事例が18ケースあったという結果になっています。

 では、このシミュレーションを複数回行い、その結果と、実際の飛行機事故のデータをきちんと比較してみよう。
 まず、下図の右側に示すように、別のシートのA2A15に実際のデータの事故間隔、B2B15に実際の事例数を、下図の値を見ながら手で入力しましょう。まず、A2には=10/365A3には=A2+10/365と入力し、A15までドラッグしましょう。そして、0〜10日間隔で事故が発生した実際の事例数は33でしたから、B2には33を手で入力します。以下、3016、、32と手で入力して下さい。
 次に、第1回目のシミュレーションの結果得られた事例数を、C16以下にコピーします。A16以下には、データ区間をコピーして下さい。このとき、B16以下にもC2C15にも何も入力しないのがコツです。

 計算機は、何かやるたびに違う乱数を発生させるので、以上の仕事を終えてSheet1に戻ると、列Aには新しい乱数が生成されています。ですから、「値だけ列Bにコピー」→「並べ変え」をすれば、第2回のシミュレーションは完了。再び、「ツール」→「分析ツール」→「ヒストグラム」とやり、「OK」を押しましょう。さきほどと入力範囲とデータ区間は同じですから、そこを変更する必要はありません。新たなSheetに出力された結果を列Dに貼りつけたら第2回のデータ処理終了。これを繰り返せば、結果がどのくらいバラつくかを見ることができます。授業では、シミュレーションをあと3回、合計5回分のデータを作ればOKとします。
 そして、全データ(A1〜G70あたりの範囲のデータ)で「散布図」を書こう。縦軸を対数スケールにすることを忘れずに。すると、下図右側のような図ができると思います。下図は、かなり凝ったデコレーションが施してありますが、皆さんの画面にはもっとシンプ ルなものが表示されるはずです。

設問2 グラフをプリントアウトし、名前と学生証番号を記入(手書き可)し、提出しなさい。なお、グラフの裏面に、設問1と設問3の答えを書きなさい(手書き可)。

設問3 5回の数値実験と実際のデータはどういう点が違うだろうか? 少なくとも2点指摘しよう。

    違いその1(発生間隔20日以内)=
 
    違いその2(発生間隔150日以上)=
 
設問4 設問3で見出した、飛行機事故の実際のデータと、完全にランダムな場合のシミュレーションとの違いを説明するためには、どういう要因を考慮に入れなければならないだろうか? 各自、仮説をたて、その仮説を考慮にいれてシミュレーションを行い、頻度と事故間隔の散布図を作って実際のデータと比較し、そのアイデアが正しいか否かを検証しなさい。武者先生の「ゆらぎの世界」で議論されていることや、その他の可能性を色々試してみて下さい。

 そして、立てた仮説・データ生成法・手順の具体的な説明・結果の評価をまとめ、図とともに、別途レポートとして提出しなさい。
 なお、データ生成法・手順の説明が具体的でない場合はレポートを受理しません。データ生成法・手順は「セル○○〜○○までには25*365*rand()+△△ を入力し。。。。」というように具体的に記述して下さい。 また、仮説が正確に方法・手順によって実現できていて、結果の評価が妥当であれば、たとえ仮説が実際のデータをうまく説明できなかった場合であっても、 よい評価を与えます。

「分析ツールが見えないとき」: 下図に示すように、ツール→アドインとし、下から2番目にある分析ツールをチェックし、OK。

 

 以上