屈辱の数学史  Matt Parker  2022.12.1.

 2022.12.1.  屈辱の数学史 A Comedy of Maths Errors

Humble Pi      2019

 

著者 Matt Parker オーストラリア出身の元数学教師。イギリスのゴダルマイニングという歴史ある(古過ぎるのではと思うこともある)街に暮らす。他の著書に『四次元で作れるもの、できること(Things to Make and Do in the Fourth Dimension)』がある。数学とスタンダップ・コメディを愛し、両者を同時にこなすことも多い。テレビやラジオに出演して数学について話す他、ユーチューバーとしても活躍。オリジナル動画の再生回数は数千万回以上、ライブのコメディー・ショーを行えば、毎回、満員御礼という人気者だ

 

訳者 夏目大 大阪府生まれ。翻訳家。大学卒業後、SEとして勤務したのちに翻訳家になる。主な訳書に『627分発の電車に乗って、僕は本を読む』、ジャン=ポール・ティティエローラン(共にハーパーコリンズ・ジャパン)、『エルヴィス・コステロ自伝』エルヴィス・コステロ(亜紀書房)、『タコの心身問題』ピーター・ゴドフリー=スミス(みすず書房)、『「男らしさ」はつらいよ』ロバート・ウェッブ(双葉社)、『南極探検とペンギン』ロイド・スペンサー・デイヴィス(青土社)、『Think CIVILITY』クリスティーン・ ポラス(東洋経済新報社)など訳書多数。

 

発行日           2022.4.5. 初版第1刷発行

発行所           山と渓谷社

 

私たち現代人の生活は数字に依存している。コンピュータのプログラム、金融、工学、全ての基礎は数学だ。普段、数学は舞台裏で静かに仕事をしていて表に出ることはない、表に出るのは、まともに仕事をしなくなった時だ。本書では、実際にそうなった事例を多数取り上げ、背景事情を詳しく説明していく。大事故寸前で切り抜けられた例もあれば、大惨事になってしまった例もある。インターネット、ビッグデータ、選挙、道路標識、宝くじ、オリンピック、古代ローマの暦・・・・事例は多岐にわたる。ページをめくれば、数学のミスがいかに恐ろしく、世の中で数学がいかに重要な地位を占めているかがお分かりいただけるだろう

人間は総じて数学が苦手だ。でも、数学を味方にできれば、今よりきっと幸せになれる。謎解きを楽しむように本書を読めば、ミスを防ぎ危険を回避できるようになるだけでなく、数学に親しみを感じるようにもなるだろう。著者自身の失敗談やジョークも多く盛り込まれた本書は、「屈辱」をとことん楽しめる一冊だ

 

 

内容
【第0章 はじめに】

ペプシコが「ププシ・ポイント」キャンペーンを行い、テレビCMで、700万ポイント集めれば20百万ドルもする戦闘機に乗って学校に行けるとやったところ、本気で集め始めた人がいて、15ポイント以上は不足分を1ポイント10セントで補うことができるとしたこともあって、70万ドルの小切手を同封して戦闘機を申し込む。ペプシコは、CMをジョークだとして応じなかったため裁判となり、裁判所がこのジョークのどこが面白いのかを四苦八苦して説明し訴えを却下したが、このレナード対ペプシコ事件は今でも法学史の一部

人間は総じて、大きな数を把握するのが苦手

生活の中で数が直線的なものであることや、数と数の間隔がどれも同じだと学ぶが、それはそう教わったからに過ぎない。1から9の中間は5だが、教育を受ける前なら「対数的中間」を取ることが一般的で、3が「中間」になる

100万と10億と、10億と1兆では同じ1000倍なので同じように感じるが、実際の差異は桁違い

人間の脳は生まれつき数字が得意ではない、にも拘らず、現代社会は数学に大きく依存している。直感だけに頼らずに学習を続けてきたからこそ、とてつもないことができるのだが、直感ではわからないことだからこそ、誤りが起きやすいのも確か。間違えても気づかないことが多く、ちょっとした間違いが恐ろしい結果を招く場合もある

本書でもミスを3つそのまま残しておいた

 

【第1章        時間を見失う】

l  43億ミリ秒では十分とは言えない

2004年、ロサンゼルス航空路交通管制センターとすべての航空機との無線連絡が突然途絶え、上空を飛行中の800機余りの航空機が大混乱を来し、あわや衝突しかねない状況に陥るが、幸い事故は回避――管制センターのコンピュータの時間管理のエラーで、その航空管制システムは、「4,294,967,295から1ミリ秒ごとにカウントダウン」する方式で時間を管理、その間にコンピュータを再起動してカウントが0にならないような仕組みだったが、誰も連続で何秒稼働し得るかについて考えていなかったため、50日連続稼働となってダウンした。この数字は二進数で表す(バイナリ・コード)32個の1の連続になる

どのシステムも32ビットなので、扱える最大は32桁の二進数だが、現在では64ビットになっているので、遥かに大きな数字が使える ⇒ 再起動しなければならない期間は50日弱から5.8億年に延びる

l  カレンダー

1908年のロンドン・オリンピックの射撃に出場予定のロシア選手が会場に来たのは試合当日の710日だったが、同年の記録にはロシアの名前は一切記載されていない――ロシアの暦で710日というのはロンドンでは同月23日だった

宇宙が私たちに与えてくれる時間の単位は、「年」と「日」だけで、他のすべての単位は、人間が生活の便宜のために作ったもの――地球の公転の1周に要する時間が「年」で、自転の1周に要する時間が1日なので、両者の間に関連性はない

地球は秒速約30㎞で太陽の周りを回っている

季節は正確に地球が太陽に対して同じ位置に来た時に同じ季節を刻むので、365/年のカレンダーとは年と共にずれてくるので調整が必要

現在世界で主に使われているカレンダーは、古代ローマのローマ暦を起源とする。当初355/年だったものを、BC46年にカエサルが予測可能な暦を導入し時間の統一を図るため365/年に改め、さらに閏年を追加(ユリウス暦)――BC46年は445/年まで長くなり、2月と3月の間に閏月を入れるほか、11月と12月の間にも2カ月の閏月を挿入して調整

l  暴挙に出たローマ教皇

地球は公転しながら、地軸の向きを徐々に変化させ、約1.3万年かけて反対の向きに傾いた状態に変わる(軸歳差)ため、季節が入れ替わる

地球の公転周期(=恒星年)は、3656時間910

軸歳差を考慮した四季が1周するという意味での太陽年は、3655時間4845

カトリック教会は、春分の日を基準に決まるイースターと、カレンダー上の決まった日であるクリスマスとが徐々に離れていくのを止めるために、1582年ローマ教皇グレゴリウス13世が新たな暦(グレゴリオ暦)の使用を義務付ける――400年で3日閏日を減らした

カトリックの都合で変更されたために、キリスト教以外の国は導入せず、イギリスでも正式な導入は1752年のことで、一度に11日削減した

ロシアがグレゴリオ暦に切り替えたのは1918年で、2月はいきなり14日から始まった

グレゴリオ暦でも、若干の誤差は避けられず、3213年で丸1日のずれが生じる

ユリウス暦は今も天文学の世界に生きている――「光年」でいう1年はユリウス暦の1(365.25)とされる。最新の天文学の研究が、古代ローマ時代の単位で行われている

l  時が行き詰まる日

2038119日午前314分に、今使われているマイクロプロセッサとそれを搭載したコンピュータは機能を停止する――コンピュータは起動されてからの経過時間を記録すると同時に、常に現在の時刻にも同期しなくてはならず、そのために安定して時間を管理するための仕組みが開発され、197011日午前0時から1秒刻みで時間を管理(UNIX時間)することとしたため、1桁を符号のために利用する32ビットのシステムでは最大2,147,483,647秒まで表現できるが、2038年が限界。64ビットに切り替えればほぼ無限の長さになるが、現時点で使用中の大半の機器は32ビットで稼働

l  時をかける戦闘機

遠い未来の日付が正確に分かるのはグレゴリオ暦のカレンダーが規則正しいお陰で、400年の周期で同じパターンが繰り返されるが、カレンダーは14種類あれば足りる(?)

ストップウォッチをスタートさせた後に現在時刻を前に進めると、ストップウォッチが表示する経過時間が急激に増えるし、時刻を戻せば急減する。経過時間を32ビットで表現できる限界以上に増やすとシステムはクラッシュする

2005年に運用を開始したF-22「ラプター」戦闘機は最新鋭ですべてコンピュータ制御だったが、'07年のある日、日付変更線を越えた時には、全てのシステムがダウン。飛行の続行は可能だったが、手動の操縦も出来ず、近くを通りかかった空中給油機の後について基地に帰還。48時間以内に解消したが、日付が急に変わることに対処できなかった

 

【第2章        工学的なミス】

2014年完成のロンドン市内のビルは、3年後に13億ポンドの高値で売却されたビルだが、建築中に火災を起こす危険性があると判明――ラファエル・ヴィニオリ設計の建物は、外壁が凹面鏡、太陽光を集めると殺人光線に変わる。幸い車の塗料が溶けたくらいの被害で済んだが、同じ設計者は2010年にラスヴェガスでもヴィダーラ・ホテルで同じ壁を設計し、プールの宿泊客の肌を焼いた。「パラボラ」にすれば光は1点に集められる

凹面鏡の外壁に庇をつけることで問題を解決

l  物騒な数に架ける橋

ちょっとした設計ミスが悲惨な結果を招くのはよくあることで、橋の設計は代表例で、不確実な要素が非常に多い

最近の有名な失敗例は、2000年のロンドンのミレニアム・ブリッジで、開通2日後に想定外の大きな横揺れのために閉鎖――橋をぶら下げる鋼鉄製のケーブルを目立たないようにするため、わずか2.3mの高さから吊るしたため、ケーブルは人が渡るすぐ横にあって常時約2000tの張力がかかった状態で、強く張りつめていればいるほど、振動は速くなる

この揺れのため、橋は「ウォブリー・ブリッジ(ゆらゆら橋)」のニックネームがついた

l  共振が鳴り響くとき

「共振resonate」――ここには小さな揺れでも共振するととんでもない力が働く

39階建てのビルの12階で20人が同じ曲に合わせてエアロビクスをしただけで、最上階が通常の10倍の揺れを起こした

l  揺れるのは飛行機だけじゃない

橋の横揺れも、大勢の歩行者たちの起こす横方向の揺れが橋の揺れと同期したことによって大きくなる。橋の揺れのリズムに合わせて歩く方が歩きやすいので自然にお互い同期し合い、「フィードバックループ」によって、人々が橋の揺れに合わせて歩くことで橋はさらに大きく揺れる。2000年の映像では歩行者の20%以上が同じ歩調で歩いていた

揺れを止めるためには高額の費用をかけた改修が必要――18百万ポンドの工費に5百万の追加費用が掛かったという

l  浮き沈みにもご注意を

人が歩く時、縦方向にかかる力の方が横揺れの10倍もあるので、縦揺れの存在は昔から認識されていた――石や木の橋の共振周波数が人間の歩行で起きる振動の周波数と一致することはまずありえないが、産業革命以降1819世紀にはトラス橋、カンチレバー橋、吊り橋など新しい構造の橋が作られ、共振周波数が人間の起こす振動周波数と一致するような吊り橋も作られるようになった

1826年マンチェスター郊外のブロートン吊り橋は、兵隊が4列縦隊で歩調を合わせて歩いたところ揺れ始め、60人が乗ったところで崩落、5m下の川に落ちただけで死者はなかったのは幸い

l  曲線美の落とし穴

鉄道網の発達で、鉄橋が必要となったが、鉄橋の設計は人や自動車の通る橋より難しい

人の脚や自動車にはサスペンションがあって、多少の揺れは吸収できるが、鉄道の線路は動いてはならないので、鉄橋も動かないよう硬く頑丈に作らなければならない

1846年マンチェスターのディー川にロバート・スティーブンソンが設計した鉄橋は、完成の翌年に線路の振動を抑えるために砂利が追加され、火の粉で枕木がやられないよう敷石が被せられたが、わずかな重みの増加に耐えられなくなって、改修からちょうど1年後に崩落――縦揺れと横揺れに加えて、それまでで最長だったために捻じれるような揺れが加わったためで、死亡事故につながった。捻じりの動きは「ねじり不安定性」と呼ばれる

応用が先で、基礎となる理論は遅れてできることがよくある

報告書では、橋の長さと縦横の比率から見た細長さに原因がある可能性も否定できないとしながら、根本原因の特定はできないまま、鋳鉄の桁の弱さだけの指摘に留まり、以後錬鉄製の桁が用いられるよう改良された

1930年代設計のワシントン州タコマナローズ橋は、アールデコ調の美しさが特徴で、使用する鋼鉄の量を大幅に減らすことから半分のコストで造成。1940年開通したが4カ月で崩落。海峡の風による振動が共振を起こしたとされたが、実際には橋の側面に貼られた金属板が風を全て受け止めたために起こしたフィードバックループによって捻じれが徐々に拡大して上下動が加速された結果の崩落だったことが判明

ボストンのジョン・ハンコック・センターは1976年完成の62階建てのビルだが、ビル風によって想定外の捻じれが発生し最上階は船酔いするほどだった――油の中に300tの重さの鉛を入れた同調ダンパーを58階の両端に取り付けることによって捻じれは解消

l  その足元、安全ですか?

人間は失敗するたびに最良の対策を考える。失敗から学ぶことが進歩に繋がる。失敗への対策は、理論の進歩も促す

計算と人間の直感にはずれがある。人間の脳は、計算よりも直感で物事を判断する方が得意だが、今の工学技術なら、どこまで頑丈にすれば十分安全か、ギリギリの境界線を計算で求めることができる

1980年、カンザスシティのハイアット・リージェンシー・ホテルには空中に浮いているように見える通路が作られた。上から吊るされた何本かの細い金属棒に支えられて、通路はロビーの上の2階の高さに浮かんでいるように見えたが、ほんの些細な設計変更が大惨事を招いた――空中通路には上下2つの段があり、上の段は4階に、下の段は2階に繋がっていた。上から吊り下げられた長く細い金属棒に2つの段をナットとワッシャーを使って取り付けるが、同じ棒に取り付けると相当長い距離巻き上げないといけないので、棒を半分に切って、下の段は上の段の床面の梁から吊るした棒に固定させたところ、重みに耐えかねて崩落。1本の棒に固定させれば、上段と下段を止めたナットはそれぞれの段の重みだけを支えればよかったが、2本に分けたために上段のナットは、下段の重みも支えなければならなくなったため、本来なら強度を計算し直さなければならなかった

 

【第3章        小さすぎるデータ】

1990年代半ば、サン・マイクロシステムズでは、スティーブ・ナルという社員のデータが何度入力しても跡形もないい。「ナルNull」は、データベースでは「データがない」を意味

3文字以上ない名前は入力が不完全と見做され受け付けないようなプログラムもある

テストさん、ブランクさん、サンプルさん、フェイクさんなども同様で、名前を文字データとして扱うことによって解決できるが、自動的に排除するシステムもあるので要注意

+」を含むメールアドレスも、スパムメールのために大量に自動生成されるアドレスに「+」が含まれることが多いため、無効と判断される

l  善良なデータが悪と化すとき

不良データはデータベースにとって禍の元、手書きをデータ化すると不良データが生まれやすく、それを回避するために、変換に失敗したデータは全てデフォルトとして処理する

Excelは、データ処理に便利な標準ツールだが、データベース・システムではないことに要注意――データを管理することには多くの問題がある

電話番号のように頭に0がつく数字は、0の表記が消えてしまう

桁数の多い数字には、科学的記数法(1.4E+9)が用いられ、ある桁から下は0と見做す

l  Excelが遺伝子操作?

SEP15遺伝子」「MARCH5遺伝子」などという名前の遺伝子をExcelに入力すると自動的に日付に変換されたり、「22/12」という入力は数値とも日付とも単なる文字列とも解釈できる――データの「解釈」の問題なので、データベースには、そのデータがどういう種類なのかを特定する「メタデータ」(データについてのデータ)が保持されていることが必要

Excelに入力したデータが自動変換されるのは、日常的な使い方に限られる

l  スプレッドシートの限界

Excelシートで保持できるデータ量が少なすぎる――行数が21665536までしか表示されない ⇒ 現在では2201048576行まで拡大したが、限界があることには変わりない

l  エンロン事件

誤りが混入しやすいという欠陥もある――現存するExcelスプレッドシートの90%に何らかの問題が含まれており、数式を使用しているスプレッドシートのうち24%に計算上の誤りが混入していると推定

エンロン事件で摘発されたメールに添付されたExcelスプレッドシート15,770枚を分析したところ、容量の平均は113.4kb1枚当たりのワークシートの平均は5.1枚、1枚のスプレッドシートには平均6191の記入されたセルがあり、うち1286が数式のセル。6650枚のスプレッドシートには数式が使われていなかった(Excelを使う必要がなかった?)。残る9120枚のうち、2205枚に何らかのエラーメッセージが含まれていた

エラーメッセージが出るのはほんの一部で、式や入力データが間違ってもそのまま放置され、さらにはあるセルのデータが他のセルに連動している場合は入力ミスが拡散

「バージョン管理」(どのスプレッドシートが最新なのかを確認)が原因で問題が発生する場合も多い

 

【第4章        幾何学的な問題】 

イギリスのサッカー競技場を知らせる標識は実物と若干異なるデザイン――実物は表面に黒の五角形12個と白の六角形20個あるが、標識は黒と白の六角形ばかり。六角形だけではボールを作ることは数学的に不可能(円柱やドーナツであれば可能)なだけでなく、数学や幾何学を重要視しない発想が社会にあること自体問題

l  三角測量

1980年、テキサコがルイジアナのバイヌール湖で行った試掘では、三角測量によって岩塩坑を回避して行われるはずが、1地点の位置を計測しそこなったせいで、岩塩坑に近接し過ぎて浸水、60年前から掘られていた岩塩坑の体積は上の湖よりも大きくなっていて、固定の土壌が侵食されただけでなく、メキシコ湾に繋がる運河が逆流し、巨大な滝となって岩塩坑に流れ込んだため、淡水湖が塩水湖に一変、生態系も変わる

単なる測量ミスではなく、幾何学を正しく理解していないことによるミス

l  月の幾何学

月はほぼ球体のはずだが、地球から見ると「円」ではなく「円板」に見える

月が欠けている時も円板は存在しているので、月の影の部分を通して星が見えることはないから、Sesame Streetに、三日月の欠けた部分に星が描かれているのは致命的な間違いだし、Lone Star Stateと呼ばれるテキサス州の自動車のナンバープレートの右上にも三日月が描かれ、その欠けた部分に星がかかっている

l  死のドア

屋内のドアは「内開き」が多く、外に出るドアは「外開き」が多い

イギリスでは1883年のニューカッスルの劇場での死亡事故、アメリカでは1903年シカゴのイロコイ劇場の602人の死者を出した火災事故を機に、公共建築には外開きのドア設置を義務付けるようになったが、1942年にはボストンのココナッツ・グローブで492人の死者を出す火災事故で、うち300人は未改修の内開きのドアが原因だとされた

NASAによる宇宙船では、外開きが採用されたが、2番目の有人宇宙船マーキュリー・レッドストーン4号が着水した際勝手に開いて海水が流れ込んだ事故のため、アポロ1号では内開きに変更したところ、実験中に機内で発生した火災のためキャビン内部の気圧が上昇し、ハッチを開くことが不可能になり乗員は窒息死、以後外開きに変更

この惨事のせいで打ち上げは中止されたが、死亡した宇宙飛行士に敬意を表して、あとから「アポロ1号」と名付ける。1号の前に2度無人飛行が実施され、後からアポロ計画の一部に編入され、アポロ計画で最初に実際に宇宙船が打ち上げられたのは4号で、2,3号は欠番

l  Oリングのせいだけじゃない

1986年チャレンジャー号の打ち上げ失敗の原因調査では、固体燃料補助ロケットに生じた漏洩が原因とされたが、装着された2つの補助ロケットのうち1つは高度40㎞で使用済みとなり切り離されて落下、大西洋上で回収されて再利用する。空洞の円柱で、4つのセクションに分解して歪みを直したうえで組み立て直されるが、各セクション間には「Oリング」というゴム製ガスケットが取り付けられる。これが打ち上げの際破損したもの。委員のノーベル賞物理学者ファインマンはゴムの弾性が低温下で失われることを実験で証明して見せたが、もう1つ問題があり、それは円筒の断面が真円であるかどうかを確認する方法で、3カ所で直径を計測して確認していたが、「定縮図形」と呼ばれる図では直径が何カ所で測って同じでも円ではない図形を作ることができ、その場合どこかに突起があればそれを相殺する平らな部分が反対側に必ず出来る

ロケットの断面が円でないという単純な幾何学の問題の存在さえ現場から管理者にうまく伝えられていなかったことが明らかにされた

l  歯車の噛み合わせ

3つの歯車を噛み合わせると、歯車は動きようがない――2つの歯車は必ず反対に回る

1998年、イギリスでは新たな千年紀の始まりを前に、2ポンド硬貨のデザインを一新、コンペで採用されたのは複数の同心円の組合わせで、11つの円がそれぞれ違う時代のテクノロジーを表している。産業革命の時代のテクノロジーは、19個の歯車からなる輪で表現されているが、奇数の歯車では動かない。当初のデザインでは22個あったが、硬貨に縮小する段階で細部が失われたようだ

 

【第5章        数を数える】

数を数えるのは数学の初歩の初歩だが、一様ではない

1つずれエラーOff by One Error」は、プログラムの世界で「0」から数え始めることから起きるもので、普通の「1」から数えるやり方と1つづつずれている

「フェンス・ポスト問題」 ⇒ 植木算は、音楽理論でも現れる。「3度上げてから5度上げる」とは、合計で7(ママ)上げること

年齢、建物の階数などでも、1から数えることが多いが、0から数えることもある

l  組み合わせを数える

1974年、レゴ社は標準の「2x4ブロック」を6つ使うだけで、組み合わせは102,981,500通りにもなると言っていた――6段のタワーを作るとして、1段目のブロックの上に1つのブロックを重ねる方法は46通りなので、465205,962,976通りのタワーが作れるが、32個だけが唯一無二の形で、残りは他に向きが違うだけで実質同じのが1個あるので、半分となる結果、合計で102,984,504が正解でレゴ社のミス。昔の計算機は桁数に限界があったため下1桁の「4」が丸められた

横にも並べるとした場合の組み合わせは、915,103,765通り

組み合わせ論を専門とする数学者のことをコンビネートリストという

2002年、イギリスでマックが「マックチョイス」というメニューの広告キャンペーンを展開した際、8種類の商品からなるメニューのチョイスが40,312通りあると宣伝――商品1つごとにいる・いらないで答える質問を8回するので、組み合わせは28256通り、何も注文しないのは除かれるから255通りとの指摘に対し、マック側は8つの商品を選ぶ順序まで考慮に入れたと回答、であれば8x7x6x5x4x3x2x1=40,320

さらにマック側は、8つの商品のうち2つを選ぶとの社内ルールを決めていたという。であれば247通り。過大表示だと訴えると、裁判所は「チョイスが多いことを意図したものなので、数字が不正確なのは必ずしも問題ならない」と裁定

現実的なチョイスの数として算出されるのは以下の辺りだろう

ドリンクの数: 8種類とドリンクなしの選択で計9種類

メインの数: 3種類のうち2つも選べるとし、メインなしも含めると10種類

フライドポテト: いるかいらないかの2種類

デザートの選択肢: 8種類と選択しないのとで9種類

以上あわせて、9x10x2x9=1,620。何も注文しないケースを除くと1,619通り

l  その組み合わせ、十分ですか?

組み合わせの数が少ないと、時に深刻な問題を引き起こす

アメリカの郵便番号は5桁で、10万通りあり、総面積9,158,022㎢をカバーするとZIPコード1つあたりの面積は100㎢以下(現在はさらに4桁が加えられ、郵便物に印刷されるバーコードには6桁を加えた11桁になっているので、全ての建物に異なるZIPを割り振ることが可能)

オーストラリアでは4桁しかないが、1つの番号当たりの面積は平均で769㎢、2500人しかいない

イギリスでは区分けが細かいので、ビル1棟だけの固有番号になっている――17億通りの番号を作ることが出来る――7桁で、最初は文字か空白(27通り)2桁目が文字(26通り)3桁目は数字(10通り)4桁目は空白か文字か数字(37通り)5桁目が数字(10通り)6,7桁目は文字(26通り)で、全て掛け合わせると1,755,842,400通り

電話番号も、携帯の普及で膨大な数が必要になった

 

【第6章        計算できない】

「ロールオーバーエラー」とは、コンピュータの記憶容量に限界があるためにその限界を超えてしまったときに発生するエラーのこと。8ビッドの整数型変数が使われているところに256個目の入力があると、0に戻ってしまう

l  死のコード

放射線療法機の問題は、X戦を生成するのに使用する電子戦が非常に強いことで、一旦金属板にあててから患者に照射するが、セットアップコードというプログラムでシステムのあらゆる設定が正しいと認識された場合のみ、電子線の照射を開始させることになっている。そこで使われるプログラムの変数は安全が確認されると0になるよう設定されているが、セットアップコードがループするごとに変数が1だけ増え、安全が確認されるまで何度もループし、ループが256回に達すると0に戻るため、安全が確認されていないにもかかわらず0になることが起こってしまう。そのため0.4%の確率でセットアップコードのエラーが発生してしまい、死亡事故につながった――プログラムにどういう値を保持させるかに無頓着だと、事故のもとになる

l  コンピュータが苦手なこと

コンピュータは桁数が無限の値を保持できない

2進数の限界によって生じる誤差を修正できるようプログラムされている――10進数で1/3を表すと桁数が無限に続くように、2進数で0.10.4を表すと無限に桁数が増えるために一定の所で切り捨て(切り上げ)てしまう

日常生活では問題にならない誤差だが、コンピュータでありながら、計算が完全には出来ないという事態が起こり得る

l  わずかなズレの危険性

1991年、湾岸戦争の最中スカッド・ミサイルがサウジの米軍基地に向けて発射され、米軍はパトリオット・ミサイルで迎撃しようとしたが、時間管理システムで生じたわずかな誤差が原因で迎撃に失敗、大きな被害を被った――保持されていた経過時間を秒数に変換する際、浮動小数点数のデータとして保持されるようになっており、経過時間に0.1をかければいいだけだが、ミサイル・システムでは1/10秒が24ビットの二進数として記憶されているために、最後の桁で切り捨てが起こり、その誤差が時速6000㎞で飛ぶミサイルを追尾しようとすると、1/3秒間で500mもの誤差になり追尾に失敗

l  0で割らないで

0で割ると答えは無限大というのは半分正しい。負の数字で割る場合は0に近づくほど答えは正反対の方向にある負の無限大に近づく。進む方向によって極限値が違う場合、数学では極限値は「不明確」となる。0で割る割り算が出来ないのは、極限値が存在しないため

コンピュータの回路は加算や減算が得意なので、演算は加算、減算が基本。乗算は加算の繰り返し、除算は余りが生じる分複雑

コンピュータに0で割る除算をさせると、処理が停止するか永久に続くかどちらかなので、「0の割り算をすることになったらすぐエラーとして処理する」と指示するコードを付けて置けば解決できるが、古いシステムでは永久に演算をしようとしたためにその計算に割り当てられているメモリが尽き、オーバーフローエラーが発生して、すべての機能が失われる結果を招く

 

【第7章        確率のご用心】 

サッカーの試合のコイントスでコインが芝の上の立つ可能性は低いが、無いことはない

イギリスの昔の分厚い1ポンド硬貨で試したら、1万回に14回立った

子どものころディズニーワールドで撮った写真の背景に写り込んでいた人と大人になって結婚する確率は極めて低いが、起きる可能性がないとは言えない

何かが1度起きたからと言って、同じことがもう1度起きる可能性が高いとは言えない

自分で賞金額を設定してゲームにチャレンジする番組を制作する際、あらかじめ勝つ確率が判明していれば番組として面白くないはずだが、たまたまスタッフの知り合いが何度か続けて大きな目標を達成したことから、確率を無視して番組をスタートさせたために、その後は誰も勝てずに、白けてしまって打ち切りになった例がある

l  重大な統計学的誤り

数学では、互いに独立した2つの出来事が起こる確率は、それぞれの確率を掛け合わせたものとされるが、独立しているかどうかは厳密に判断しなければならない

1999年、イギリスの女性が自身の2人の子どもを相次いで乳幼児突然死症候群SIDSで亡くした陪審裁判で終身刑を言い渡されたが、後に無罪となる

イギリスでは毎年SIDS300人死亡するが、検察は死亡確率を8543人の1人として、73百万分の1という、この種の事象が起こり得ないという誤った印象を与えるデータとして提示されたが、王立統計学会は、「統計学的に根拠となり得ず、法廷での統計学の濫用が疑われる」とし、後に医学総会議は鑑定人を職業上の違法行為で有罪と見做した

2人の乳児の突然死が互いに独立しているかどうかは、様々な要素を徹底的に検証しなければわからない――アメリカ人の中で身長が6’3’’以上の人は1%未満だが、NBAの選手では75%もいる。身長が高いこととNBAの選手であることとの間には強い相関関係があるので、NBA選手で6’3’’以上の確率は522/327百万x1/1001/63百万にはならない

l  コインの表裏

人間は確率について考えるとき間違いを起こしやすく、多くの人が騙される

   3回のコイン投げで出る裏表のパターンに賭け、どちらが先に出るかを競うゲーム

表裏の3つの組み合わせは8通りあるが、コインを投げた時にどのパターンが出るかは、前2回の投げた結果に必ず影響を受ける。3つの組み合わせのうち後ろ2つを相手の賭けたパターンの前2つと同じ裏表になるようなパターンに賭ければ、高い確率で勝てるし、いつまでも続ければいずれは勝てる。「ペニー・アンティ」と呼ばれる不正なゲーム

(本書では、前2つを相手と同じにすると記載)

ペニーのゲーム-有利・不利のあるコイン投げゲームもある

保険研究部 主席研究員・ヘルスケアリサーチセンター兼任   篠原 拓也

確率や統計の話題には、ギャンブルと関係するものが多い。サイコロ、トランプ、ルーレットなどで、さまざまな研究や分析が行われている。その中でも、単純なコイン投げにまつわるものは、数多くある。今回は、研究者の間で知られている「ペニーのゲーム」を紹介しよう。このゲームは、いまからちょうど半世紀前の1969 年に、ウォルター・ペニー氏が数学関連の雑誌上で発表したことにちなんで、このような名前で呼ばれている。

まず、偏りのないコインを1枚用意する。このコインを繰り返し投げて、出た面が表か裏かを書き記すことにする。表は英語のHeadを表す「H」、裏はTailを表す「T」の文字で記す。たとえば、

H T H H T H T T T H T H H T T T H T H T……

といった感じで、コインの出た面に応じて、文字列ができあがっていく。

ペニーのゲームは、AさんとBさんの2人が対戦する形式で行われる。2人は、HTを使ってできる3文字のパターンの中から1つを選ぶ。そして、コイン投げを繰り返すことでできあがっていく文字列の中に、選んだ3文字のパターンが、先に現れたほうの人が勝ちとなる。

3文字のパターンとして考えられるのは、つぎの8通りだ。

(H H H)(H H T)(H T H)(H T T)(T H H)(T H T)(T T H)(T T T)

まず、Aさんが、この8つの中から1つパターンを選ぶ。次に、Bさんが、Aさんが選んだ以外の、残りの7つの中から1つパターンを選ぶ。AさんとBさんの選んだパターンのうち、どちらが先に現れるかで勝負が決まる。

ここで、このゲームの勝負の行方について、すこし考えてみよう。もともとコインには偏りがないから、表も、裏も、出る確率は1/2ずつだ。そのため、AさんもBさんも、8つのパターンのうちどれを選んでも、有利になったり不利になったりすることはないような気がする。「どのパターンも出る可能性は同じだろうから、難しく考えずに、適当に選ぼう」という感じで、パターンのうちの1つを選んでしまいそうだ。

ところが、具体的な事例を考えてみると、このゲームには、パターンの選択しだいで、大きな有利・不利が潜んでいることがわかる。たとえば、Aさんが (H H H) のパターンを選んだときに、Bさんが(T H H) を選んだとしよう。この場合、ゲームを開始して、最初の3回のコイン投げで、立て続けにHが出たときには、もちろんAさんの勝ちだ。だが、それ以外のときは、すべてBさんが勝つことになる。なぜか?

ゲームを開始して最初の3回のコイン投げのなかで1度でもTが出ると、その後、どこかで (H H H)のパターンが現れるためには、まずH2つ続けて出なくてはならない。ところが、その2つのHの前にはTが出ているため、2つめのHが出た時点で、(T H H) のパターンが先に現れることになるからだ。

つまり、Aさんが (H H H) を選んだときには、Bさんは (T H H) を選ぶことにより、勝つ確率を格段に高めることができる。この場合、Aさんの勝つ確率が1/23乗で1/8なのに対して、Bさんの勝つ確率は1から1/8を引いて7/8となる。Bさんが勝つ確率は、Aさんが勝つ確率よりも、7倍も高くなるのだ。

実は、このゲームは、パターンを先に選ぶAさんよりも、Aさんの選択を見た上でパターンを選ぶBさんの方が、必ず有利になる。後手のBさんが選択を間違えなければ、「後手必勝」とまでは言えないが、後手がかなり有利になるゲームなのである。

Aさんの選んだパターンに対して、Bさんが勝つために選ぶべきパターンは、つぎのようになる。

Aさんの選択に対して、Bさんは、うまくパターンを選べば、勝つ確率を少なくとも2倍、最大で7倍にまで引き上げることができる。有利・不利がないどころか、後手のBさんがかなり有利になる偏ったゲームといえる。ただ、あなたがBさんの立場だったとしても、この表を頭に入れておくことは、けっこう大変かもしれない。そんなときのために、後手のBさんが選ぶべきパターンの覚え方がある。Bさんは、Aさんが選んだパターンをもとに、つぎのようにパターンを選べばよい。

もちろん、このとおりにパターンを選んだからといって、Bさんが必ず勝つわけではない。あくまで、Bさんの勝つ確率が高まるだけである。しかし、もしこのゲームを、1回だけでなく何回も繰り返して行うとすると、Bさんが勝つ回数は、Aさんが勝つ回数よりも多くなっていくだろう。

このように、コイン投げのような偶然性に支配される事象がベースにあったとしても、ゲームの組み立て方によっては、プレーヤー間の有利・不利が、はっきりとつけられてしまう場合がある。

「推移関係」とは、a,b,cについて、abに関係Rが成り立ち、bcにもRが成り立つとき、acにもRが成り立つような関係で、3つの実数の大きさなどがその例。

「非推移関係」とは、その関係が成り立たないもので、グー・チョキ・パーの関係などが例

   グライム・ダイス――比推移的なサイコロで、5(赤、青、緑、黄、マゼンタ)

2人でサイコロを振って大きい目が出た方が勝ちというゲーム

平均すると、赤は青に勝つことが多く、青は緑に、緑は黄に、黄はマゼンタに、マゼンタは赤に勝つことが多い。英語だとRed, Blue, Green, Yellow, Magentaのように1文字ずつ増える。必ず相手に先に選んで振ってもらい、その色より1文字少ない色を選ぶ

サイコロの数を倍にして同じ色のサイコロを2つ振る場合は、色の強弱関係が逆転する

l  宝くじ必勝法

異なる番号のくじをたくさん買うこと以外に必勝法はない

賞金の還元率=期待値で宝くじを買うのではなく、夢を見る権利を買うので、当選確率が下がり、当選金額が上がるほど、見る夢は大きくなって、その分宝くじの価値は上がる

l  通説の噓

ネット上には宝くじを当てるコツが溢れているが、大半はエセ科学

ある出来事が本当に偶然起きるもので、11回独立しているのだとしたら、起きたばかりでも、しばらく起きていなくても、起きる確率は全く変わらない

2009年、ブルガリアで6つの数字を選ぶくじで、4日後に同じ組み合わせが当選番号になった際、最初は当選者ゼロだったのに、4日後には18人当選したが、全くの偶然

有効な戦略があるとしたら、「できるだけ人が選ばなそうな数字を選ぶ」ことくらい

l  確率についての私的意見

確率は、数学の中でも特に直感が通用せず、直感に頼ると誤ることの多い分野

NASAの上層部によれば、チャレンジャーのような事故が起こる確率は1/10万――当時アメリカでは交通事故の死者が4.6万人で、総走行距離が1.8兆マイルだったので、同じ確率で起きるとすれば400マイル走ると事故が起きるということ(2015年には882マイルまで伸びた)で、やむを得ない確率と思えるが、現場では1/501/300の確率という感覚であり、実際135回飛行して2回の大事故を起こしている

NASA上層部の言う確率は、自分たちの願望に基づく計算で全く根拠がない

 

【第8章        お金にまつわるミス】

「ファットフィンガーfat fingerエラー」――単に数字を取り違えるミスで、2005年みずほ証券がジェイコムの株を「61万円で1株売る」注文を「1円で61万株売る」と取り違えた時は、取引中断までに270億円の損失に繋がり、裁判では誤注文の取り消しをさせなかった東証の過失が認められ信用を失墜

大規模な文明都市での生活には数学が欠かせないが、数学を駆使すれば必ず数字に関わるミスをする

l  コンピュータ時代にお金のミスはどう変わったか

コンピュータの導入により金融取引が高速化し、一定のアルゴリズムがわずかな価格変動にミリ秒単位で反応する――多数の自動取引アルゴリズムが並立することによって市場は安定すると言われるが、「フラッシュクラッシュ」という深刻な危機の原因にもなる

l  アルゴリズムが生んだ高額本

『ハエを作る』という本を、1人のAmazonの出品者は、同社の自動価格設定のアルゴリズムを利用して、「その時の最安値より0.07%安くする」と設定。もう1人の出品者は現物を持たずに鞘稼ぎを目的に、「最安値よりも27%高くする」と設定。現物を持った出品者がもう1人いればよかったが、2人しかいなかったために、両者が互いの価格をもとに値付けしているうちに価格は急激に上昇、価格に上限をつけていなかったために、1冊の本が10百万ドル単位の価格に跳ね上がった

l  物理法則の制約

金融取引に必須のFRBなどの政府提供の情報は、事前に情報漏れがないよう厳重に管理されているが、一旦発表された情報の伝達に関しては規制がない

情報の伝達に関しては2つの競合するテクノロジーが存在――光ファイバーケーブルとマイクロ波リレーで、前者は毎秒20万㎞だが、後者は光の最大速度毎秒29.9742万㎞で直進するが球体の地球を移動させるためには中継基地が必要

いずれの場合も、距離によって到達時間にわずかの差が出るため、金融取引への反映にも差が出てしまうが、それを防ぐ方法は今のところまだない

l  数学への無理解が生んだ高額報酬

CEOに支払われる報酬を決定する役員たちがいかに数学に疎いかを示す典型的な例が、1990年代に始まったストックオプション――ブラック・ショールズ・マートン式によって価値が計算できるが、当時は株価に関わらず数はほぼ同じで、当時価値が急上昇していた。2006年に同式を使ってCEOに付与されるストック・オプションの価値を計算し公表しなければならなくなり、付与数も価値に応じて変えるようになって報酬の急増も止まったが、高止まりとなったため今も続いている

 

【第9章        丸めの問題】 

数字は本来動かないものだが、丸めという手段によって都合よく変えることが出来る

長さを丸めると3mとなる場合、2.5m3.49mまでが含まれる

丸めて1%の場合、有効数字を1桁にすると、0.951.5%までが1%となる

数学の法則と現実の法律の間には面白い関係がある――有効数字の桁数を決めておかないと、数字に幅が生じる

l  どこまでも下がるインデックス

株式の「インデックス」とは、選ばれたいくつかの銘柄の株価の動きから算出した指標で、インデックスを見ることで市場の全般的な動きを知ることが出来る。ダウ平均もその1

1982年、バンクーバー証取がインデックスを導入した際、marketは上がっているのにインデックスは減少一方で年後には1/2近くに下落――原因は、全ての取引をインデックス化する際、小数点3桁まで表示するために、4桁以下を四捨五入ではなく切り捨てていたことにあった

逆に、100ドル借りて1カ月(31)15%の利息を複利で払うとした場合、1日の利息は0.484ドルになり、四捨五入で整数に丸めることにすると、いつまでも利息は0

1度の丸めはわずかでも、積み重なれば大きくなることを「サラミ・スライス法」と呼ぶ

l  遅いのに新記録?

100m走の世界記録は、最初が1912年の106で、1968年アメリカのジム・ハインズが初めて10秒を切る9.9秒を記録したが、4カ月後には995を記録。初めて電動時計で小数点第2位まで計測できるようになり、4カ月前より遅いが記録更新とされた

計測の精度と正確さは全く別物――精度はどれだけ細かく計算できるかを表し、正確さは計測値がどれだけ真の値に近いかを表す。「地球で生まれた」と言えば正確だが精度は低い

ラスベガスのドッグレースでは、スタート直前に賭けが締め切られ、レースが終わって結果発表まで1分以内で終わってしまう。その処理に、競馬のコンピュータ・システムを流用していたため、競馬では最初の馬のゲートインで賭けが締め切られ、結果が出るのもレース終了後数分経ってからなので分単位までしか組み込まれていなかった。勝者がすでに発表されているのに「分」単位では時刻が進んでいないために、賭けが受け付けられてしまう可能性があり得た

l  スケールの違う数字

世の中の数字はほとんどきりのよくないものなので、きりの良い数字には疑いを抱く

シモまで付けた数字は精度が高そうに見え、丸めた数字は精度や正確さを欠くと思いがちだが、1856年イギリスの大三角測量部はヒマラヤのピーク15の計測値は29,002ftで世界最高峰と発表し、前任の長官エベレストに因んで名づけたが、測量結果はおよそ29,000ft”とされていたが、信憑性を高めるために2ftが追加されたという

2017年、イギリス国家統計局は失業者が7000人減って160万人になったと発表したが、10万単位でまとめられた数字に対し、それ以下の数値を持ち出して元の数値の増減に言及しても無意味で、統計的に減ったとは言えない

l  サマータイムの危険性

時計の針を1時間遅らせる時には得した気分になるが、早めるときに同様の利点はないどころか、突然1時間早起きしたために心臓麻痺の危険性が高まる――夏時間開始の最初の月曜日に心臓麻痺になる人は24%増えているが、1週間のスパンではほとんどサマータイムの効果は消える

 

【第9.49章 あまりにも小さな差】

丸めたり平均したりすればいいと思えるくらい小さな桁が重要性を発揮する場合がある

1990年打ち上げのハッブル宇宙望遠鏡は、直径2.4mの鏡の円錐定数(パラボラらしさを示す指標)に若干の誤差が生じたため、鮮明な画像を結ばなかった。誤差は、鏡の縁が本来あるべき高さより2.2マイクロメートル低かっただけだが、後に球面収差修正装置を取り付けて使用されたが、報道ではスペア・ウォッシャーの位置がずれていたという

l  ボルトが合ってさえいれば

1990年の英国航空のジェット旅客機では、フロントグラス交換のために使われた90本のボルトの一部に直径0.026インチ違いのボルトが使われたために、飛行中にフロントグラスが吹き飛び、機内に急減圧が起こって危うく機長が機外に吸い出されそうになった

ヒューマンエラーについて研究している心理学者は、事故に関して「スイス・チーズ・モデル」という、事故が起きるのは個人ではなく、システム全体に問題があるためだという考え方を提唱――エラーを防ぐ対策を穴の開いたスイス・チーズに譬え、エラーを石として、1枚の壁ではエラーを完全に防げるものではないが、何枚も壁を重ねることで通常であれば石はどこかで止められる。だが、石が全ての壁の穴を通り抜けてしまうと事故が起きる

医療や金融などの分野では、個人に責任を負わせる傾向が強く、システム全体にはあまり目を向けない。システムに問題があってもそれを認めない文化があるように感じる

 

【第10章     単位に慣習・・・・・どうしてこうも我々の社会はややこしいのか】

単位のついていない数字は無意味

単位間違いの例で有名なのは、コロンブスがアラブ・マイル(1アラブ・マイル=1,975.5m)で書かれた距離をイタリア・マイル(1イタリア・マイル=1,477.5m)と誤解したため、スペインからアジアまでは楽に行けると思ってしまったというもの。サンディエゴ辺りと考えていたが、その間に想定外の大陸があったので助かった

単位の間違いによってNASAが事故を起こしたのは1998年、火星探査機マーズ・クライメート・オービターを打ち上げ、9カ月かけて火星に到達したが、間もなく通信不能になる。原因はメートル法を使うべきところにヤード・ポンド法を使っていたこと

1628年、スウェーデンで建造された世界最強の軍艦は、64門の大砲を備えていたが、進水後2回横風を受けただけで数分後に沈没。高価な大砲はすぐ引き揚げられたが、船体は海中に放置。1956年、ほぼ進水時のままで引き揚げられ、博物館に展示。上部が重すぎた結果の沈没だったが、左右非対称なことも隠れた要因と考えられる。復元作業中に4種類の定規が発見された。スウェーデン・フィートのものとアムステルダム・フィートで、これが左右非対称の原因と推測

l  熱さをなんとかできないなら、退出したまえ

距離を測る時には、単位が違っても起点は同じだが、温度を測る時には明確な起点はない

華氏と摂氏では全く違った方法で起点(0)を定めている

華氏は1724年ドイツの物理学者ファーレンハイトが提唱、塩化アンモニウムを使った寒剤(2つ以上の物質を混ぜ合わせた冷却材)によって得られる温度を0度と定めた

摂氏も同じ頃、スウェーデンの天文学者セルシウスが提唱、通常の気圧での水の沸点を0度とし、温度が下がることに数字が増え、水が氷る時に100度になるとした。その後水の凝固点を0度、沸点を100度とするよう逆転したため、摂氏の考案者に疑義が出て、人名を冠さないセンチグレードCentigrade(100分度)と呼ばれる。その後Centigradeは角度の単位(直角を100度、1周を400度とする角度の単位、グラードとも呼ばれる)にも使われるようになったため、1948年に温度の単位は摂氏に戻された

距離の測定では起点が同じなので、単位の違いは、絶対測定でも相対的な差異を表す場合でも、メートルをフィートに換算する場合は3.28084を掛ければよいが、摂氏と華氏の換算はそうはいかない――2016年の気候変動に関するパリ協定の批准報道でBBCが、「世界平均気温の上昇を摂氏2(華氏36)以下に抑えられる水準まで減らす」としたのは混乱の極みで、摂氏2度は華氏35.6度だが、温度が2度上昇する時の華氏換算は3.6度であり、元々の発表も華氏の付記はなかった。より正しそうに見える表記に引きずられる

l  大問題

航空機の燃料は体積ではなく質量で測る――温度による変化を回避するためだが、単位を㎏かポンドにするか、間違えると重大事故につながりかねない

1983年、エア・カナダのモントリオールからオタワ経由エドモントンに向かう最新鋭のボーイング767は、アビオニクス(航空機に搭載される電子機器)が全面的に取り入れられた最初の航空機だが、前のフライトの時から燃料計2系統のうち1系統に故障があり、動作不良との引継ぎがなされていたが、運航上は目視による残量確認により運用許容基準は満たしていた。当時、カナダではヤード・ポンド法からメートル法への移行を始めたころで、同機はエア・カナダ保有機の中で初めてメートル法を採用した機体だったこともあって、出発の際の給油でまずポンド換算で必要量の燃料を搭載したため、kg換算数値の0.45相当しか搭載せず、経由地で再度給油した際の残量と必要給油量を計測した際も同じミスをおかしたため、遂に飛行中に燃料切れが出来。体積から質量を求める方法も、ただ「比重によって求める」とだけあったために、kgの比重である0.88を掛けるべきところを、ポンドの比重である1.77を掛けてしまったことも、ミスを止められなかった要因。燃料がなくなったため電源も切れすべての計器がストップ。幸い機長にグライダーの経験があり、30マイルを手動で滑空させ、既に閉鎖されていた空軍基地の滑走路に胴体着陸させた。7200ftしかない短い滑走路だったが、800ftほどで着陸に成功、さらに幸運だったのは前部の降着装置が故障していたので、機体の前部が地面と擦れて大きな制動摩擦力が生じてオーバーランしなかったこと。基地の旧名に因んで「ギムリー・グライダー」と呼ばれて世界的に有名になった

ポンドとkgの逆の取り違えのケースもある――1994年アメリカ発の貨物航空機では、貨物の重量をポンドと思い込んだため、想定より2倍以上も積載したことになり、辛うじて離陸はしたが、巡航高度に達する時間も倍かかり、燃料も過大費消となった

l  通貨も単位である

1.41ドルと1.41セントが同じだと思い込みやすいのは、小数点がついているから

Thousand, million, billionなどがつくと混乱を招く――それらを単位と見做すのは間違いではなく、加減には使えるが、乗除では単位も乗除しなければいけない

l  グレーンの問題

「薬用ポンド」では、1ポンド=12オンス、1オンス=8ドラム、1ドラム=3スクラブル、1スクラブル=20グレーンなので、1ポンド=5760グレーン

アメリカではまだ通用しており、グレーンの略語表記grが、グラムと間違えられやすい

1グレーン≒64.8㎎≒1/15.4グラム

 

【第11章     統計は、お気に召すまま?】 

集団について調べる方法の1つに、一定のサンプルを取って全体を推定するやり方がある

アメリカでは、10年に1度の全国規模の国勢調査が憲法上義務付けられているが、1880年までは急激な人口増加と設問数の増加で集計に8年かかっていた

問題解決のために開発されたのがパンチカードと電気式の集計機で、1890年のデータ処理は2年で完了。さらなる複雑なデータ処理のためコンピュータ産業が勃興・発展したのは間違いない――データ処理の会社3社が合併してできたのがIBM

国勢調査により、国民の平均像が描かれたが、全ての項目にぴったり該当する人はいない

l  平均的な制服

1950年代、アメリカ空軍で新鋭の戦闘機を導入する際、コンパクトなコックピットに合うように身体にぴったり合う制服を作るため、パイロットの身体測定を行った

4063人の中から170人を対象に132項目計測した結果から、全ての計測値が中央から30%に収まる人に着られる制服を作ろうとしたが、そのような「平均的な人間」は1人もいなかった――それほど人間の身体の寸法の多様性が大きいということの証明であり、人間とは平均を知るのが無意味なほど個人差の大きい存在であることも明らかになった

l  平均が同じでも違う

データの多様性は、「標準偏差、あるいは標準偏差を二乗した分散」で測られる

あるマッチング・サイトでは、外見の魅力の平均評価が同じでも、評点の標準偏差の大きい人ほど受け取るメッセージの数が多い

2017年に発表された「データサウルス」というデータセットでは、142x座標、y座標のペアからなり、全ての座標に点を打つと、恐竜の姿が浮かび上がる。さらに、平均も標準偏差も「データサウルス」と同じ12のデータセットを作り「データサウルス・ダズン」と名付ける。どれも142のデータからなり、データの平均値はx座標、y座標ともに小数第2位まで同じであり、標準偏差も同じなのに、グラフにするといろいろな形になって現れる。グラフにして可視化することの重要性を教えてくれる

l  バイアスはどこにでも

統計データについては、分析も大事だが、データがどのようにして収集されたかを知ることも大事――収集の際のバイアスが結論に影響を与えかねない

イギリスにある1500もの巨石遺跡について2010年発表された報告では、遺跡同士を結ぶと二等辺三角形になる箇所がいくつもあることを発見、何れも完璧な形で偶然とは思えないとの内容だったが、1500もの点を直線で結んでできる二等辺三角形は561百万もあるので、自分の期待に適合するものだけ(「確証バイアス」)に注目した結果に過ぎない

l  相関関係と因果関係

2010年、イギリスでは、携帯電話のアンテナ塔の数と、その地域の出生数に強い相関関係があることが判明したが、両者には因果関係がなく、事実ではない――どちらもその地域の住民の数に依存しているだけ

相関関係があることが即ち、何かが何かの原因になっているということではない。何か別のことがデータに影響し、それによって相関関係が生じているという可能性は常にある

19932008年、ドイツの連続殺人事件では、1人の女性のDNAが犯行現場の全てから見つかったので犯人とされたが、DNA採取に使う綿棒を製造している工場で働く女性だったことが判明

調査対象データの量がある程度以上に増えれば、必ずどこかに何か関係のありそうな2つのデータが見つかるもの(=疑似相関)

相関関係はそれ自体悪いものではなく、便利で役に立つ。データの中から連動しているように見える複数の変数が見つかれば、それによってわかることも多々あるに違いないが、あくまで手掛かりに過ぎず、それが答えになることはない。数学では正しい答えを探すことが重要だが、統計学は違う。統計学の提示する数字は、答えを見つける出発点にはなるが、答えそのものではない

癌の罹患率が一貫して上昇を続けているのは、不健康な生活をする人が増えているのではなく、癌に罹るのに十分なほど長生きするようになったということ

 

【第12章     ランダムさの問題】 

1984年、アメリカのクイズTV番組「プレス・ユア・ラック」で番組史上最高の110,237ドルを獲得。額縁のような矩形の枠内に18個の画面があり、ランダムに画面が高速で入れ替わる。画面には5005000ドルの金額や、ハワイ旅行やボートなどの賞金や賞品が出る。時々ワミー(外れ)も出てくる。クイズに勝ってボタンを押す権利を獲得、ボタンを押すと画面のいずれかに光が当たり、それがワミーでなければ賞品か賞金を獲得できるが、賞品か賞金にはもう一度ボタンを押すことが付随している画面もあり、その場合は押さなければいけない。何度も続けることは確率からいくとありえないが、たまたま続けて何回も賞金を獲得した結果、高額の賞金を獲得できた(Press Your Luck Michael Larson)

本人は、細工をしたのではと疑われたが証拠はなく、無事賞金を持ち帰ったが、強盗に入られたり、事実婚の奥さんに逃げられたりした挙句、15年後に49歳で、喉頭癌により死亡

完全にランダムに見えているようで、実はあらかじめ決められた5種類のサイクルで動いていただけで、その動きが速いためにランダムに見えていただけだったため、録画してパターンを見破れば、あとはどういう順序で表示が入れ替わるのかを覚えればよかった

完全にランダムな動きをさせることはコンピュータでは不可能

l  ロボットはランダムを作れるか

1956年、イギリス政府が始めたプレミアム・ボンド(割増金付債券)は、利息の代わりに抽選で賞金をもらえる債券。ランダムに当選者を選ぶために開発されたのが電子乱数発生装置。ネオン管に電子を通して出る電流をとらえノイズを抜き出すとランダムな乱数になる。現在のものは、LEDから放出される光子をビームスプリッターに送って電子的に乱数を発生させている。量子力学を利用した乱数発生装置もある

l  擬似乱数

スマホの電卓を横にして”Rand”のボタンを押すと、毎回0から1までの間の乱数が表示されるので、必要に応じて10倍、100倍にして利用すればいい――純粋な乱数ではなく、あらかじめ定められた手順で数字を表示しているだけ

インターネットではかなり早い時期から、安全の為にSSL(Secure Sockets Layer)というプロトコルを利用し、乱数によるトラフィックの暗号化が行われてきた

WWWが一般に使われるようになった1995年頃のブラウザーは、暗号化技術も稚拙で、疑似乱数発生の起点を容易に見破ることが出来たが、現在では遥かに進化している

l  擬似乱数発生のアルゴリズム

ばらつきの程度と効率、使いやすさと安全性はトレードオフ

乱数はデジタル・セキュリティにとって極めて重要なものなので、発生アルゴリズムは極秘だが、時にミスが出ることがある

l  「ランダム」を誤解してませんか?

真のランダムは、均等にばらついてはいない――特にお金に関するデータは均等ではない

ベンフォードの原則――現実世界の数値データのうちでもある種のものは、先頭の1桁の分布に大きな偏りが生じるという法則で、2mの長さの板を1㎝単位で計測したデータは200あるが、55.5%は先頭の1桁が1になる。法則によれば、現実の世界に存在する数値データを十分な量集めて平均すると、先頭の桁が1のものは全体の30.1%、217.6%、312.5%、49.7%、57.9%、66.7%、75.8%、85.1%、94.6

アメリカの3141郡の人口の先頭桁の分布はほぼベンフォードの法則の分布に一致する

末尾の桁の分布は程よくばらついているはずで、末尾2桁になると100通りあるので、どの数字も出現頻度は1%くらい――突出して高い数字があれば人為的に作られた数字であることが疑われ、監査などではこの手法がよく使われる

数字の分布によって真贋を見極める手法は一般的

l  ランダムか否かの見分け方

真の乱数と見分けがつかない疑似乱数を作ることは可能――①どの数も発生確率が同じに見えること、②どの数も他のすべての数に影響を与えていないように見えることが要件

l  現実の物体に勝るものなし

いまだに紙ベースの乱数表が出回っている

 

【第13章     計算をしないという対策】

1996年、欧州宇宙機関のアリアン5ロケットが地球磁気圏の調査を目的とした人工衛星4機を搭載して打ち上げられたが失敗、その原因は64ビットの数字を16ビットしか入らない場所にコピーしようとしたこと

l  「スペース」インベーダー

プログラミングのミスも様々――コード記述の際の誤記は最も初歩的だが、重大な結果に

/」の前にスペースを置くと、コンピュータのルート・ディレクトリを意味するので、「/docs/mybackup /」とするだけで、すべてのデータを意味することになり、その目に「削除」の指示があれば、コンピュータ内の全てのデータが削除されてしまう

誤記は、コンピュータへの指示をプログラミング言語に翻訳する時のミスといえる

l  500マイル先までしか届かないeメール

サーバはメールを送信すると、送信先からの応答を待つが、「タイムアウト時間」が設定されているプログラムでは、ある程度時間待って応答がないとどこにも届かないと判断され、メールは失われるが、タイムアウト時間が0に設定されていると、送信と同時に送信がなかったことにされてしまう。ただタイムアウト時間を確認して送信をストップするまでに何ミリ秒かの時差があり、その間だけメールは送信されてしまい、光の速度の制約により500マイルより遠くに送れなくなったということ

l  コンピュータと交流しよう

プログラムが止まったときのエラーメッセージの中で、ウェブの閲覧中に「404」というエラーが出たら、「該当するサイトが見つからない」という意味――ウェブに関連する4で始まるエラーはいずれもユーザーの何らかのミスに起因するもので、5で始まるものはサーバーの問題に起因するエラー。「507」は「サーバーの記憶装置に空き容量がない」との意

エラーメッセージの大半は、専門の技術者に利用されることを想定しているので、実用重視であり、ユーザーフレンドリーとは言えないが、人為的なミスを防ぐためにはより分かりやすくする必要がある――ミスをした人間を排除すると、ミスに対処した経験のない人だけが残る。そういう人が後輩を指導する教育は偏ったものになるのは間違いない

コンピュータ・プログラムが役立つことは間違いないが、まだ使われ始めてから日が浅く、複雑なコードは書いた本人が意図しなかった動きをすることがある

 

【エピローグ】過ちから何を学ぶか

人間は過ちから学ぶのが得意でないかもしれないが、過ちから学ぶ以上の方法も見つからない。ミスから得た教訓を共有し合える仕組みがあれば重大な事故は防げるかもしれない

算数や数学では、間違えることは「よくないこと」とされるが、自分を成長させるためには新たな挑戦が欠かせず、挑戦に間違いはつきもの

人間が何かをすれば、必ずどこかで何らかのミスが起きるはず

 

 

 

 

 

屈辱の数学史 マット・パーカー著

エラーや誤解が生む悲喜劇

202257 2:00 [有料会員限定] 日本経済新聞

本書の原題は「A COMEDY OF MATHS ERRORS(数学エラーの喜劇)」である。原題の通り、この本は数学的エラーに関するトリビアやネタの宝庫だ。そして、それを書いたのは数学者である。数学者だからこその視点が至る所に散りばめられていて、極めて魅力的な本になっている。

原題=A COMEDY OF MATHS ERRORS(夏目大訳、山と渓谷社・3190円) 著者はオーストラリア出身の元数学教師。ユーチューバーとしても活躍。 書籍の価格は税込みで表記しています

数学的エラーは致命的になり得る。それは本書で描かれているように、飛行機の乗客の命を危険に導くことだってある。他方、六角形だけのサッカーボールが描かれた標識を許せない人もいる。そのくらい、数学は社会の至る所で人々の身近にあるのだ。そういうことを読者にしみじみと再認識させてくれる。

もちろん、多くのエラーは複合的要因から起こるから、いつも数学だけが悪者というわけではない。著者の意図も、決して数学だけを訴追することにあるのではない。数学者の視点からヒューマンエラーを見たら、どう見えるのかという点を明らかにすることにある。そこにあるのは、もちろんコメディだけではない。人間と数学の分かちがたい関係から生じるエラーはさまざまな悲喜劇を生み出す。それらを数学者の視点から(時には独特のジョークも交えて)冷静に見るからこそ、このような本が書けるのだ。同じ内容でも他の専門家が書いたら、まったく違う書き方になっただろう。

訳も読みやすくて非常によい。それだけに、なぜこのような日本語タイトルになったのか、よくわからないのが残念である。まず、この本は数学史の本ではない。暦や擬似乱数などに関する短い歴史的記述は出てくるが、数学史はほぼまったく出てこない。また、何がどう屈辱的なのかもまったく不明だ。とにかくタイトルが驚くほど内容を反映していない。数学や数学史を愛するものにとって、このタイトルは気持ちのよいものではないし、数学や数学史を槍玉にあげて屈服させれば、その分読者が増えるというわけでもないだろう(カバー裏には「『屈辱』をとことん楽しめる一冊」とある)。訳者あとがきや解説の類いもないので、なぜわざわざこのようなタイトルにしたのか、さっぱりわからない。

とはいえ、タイトルを無視すれば、これは秀逸な本だ。

《評》東京工業大学教授 加藤 文元

 

 

 

紀伊国屋ホームページ

出版社内容情報

わずかな数学のミスで、まさかの事態に……

スタンダップ数学者が皮肉たっぷりに語る

可笑しくも哀しい出来事の数々!

私たち現代人の生活は数学に依存している。コンピュータのプログラム、金融、工学、すべての基礎は数学だ。

普段、数学は舞台裏で静かに仕事をしていて表に出ることはない。

表に出るのは、まともに仕事をしなくなったときである。

インターネット、ビッグデータ、選挙、道路標識、宝くじ、オリンピック、古代ローマの暦……他。

本書では数学のミスによる喜劇的、ときに悲劇的な事例を多く取り上げている。

謎解きを楽しむように本書を読めば、ミスを防ぎ危険を回避できるようになるだけでなく、数学に親しみを感じるようにもなるだろう。

スタンダップ数学者である著者自身の失敗談やジョークも多く盛り込まれた本書は、「屈辱」をとことん楽しめる一冊だ。

英国「サンデー・タイムズ」紙 数学本初のベスト・セラー作。

 

 

 

コメント

このブログの人気の投稿

近代数寄者の茶会記  谷晃  2021.5.1.

新 東京いい店やれる店  ホイチョイ・プロダクションズ  2013.5.26.

自由学園物語  羽仁進  2021.5.21.