令和5年2月28日、ニュートン別冊『ゼロからわかる統計と確率・ベイズ統計編』という書籍を読破した。 ニュートンの書籍を読む度につくづく本当に良書ばかりだなと感じさせられる。どこかのサッカー選手ではないが、読み終えた後、ブラボーと叫びたくなった。やはりニュートンの書籍は素晴らしい。 ベイズ定理はある結果が得られた時、何が原因だったのかを探ることができるものです(66頁参照)。そして、数理モデルを使えば、背後のメカニズムの推定や未来予測も行うことができます(111頁参照)。まず、ベイズ統計学を語る前に

令和5年2月28日、ニュートン別冊『ゼロからわかる統計と確率・ベイズ統計編』という書籍を読破した。

 

ニュートンの書籍を読む度につくづく本当に良書ばかりだなと感じさせられる。どこかのサッカー選手ではないが、読み終えた後、ブラボーと叫びたくなった。やはりニュートンの書籍は素晴らしい。

 

ベイズ定理はある結果が得られた時、何が原因だったのかを探ることができるものです(66頁参照)。そして、数理モデルを使えば、背後のメカニズムの推定や未来予測も行うことができます(111頁参照)。まず、ベイズ統計学を語る前に前提となる統計学(4頁参照)と確率論(34頁参照)の基礎を非常に分かりやすく説明しています。統計においては、平均値、分散と標準偏差正規分布、標本調査と推定、検定、相関係数等について記載されています。特に統計における罠。「〇〇は健康によい?」(20頁参照)、「チョコレートを食べる国ほど、ノーベル賞が多い?」(22頁参照)、「大学の合格率の真意は?(24頁参照)」など、統計数字を読み誤ることを危惧しています。確率においては、事象の確率、積の法則、和の法則、余事象、順列、組み合わせ、期待値等について記載されています。確率は16世紀にサイコロを使ったギャンブルから生まれました(37頁参照)。令和5年2月17日にNHKで放送された『アナザーストーリーズ 運命の分岐点・ラスベガスVS.MITの天才〜全米を騒然とさせた頭脳戦〜』という番組を観ました。MIT(マサチューセッツ工科大学)の学生が“確率論”を基にブラックジャックでの有利な状態を導き出し、ラスベガスのカジノで大儲けしたという話でした。確率論を知ることが勝負の世界で有用なことを立証したのです。ただ、この書籍を読んで、確率を学ぶとギャンブルはやればやるほど損をすることが分かります(39頁参照)。また、確率で重要なのは、「大数の法則(38頁参照)。データが増えれば、増えるほど、確からしくなるということです。

 

ベイズの定理の数式である「事後確率・P(原因AΙ結果B)=事前確率P(原因)×P(結果BΙ原因A)/P(結果B)」(67頁参照)が重要です。1996年ごろ、マイクロソフト社の創業者のビル・ゲイツベイズ統計学の専門技術において、自社が優位に立っているとアピールしました。ITにおいて、ベイズテクノロジーは、検索サイト、画像認識、自動翻訳などの重要な技術に応用されていて、ITを支えていると言っても過言ではありません(96頁参照)。以前、AIがディープラーニング(深層学習)(133頁参照)により、経験を重ね、自ら成長していくという新聞記事を読んだことがありました。自ら成長することに驚きましたが、「ベイズ更新」(86頁参照)をするようにプログラミングすれば、自ら成長していくことも可能だなと思いました。道き出された事後確率を事前確率にして、新たなデータを含む新たな事後確率を算出する。このプロセスをフィードバックループして繰り返せば、どんどん精度の高い事後確率が求められる。新たなデータが追加される度に自己成長するシステムが創造できるのである。1976年、ケネス・アッペルとウォルフガング・ハーケンによって未解決だった四色問題がコンピューターを駆使して証明されました(ニュートン別冊『数学の世界』58頁参照)。近い将来、素数の規則性、完全立方体問題、ゴールドバッハ予想リーマン予想ニュートン別冊『数学の世界』172頁参照)などの未解決問題もコンピューターを駆使して解決できるかも知れません。

 

数理モデルの数式としては、線形回帰モデルである「変数の数理構造(方程式など)+パラメータ(例:.W<体重>=aH<身長>+b)」が重要です(113頁参照)。数理モデルにおいては、変数とパラメータの決定が非常に大切です。「よい数理モデル」とは対象から観測されるデータとよく一致するモデルのことです。すなわちデータの点と数理モデルが近ければ近いほど、よく現象をとらえていると考えます。これを達成するために、データと数理モデルの離れ具合、すなわち「誤差」を計算します。この誤差の計算方法には様々なものが知られていますが、単純に数理モデルから計算される値と実際のデータとの「差」(正確には、二乗した誤差<平均二乗誤差>など)を計算します。そして、パラメータを調整して、この誤差が最小になるように値を決定するのです。この手続きをパラメータの推定という手続きになります(133頁参照)。よい数理モデルを作るにはパラメータの決定が重要な鍵を握っているのです。

 

ニュートン別冊『ゼロからわかる統計と確率・ベイズ統計編』という書籍には、待ち行列理論が記載されてありました(124頁参照)。この書籍には記載はありませんでしたが、待ち行列理論と聞いて、リトルの法則を想起しました。リトルの法則とは、「L=λW」という式によって行列の待ち時間を計算できるものです。次に、車の自然渋滞に関する記載もありました(118頁参照)。これは西成活裕著の『とんでもなく役に立つ数学』という書籍にも記載されていました(西成活裕著 『とんでもなく役に立つ数学』151頁参照)。また、コンピューターの創造に大きく貢献したアラン・チューリングエニグマの暗号を解読した話も非常に興味深い話でした(106頁参照)。加えて、数理モデルで考えるコロナウイルス対策のコラムも掲載されており、数学を使用した面白い話が満載でした。

 

ニュートン別冊『ゼロからわかる統計と確率・ベイズ統計編』という書籍において、いくつかの誤植がありました。本書38頁に「23ページ」と記載されていたが、「51ページ」です。本書40頁に「14ページ」と記載されていたが、「44ページ」の間違えです。まあ、教科書の間違えに比べれば大したことのない誤植である。

 

毎回、ニュートンの書籍には感動させられる。分かりやすくて面白い。本当にニュートンの編集者の技術と能力には敬服してしまう。ニュートン別冊『ゼロからわかる統計と確率・ベイズ統計編』という書籍も素晴らしい書籍だった。そして、ベイズ統計学数理モデル現代社会分析、近未来予測などに非常に有用で、これからますますベイズ統計学数理モデルは重要視されてくるだろう。