頻度主義統計学とベイズ統計学の違いを意識して学ぶ!

こんにちは!
IT企業に勤めて、約2年間でデータサイエンティストになったごぼちゃん(@XB37q)です!

このコラムでは、頻度主義統計学とベイズ統計学について紹介します。
そもそも、統計学と呼ばれる分野にはこの2つの学問が存在しており、お互いに特徴があるため、区別して使われています。
この2つの学問が使われているデータ分析手法がそれぞれ存在しています。
どちらの学問の特徴をそれぞれ理解して、使いこなしましょう。

頻度主義統計学とベイズ統計学の考え方

頻度主義統計学とは

集計されたデータは、大きな母集団のうちの小さな標本に過ぎないという考え方です。
この「小さな標本」とされたデータから、大きな母集団の性質を見極めようとするのが「頻度主義統計学」と呼ばれる考え方です。
我々日本人が、高校や大学で学習する統計学というのは多くがこれに当てはまっています。

ベイズ統計学

条件付き確立に関して成り立つ定理である「ベイズの定理」からベイズ統計学という考え方が提唱されました。
ベイズの考え方は人間の心理による主観的な部分があるため、この理論はかつて統計学界で軽視されていました。
科学者は客観性を重んじるため、この主観的な部分に対して嫌悪感があったと思われます。
しかし、ベイズ統計学は現代の人工知能や機械学習の分野でも利用されている重要な理論となっています。

考え方の違い

頻度主義統計学とベイズ統計学の違い
頻度主義統計学とベイズ統計学の違い

それぞれの分野で、「確率」の解釈に違いがあります。

■頻度主義統計学
平均や分散など性質を規定するパラメータは、もとから決まっている
得られたデータが、母集団からどれくらいの頻度(確率)で発生するのかと考える
パラメータが定数、データが変数(確率変数)

■ベイズ統計学
平均や分散など性質を規定するパラメータは、動いている。
得られたデータが、どのようなパラメータに基づく母集団から得られたのかと考える
パラメータが変数(確率変数)、データが定数

考え方の違いをサイコロを例に説明する

客観確率に基づく頻度主義統計学の立場

頻度主義統計学とは、文字通り頻度を重視します。
サイコロの場合は、無限回サイコロを振り、5が出た回数を数えて確立を計算します。

実際には無限回繰り返すことは不可能なため、「大数の法則」(中心極限定理)を利用し、有限回再黒を繰り返し、近似値を求めます。
この近似値が1/6になるという考え方です。
大数の法則:ある程度回数を振った場合の近似値は、同じ条件で無限回サイコロを振った場合の真の確率と一致する法則

主観確率に基づくベイズ統計学の立場

ベイズの定理には事前確率が含まれます。
始めに何も情報がない場合、サイコロの5がでる確率を1/6 と考えます。
この初めに決めた確率を事前確率と呼び、この事前確率が主観的であると言われます。

そして、有限回サイコロを繰り返し、データを得た後、事後確率を計算し確率を求めます。
そのため、有限回のサイコロの結果次第では1/6にならないため、必ず 1/6 になるとは限らないという考え方です。
この事後確率は事前確率の値によっても変化します。

今の時代ではベイズ統計学が注目されている

 日本ではここ15年、最近になってベイズ統計が脚光を浴び始めています。
それまでは、「統計学」=『頻度論』という考えが主流でした。
それではなぜベイズ統計が注目されてきたのでしょうか?    

ベイズ統計学では、初めに何も情報がない場合、サイコロの『5』がでる確率は1/6と考えます。
この確率を「事前確率」と呼び、主観的に決められる確率になります。
「これは絶対歪みがないサイコロ!」と言われたら、反対する理由が不十分なため、不確かな事前確率には、とりあえず適当なものを使うという考え方です。

この事前確率に対して経験を活かすことで融通を聞かせることが可能なのが、ベイズ統計学の良い特徴です。
経験に応じて、事前確率の設定を変えてやることが可能です。
そのため、データの量が少ない場合も、結果がもっともらしい場合があります。

まとめ

  • 頻度主義は、その名の通り頻度を重視し、実験や工場での生産など、たくさんのデータを実測できる場合は、頻度主義統計の方が信頼性が高い。
  • ベイズ統計は、事前分布がポイントになるが、人の観や経験からの値をまず設定しても結果が出せるメリットがある。
  • ビジネス上の分析をやっていく上では、人の主観というより、観と経験が活かせるのはベイズ統計はとても使い勝手がいいと感じた。
  • ベイズ統計は、事後分布を次の事前分布として利用可能ということから、ベイジアンネットワークで「確率が伝搬していく」という意味が納得できた。

参考図書