AI・機械学習を中心に

AI/機械学習/データ分析/子育て/日々の雑感

[翻訳]仮説から始めるな ~統計学の授業で学ぶ嘘~

原文

Cassie Kozyrkov氏の記事より(2018/12/1)

towardsdatascience.com

 

仮説検定の設定は社交ダンスです。そのステップはaction-action-worlds-worldsです。素敵なフォックストロットのリズムがあります。残念ながら、多くの人は間違った足から始めてしまうことで失敗してしまうのです。正しいダンスの仕方は以下の通りです。

Step1: デフォルトアクションを書き出す

統計は不確実性の中であなたの考えを変えるための科学です。したがって、最初のステップは、データによる説明がない場合に、あなたが何をしようとするかを理解することです。

もしあなたが無知のままならば、あなたは何をするとコミットしますか?

そのため、(追加の)証拠を収集しない場合、あなたが実行することをコミットする行動/意思決定から始めます。これをデフォルトアクションと呼びます。

スタートするとは、行動することであり、考えることではありません。

私があなたに尋ねているのは、「あなたが情報を知らないままだったならば、実際にどのような行動をしますか?」ということです。

「データを集める」は適切な答えではありません。もし、今すぐ行動/意思決定をするように強制された場合に、どのようなオプションを選択するかを考えてください。

 Step2: 代替アクションを書き出す

意思決定をバイナリに保ちましょう。意思決定を「するか」vs「しないか」のようにフレーミングします。デフォルトではない方の行動が代替アクションです。

もしバイナリの意思決定が基本的過ぎると感じるならば、様々なスクリーン上の形状は、バイナリの選択の累乗で表されるということを思いましょう。より複雑な意思決定をしたいならば、複数の仮説検定を組み合わせて行います。まずは1度に1つずつ進めましょう。

第一パートは”あなたの考え”ではない

スタートするとは、行動することであり、考えることではありません。私はあなたが初めから知っていることについて尋ねてはいません。なぜなら、よい頻度論者(古典的な統計学者)は分析をする前には何も知らないとするからです。

ベイズ論者はこれについては異なる考えを持ちますが、もしあなたがここでの言説に関してベイズ論者の怒りを感じているならば、冷静になって対立論者について知るレッスンだと考えてください。ベイズ論的な考えについては後ほど触れます。

無情報への対処

デフォルトアクションに関する問いは、分析者に対してのものではありません。それはMBA的なもので、チームの意思決定者が担当すべきものです。熟考ののち、意思決定者のビジネスセンスに基づき、それを決めます。

デフォルトアクションを選択するにはビジネスに精通している必要があり、チームの意思決定者の義務です。

 私はあなたが無知ならば何をしたいかを尋ねており、あなたは質問に答えるために、過去の分析のインスピレーションを受けるかもしれませんが、基本的にはデータを必要としません。Explaratory data analysis(EDA、探索的データ分析)は一種のガイド付きの思考プロセスです。もしアナリストと意思決定者がどのように連携するかについてより深く知りたい場合には、こちらの記事を読んでください(翻訳)。

安全な方をとる

新製品の発売に関する意思決定をする場面を想像してみてください。意思決定者における典型的な選択は安全な方を取ることです。つまり、データが緑(GO)ボタンを押す正当な理由を示さない限り、新製品の発売をしないという選択をします。もしデータが無いならば、あなたはプロジェクトを先延ばしにするでしょう。あなたは失敗が起きても悪が少なくなるように、デフォルトアクションを選択しました。

デフォルトアクションは無知の状況下であなたにとって受け入れやすい選択肢です

社会で明白にデフォルトと考えられている他の例は、”疑わしきは罰せず”(デフォルト=証拠がなければ無罪)、新薬の承認(デフォルト=証拠がなければ承認しない)、科学論文誌への掲載(デフォルト=証拠がなければ掲載しない)

もしデフォルトアクションが存在しないならば、統計は必要ありません

本当の無関心はかなりまれですが、もしデータが無い状態でコインを投げたいのならば、あなたは統計が必要ありません。もしあなたの考えが設定されていないならば、それを変えることはできないのです。代わりにこれを読んでください。統計的推論は、不確実性下での意思決定のためのものです。もしあなたが答えをすでに持っているならば、必要ありません。無情報化での意思決定をフレーミングするために、意思決定者のトレーニングが必要であり、数学者は必要ありません。

完全情報への対処

 次のステップは少し奇妙です。統計の授業ではそれが何でもないかのようにそれを教えますが、それはかなり大きな心理的飛躍があります。あなたの仕事は、世界の全ての可能性のある状態を想像することです。考えられる全てのパラレルワールドを想像したら、それぞれを2つのカゴに分別します。カゴ1は”デフォルトアクションを喜んで実行したい世界”と、カゴ2は”そうでない世界”です。

 Step3: 帰無仮説(H0)を表現する

カゴ1という名前が気に入らないならば、その技術的な名前は”帰無仮説”です。

統計学の授業では、仮説検定の方法は学びますが、仮説を立てることについては学びません。

あなたは「現状維持」、「つまらない方」、「証明したくないもの」など、帰無仮説の簡単な説明を聞いたことがあるかもしれません。しかしその説明はあまり正しくはありません。帰無仮説とは、不満なくデフォルトアクションを選択できる世界(状況)のすべての集合を意味しており、私はあなた方がこの哲学的な奇妙さを受け入れることができると信じています。

ここまでを振り返ってみましょう。ここでのポイントは、あなたが何も情報を知らない、またはほとんど知らない限り、デフォルトアクションを実行するとコミットしているということ、または帰無仮説の世界の住人であることを絶対の確信をもっているということです。

仮説はゴキブリのようなものです。あなたがそれを見たならば、それは決して1つではありません。必ずどこか近くにさらに隠れているものが存在します。

Step4: 対立仮説を表現する

 カゴ2は対立仮説であり、残りの世界(状況)は全てそこに入ります。帰無仮説がFalseになる場合、Trueになります。二つの仮説は数学的には、集合/補集合の関係にあり、3つ目のカゴは存在しないことを意味します。

一言で言えば、対立仮説は次の質問に対するあなたの答えです:
「あなたの考えを変えるには何が必要ですか?」

私たちはデータを追加する準備ができました。さあゲームは何でしょう?

"action-action-worlds-worlds ※"でダンスは完成です!

※ デフォルトアクション→代替アクション→帰無仮説→対立仮説

あなたの考えを変えるための科学

あなたの仮説はすべての可能性をカバーします。重なり合いはありません。もし私がデータを用いて、あなたが対立仮説の世界を生きているということを納得させたなら、、、なんということでしょう、あなたはなぜまだデフォルトアクションを取ることを考えているのですか?その選択はここではよい選択ではありません。

もしあなたがデータから対立仮説の世界に住んでいることを納得させる場合、アクションをスイッチしましょう

能動vs受動

この意思決定の文脈において留意すべきことは、アクション(デフォルト/代替)は同じではないということです。あなたは頻度論者のように完全にオープンマインドでありますが、無知の下ではより賢く倫理的な方のアクションを取らないことを意味するわけではありません。それが鍵です。もし両方のアクションがあなたにとって同じなら、この記事を読んでください。

デフォルトアクションは受動的にそのアクションに陥っても大丈夫なものですが、代替アクションは積極的に実行するように説得する必要があるものです。

部分的な情報への対処

もし部分的なデータしか使用できない場合、あなたは不確実性に対処しなくてはなりません。それが派手な確率計算が入ってくる部分です。それは1文で表現され、毎回同じです。詳しくは次の章で触れます。

重要なことは、あなたが自分はどの世界にいるか、確実に知ることができないということです。そのため、デフォルトアクションを選択する際、あなたの価値観を忠実に反映する方法で行うことが重要なのです。どのようにチェックするか?仮説検定を正しく組み立てた場合、タイプⅠエラータイプⅡエラーより悪く感じるでしょう。別の言い方をすれば、

快適なゾーン(デフォルトアクション)を誤って離れること(タイプⅠエラー)は、誤ってそれ(デフォルトアクション)に固執する(タイプⅡエラー)よりも苦痛であると感じるはずです。

もしそうなっていない場合、あなたはどの行動がどれかについて正しく捉えられていないはずです。もう一度やり直しましょう!

不確実性から確実性を引き出す魔法はありません。

大声でアクションと叫ぶ

統計的な仮説を立てられるようになるためには、デフォルトアクションが何であるかを知っている必要があります。もし他の地点から始めたならば、すべてがバラバラになるでしょう。残念ながら、デフォルトアクションを間違って選択することは、哲学を全く学ばずに数学を学ぶ人々の間でよくある間違いです。またこれは、意思決定者が必要な行動をしておらず、数学オタクが一斉に動いているチームにある症状でもあります。

デフォルトのアクションを間違って選択することは、痛々しいほどよくある間違いです!

確実に失敗する方法は、アクションではなく仮説から始めることです。これは授業での演習の構成の痕跡です。(なぜなら統計の授業では意思決定者の役割は教えず、そのようなことはいつも教授がやってしまうからです。)

いつも、デフォルトアクションから始めましょう

もしあなたがこの考えについてのサンプルを必要としているなら、こちらをお読みください。統計的なニュアンスのない、基本的な事例が知りたい場合は、こちらをお読み下さい。