AI・機械学習を中心に

AI/機械学習/データ分析/子育て/日々の雑感

[翻訳]不完全性、デレゲーション、そして母集団

原文

Cassie Kozyrkov氏の記事より(2018/9/22)

medium.com

 

もしあなたが統計における母集団という概念になじみがないなら、まずこちらの記事を読みムードを合わせるとよいでしょう。簡潔に言うと、

  • あなたは”サンプル”という不完全な鍵穴を通してのみ、あなたの母集団について垣間見ることができる―このことに対処することは、ここでのすべての計算の目的です
  • 母集団とは意思決定者が意思決定を行うために選んだ関心の対象です
  • 機械学習/AIの設定においては、母集団はシステムが稼働する必要があるインスタンスとして定義されます

そのため意思決定者は自分の求める母集団の定義をしなればなりません。もしそれが馬鹿馬鹿しいものだとしたら?その時点であなたの中にいる統計専門家が腹を立てるのは良いタイミングではないでしょうか?いくつかの統計専門家が挙げる異議の申し立てを見てみましょう。

あなたの友好的な統計専門家の異論

異論1:それは意思決定者が関心があることではない

この設定で「関心がある」とは「意思決定を行う目的において関心がある」という意味です。おそらく別の言い方をすれば、「意思決定者が意思決定を行うベースとすることに同意するもの」でしょう。関心のある母集団を定義することを、ある種の”交渉”としてとらえると役立つ場合があるでしょう。

意思決定者は時に非常に野心的で包括的な関心から始めることがあります。そして、必要なサンプリングの値札を確認すると、一気に控えめで狭い”関心”に急速に後退することもあります。それは全く問題のないことです。大事なことは意思決定者が、彼らの意思決定が何に基づいているかを理解することと、穏便にショートカットや簡素化が行われることです。

 

異論2:意思決定者は実際の意思決定者ではない

意思決定をどのようにフレーミングするかにおいて責任を持っている人が誰なのかを知ることはとても重要です。なぜならその人がここで決定権を持つからです。もし、実際の意思決定者が統計のプロジェクトの外部にいる場合は、その人をプロジェクトに組み入れて下さい。実際の意思決定者を関与させて意思決定のフレーミングをすることが非常に重要です。

もし統計専門家が、真の意思決定者との交渉を回避した何かの事柄に取り組むように求められていると感じた時、その人(真の意思決定者)が意思決定の設定(問題設定)を承認するまで要求をブロックする権利があります。本当の意思決定者が時間と労力を割くことができない場合は、彼らは必要なスキルと知識を持った人に意思決定を委任(デレゲーション)する必要があります。

データを使用して人々を説得することが目標である場合、窓の外に統計的厳密さを捨て、代わりに小ぎれいなグラフを作成することもできます。

統計は意思決定を行うための一連のツールとして非常に理にかなっています。説得のための手段として使っている場合、認識論的な吟味にはあまり向いていません。その場合はアナリティクスに終始し、まずは母集団についてあまり気にする必要はありません。なぜならその時点ではインスピレーションのゲームなので。本質的には、あなたの目標は、あなたの被害者(意思決定者?)に代わってあなたが行った意思決定を、被害者が実行するように促すことです。彼らはいずれにしても本当の意思決定者ではありません(私は”データシアター”が始まる前に、本当の意思決定者が賢明な方法で意思決定をすでに下していることを願います)。

 リーダーよ、あなたが全ての決定をする時間がある振りをするのはやめなさい!デレゲーションする時が来ています!

シニアのリーダーたち、全ての個々の意思決定を下す時間がある振りをするのをやめましょう。あなたの注意を重要な意思決定だけに振り向けて、他はデレゲーションしましょう。あなたは、あなたの部下が下した決定をあなたに売るような茶番の一部になりたくはないでしょう。そして、あなたは部下が示す分析において何も選択的なものは含まれていないということに気づいています。数字は嘘をつかない?数字は都合の良いようにいくらでもつくり上げることができます。

 

異論3:意思決定の問題はそこに存在しない

意思決定者が、情報がどのように行動を促すのかを明確にできない場合(=下すべき意思決定の問題が明確にフレーミングできていない)、あなたが探しているアプローチは”アナリティクス”と呼ばれるものです(データマイニングとも呼ばれる)。統計ではありません。それは統計的推論ほどストレスフルなものではなく、色がきれいです。ここにより詳しく書いてあります。

意思決定の問題が存在していないのになぜ統計をやるのですか?異論4も考慮して下さい。

 

異論4:意思決定者が彼らが何をしているのかを良く知らない

意思決定者が彼らチームが何を求められているか理解していない場合、チーム全体が大きな問題を抱えています。

時に意思決定者が自分の技術にあまり熟練しておらず、自分が関心があることや、どのように意思決定をフレーミングするかに関して考える能力を欠いている場合があります。その場合、統計専門家を含む他のチームメンバーが後押しする必要があります。結局のところ、下流の作業は意思決定者のタスクが適切に完了することに依存します。したがってこの状態で完成されたアナリティクスはずさんで間違った問題に対する厳密な答えとなります。それはタイプⅢの過誤です。

もし意思決定者が適切なスキルを持っていない場合、プロジェクト全体の命運は尽きています。

なので、もしあなたがデータサイエンティストで新米の意思決定者の下で仕事をしているならば、悪いニュースがあります。あなたは、意思決定者に統計専門家の時間に見合う価値のあるリクエストを行うために必要な深い思考と厳密な意思決定の枠組み(フレーミング)のスキルを学ぶように促すという、ベビーシッターの役割に就任したのです。

現代のdecision intelligence和訳)チームはこの問題を異なる方法で解決することができます。意思決定者に意思決定のフレーミングのスキルを身に着けさせる替わりに、デシジョンサイエンティスト(定性専門家)翻訳)の役割を利用しましょう。

この人物は意思決定者のアシスタントとして従事し、意思決定者の思いを注意深く聞きつつたくさんの質問を投げかけ、意思決定者が考えていなかったようなシナリオを示しながら、すべてを厳密な表現と研究のデザインに翻訳することで下位のチームが活動できるようにします。

小規模なチームでは、優れた人的スキルを兼ねそろえたデータサイエンティストが、標準的な職務に加えてこの役割を担う可能性があります。一方で大規模な組織では、この役目は1人の定性専門家が複数の意思決定者を支援するフルタイムの仕事として従事している可能性があります。社会科学のバックグラウンド、特に行動経済学認知心理学のバックグラウンドはこの役割に適しています。

 

異論5:十分に具体的でない母集団の説明

曖昧さは許容されない。良いものがほしいのなら、努力してそれに支払うことを想定してください。

あなたの書き下した母集団の説明が「すべてのユーザー」に他ならない、としてしまうことは決して良いアイディアではありません。

もし私たちが厳密に決定を下そうとしていることに関し誰も明確にできていない場合、厳密さのポイントは何ですか?単なるインスピレーションでよいのであれば、それでよいでしょう。インスピレーションは安いですが、厳密さは高いです。もしいいものが欲しいのなら、努力してコストを払わなくてはなりません。