AI・機械学習を中心に

AI/機械学習/データ分析/子育て/日々の雑感

[翻訳]アナリティクスの性質 Part1/2 ~アナリストはストーリーテラーではない~

要点抜粋

  • データサイエンスの3本柱の1つがアナリティクス
  • アナリストには分析対象に対するドメイン知識が非常に重要
  • 新しいドメインに取り組む際には、ドメインについてよく知っていて気軽に聞ける人(domain guru)をアナリストは求めた方が良い
  • アナリストはデータで説得する、ストーリーテリングの手法は行うべきではない。意思決定者が意思決定や仮説構築を自ら行えるような情報を正確に伝えるべき(≠マーケティング、ジャーナリズム)
  • マーケティング、ジャーナリズムが意思決定者の視点を狭めるのに対し、アナリティクスは広げる
  • アナリティクスはアナリスト自身の意見に意思決定者を誘導すべきではない
  • 意思決定者は決定する権利を放棄したくないからアナリティクスを雇う。アナリストはその意思を尊重するのが義務。たとえ意思決定者よりドメイン知識を多く持っていたとしても。
  • どのようなツールを使おうと(データ処理だけでなく、図書館、検索エンジン含め)、意思決定者に有用なデータを提示する限りそれはアナリティクス
  • アナリティクスはどれだけ早くインスピレーションにたどり着けるかのゲーム。意思決定者についてよく知り、意思決定者の時空間的制約、状況を踏まえた適切な選択肢に絞り調査し時間を節約する
  • 意思決定者やその課題、プライオリティについて何も知らずに分析を行った場合、インスピレーションを引き出すのは困難。結局万能のジャーナリズムに従事しきれいな筋書きとストーリーテリングで補おうとするが、それでは問題解決に至らない

原文

Cassie Kozyrkov氏の記事より(2019/10/31)

towardsdatascience.com

典型的なアナリティクスの授業では何を学びますか?通常は分析ソフトウェア(R/Python/SQL/SAS/Stata/MATLAB/BigQuery/Tableau/Looker...)の基本を学び、ソフトにどのようにデータをロードするか、円グラフや棒グラフをどのように書くかなどを学ぶでしょう。

しかし、それは芸術にとっての絵筆のようなもの。これは見栄偽りの無いアナリティクスの特性を理解するための、ハロウィーン風の記事です。

ドメイン知識が重要

これまでハロウィーンを祝ったことがないのに、今夜ハロウィーンパーティーに参加するように言われたと想像してください。あなたは衣装を決める意思決定者で私はあなたのアナリストになります。私は熱心なハロウィーン好きとして、関連するドメイン知識がにじみ出ています。

ドメインの専門知識はアナリストにとって非常に重要で、専門知識が無い場合には、苦労してでも取得した方がいいでしょう。ハロウィーンを聞いたことがないアナリストは、コスチュームを選ぶのを手伝う能力が大幅に失われます。彼らはおそらく、何を見ているのかわからないので、ありとあらゆる有用なデータを見落とします。アナリストが「私が話しかけられるドメインを良く知る知人(domain guru)はどこかにいますか?」と尋ねずに新しいドメインに入っていくのはアナリストとして悪い兆候です。

アナリストはストーリーを語ることができるが、ストーリーテラーではない

一般的に信じられていることとは対照的に、アナリストの役割は”ストーリーを語る”ことでも、データで説得することでもありません。それはマーケティング(もしくはジャーナリズム)と呼ばれます。

全ての大人の人生において、利害関係者に自分たちを評価してもらい、自分たちが望んでいることを実行してもらうために、自分たちの仕事を売り込まなくてはならない時が来ます。しかしそれについてはまた別の機会に話しましょう。確かに優れたアナリストは人間の興味を良く知っており、聴衆を操作することができますが、それはキャリアの副産物です。ストーリーを語ることができるのはアナリストが持つ必要のあるスキルですが、彼らの仕事は別物です。

アナリティクスはマーケティングではありません。違いは、前者は意思決定者の視点を拡大し、後者は狭めます。

ハロウィーンの話で言えば、アナリストである私の仕事は、昨年私が着て回ったゴキブリスーツを着るようにあなたを説得することではありません。私はエイプリルフールと誕生日を合わせたよりもハロウィーンを楽しんでいるので、衣装に関しては必然的にいろんな意見を持っています。

私はオタクが大好きです。コスチュームが概念的であいまいであればあるほど、私は好きです。1年に仲間の変人が大笑いしてくれることが、私のやりがいです。

しかし、このプロジェクトはあなたの好みに関するものであり、私のものではありません。アナリストとしての私の役割は、私がすでに行った結論に向けてあなたを操作することではありません。ここでは私の意見は重要ではありません。。。あなたが私にあなたのために衣装を選ぶことを好まない限り。その場合は意思決定を私に委任して、私はアナリストから意思決定者に代わることになります。

アナリストは”目”として従事する

アナリストとして私はあなたに何も売るつもりはありません。私はあなたの目であり、1分あたりできるだけ多くのインスピレーションをあなたが得られるようにします。そもそもアナリストが必要な理由というのは、データをざっと見て回る時間が無いけれど、それでも決定権を行使する人になりたいからです。このシナリオにおいては、私はあなたより多くのドメイン知識を有しているかもしれませんが、それは必ずしも私が選んだ衣装に同意する必要があるというわけではありません。あなたは自分に代わって決めるためではなく、よく見えるようにするために私を雇ったのです。あなたは選択する権利を放棄したくないのですから、それを尊重するのが私の義務です。これがアナリティクスが意思決定やマーケティングと大きく異なる点です。

意思決定者が選択する権利を放棄したくない場合、それを尊重するのがアナリストの義務です。たとえアナリストが意思決定者よりもドメイン知識を多く持っていたとしても。

私がマーケティングストーリーテリングのアプローチを採用した場合、私はあなたの選ぶ可能性の幅を狭めるでしょう。優れたアナリストはその逆を行い、様々な視点を素早く示します。理想的には、あなたがもし自分で時間をかけてやっていたら見ていたであろうデータに加えて、あなたが見るべきと知らなかった有用なデータまでも示すことを手伝います。

ツールは目的を達成するための手段

 ハロウィーンの情報はいたるところにあるので、アナリストの仕事はそれを見つけて調査し、あなたのためにフィルタリングして、最も有望な情報をできるだけ早く吸収できるようにすることです。

R、SQLC++、図書館職員、または検索エンジンを使用しようが、それ全てアナリティクスです。データの性質と、その”知は力なり”という格言との関係性についての私の考えは、ここにあります。

意思決定者の時間を無駄にしないようにしてください

エキスパートのアナリストはスピードを高めることに真剣に取り組んでいます。それは単純に素早く指を動かすことにとどまりません。私はあなたの時間を無駄にしないよう努力すべきです。情報をスライスして表示する方法は無数にありますが、あなたのパーティーは今夜です。数カ月前に注文する必要のある刺激的な手の込んだ衣装をあなたに見せびらかすのは、非常に愚かな行いです。

私はあなたの時間的空間的状況を理解する必要があります。それにより私はあなたが物理的に行くことができるコスチュームストアや、除外すべき配送オプションを絞り込むことができます。予算についても聞く必要があります。あなたの予算が足の爪だけならば、腕と脚に向けた服装についての情報はあなたの時間を無駄にすることになります。

もしかするとあなたが予算を考え直すかもしれない可能性に備えて、1つか2つの高価なオプションを示すかもしれません。

このゲームの名前は”Speed-to-inspiration”です

データとあなたの好みについて知れば知るほど、あなたが可能な選択肢を吸収し理解するのを助けやすくなり、その結果より早くインスピレーションを得ることができるようになります。

アナリストとして私は、あなたに私の意見に向けさせるためにいるわけではなく、あなた自身の意見を形成するためにいるのです。

あなたの状況について知ることは、あなたにとって重要なことに私の調査を絞ることに役立ちます。屋内のダンスパーティーならば、人の目をえぐる可能性のあるハリネズミのコスチュームは向いていません。北極圏を通るパレードなら、暖かくて分厚いコスチュームに制限します。仕事のパーティーなら、Sexy Bayesian Posterior(重い金属のマルコフチェーンがたくさんついている)ような服装は見せないようにします。

もしあなたがたくさんの情報を私にくれなかったら、私は自力でやります。私はあなたの所在地から最も近い3つのコスチューム店とその営業時間のリストを作ります。いくつかの商品に基づき各店舗の相対価格を作ります。私は典型的なアメリカのハロウィーンストアは靴を除いたほとんどすべてのものが手に入るという情報を伝えます。

私は友人にアンケートをしてコスチュームの色についての円グラフを作ります(これにより、あなたは全体に溶け込みたいか、目立ちたいかによってどんな色を選べばいいかわかります。ただ調査はあなたの友人には全然あてはまらないかもしれませんが。)

私はハロウィーンの費用と、自分でコスチュームを作るのにかかる時間と、コスチュームを買うのにかかる時間についての情報を探すことができました(1000人の未知のアメリカ人に対する調査に基づいています。彼らはコスチュームづくりのエキスパートであるかどうかはわかりません。あなたが良く知らない出所のデータには注意してください)。

f:id:eureka-me:20210721152543p:plain

引用

 

f:id:eureka-me:20210721152805p:plain

引用

私はカテゴリと例の組み合わせのリストを示し、あなたにインスピレーションを与えることもできるでしょう。モンスター(バンパイア)、動物(トラ)、職業(宇宙飛行士)、人(ジャンヌダルク)、マンガのキャラクター(ベンダー)、概念(シグマフィールド)、絵画(ムンクの叫び)、食べ物(ニンジン)、物体(パンチカード)など。

Googleトレンドでハロウィーンに付随する最も人気のあるキーワードを調べて、支配的なカテゴリが何かを確認できます。すでに親切な仲間がこれを行っており、いかにリストを作成しています:フォートナイト、スパイダーマン、ハーレークイーン、ワンダーウーマンブラックパンサーデッドプールハリーポッターキャットウーマン、ペニーワイズ、キム・カーダシアン。どうやらポップカルチャーが主流のようです。

さらに一歩進んで、あなたの地域のこのようなリストを作成し、相対的な人気をプロットすることもできます。しかし時間はかぎられており、おそらくそれはあなたが気になることではないでしょう。細かな人気情報が何等か役立つ可能性がある場合のみ、実行する価値があります。しかし、大まかに言うと、上記のリストはハロウィーン初心者がポップカルチャーの衣装を探しているという印象を与えるのに十分です。

私はこのポイントで、初心者のアナリストがパニックに陥っているのを見てきました。彼らはデータをざっと眺めていて、明らかに宝石のように見えるものを見つけていません。悲しいことに、限りなく美しくデータをプロットしても、だれも気付かないかもしれません。ゴミを磨かないでください。それは時間の無駄です。

目の前の仕事に戻り、

さらに奇妙なことに、AIで生成されたコスチュームの提案を見ることもできます。

できるだけお金をかけないことを目指すなら、一番安い規制の衣装を探すこともできます。オンライン店舗をざっと見ると、マントとマスクを10ドル未満で購入することができるらしいので、実店舗でこれらと同じアイテムを確認することをおすすめします。また古着屋でビンテージの服を探し、安いアイシャドウと口紅でゾンビのDIYもすることもできます。

私は好奇心の雑多な光に惹かれて、軌道(今年のハロウィーン)から外れ始めるかもしれません。例えば、いつ人々はハロウィーンの準備をし始めるかなど。これは今年のハロウィーンには関係ない情報かもしれませんが、とにかく私は可視化しました、、、あ!リス!

あなたがドメインの専門知識が重要であることに気づき始めているということを願っていますが、しかし私の意思決定者のビジネスのことを知らなければ、どのような情報を示すのがよいかを推測するのは困難です。私はあなたが知りたいことを推測しようとして、あらゆる方向に走り回ることに多くの時間を費やすことになります。

アナリティクスの授業を受講する場合、通常最も重要な要素である”意思決定者との関係性”が欠けています。データジャーナリズムの方が教えるのが簡単なので、それをあなたは学んだかもしれません。それもストーリーテリングに重点が置かれます。

データジャーナリズムは特定の個人が意思決定を行うのを支援することではありません。それは大衆に対して情報を提示してアピールすることです。実際にはそれはアナリストがプロジェクトにもたらすオーダーメイドのものとは正反対です。

誤解しないでください。万能のサクセスストーリーには美しいものがあります。それは口コミで広がり、多くの人に小さな明かりを示します。しかし、それが完全に衝撃的なニュースでない限り、それは意思決定者の人生を少し変えるだけでしょう。かたや熟練したアナリストが提供できるものは、リーダーとそのビジネスの飛躍を可能にするインスピレーションです。

意思決定者について、また意思決定者の課題とプライオリティについて何も知らない場合、インスピレーションを引き出すのは困難です。あなたは結局のところ、万能のジャーナリズムに従事しようとし、きれいな筋書きとストーリーテリングで補おうとします。それでは根本的な問題を解決しません。アナリティクスは反復的、つまりはアナリストと意思決定者の会話がある時、価値が付与される機会が増えます。パート2では、反復的なアナリティクスのワークフローについて説明します。