AI・機械学習を中心に

AI/機械学習/データ分析/子育て/日々の雑感

[翻訳]データサイエンスリーダー:あなたたちは多すぎる

原文

Cassie Kozyrkov氏の記事より(2018年6月1日)

towardsdatascience.com

 

データサイエンスは実際いくつかの問題を抱えています。しかし、まず初めにある一つの問題から見ていきましょう。それはリーダーシップです。

本日、私はデータサイエンス(機械学習、AI、統計、データサマライゼーション、ビジュアライゼーションを含む領域)のリーダーの前で話しています。本日のデータサイエンスチームを率いている輝かしい先駆者たちの顔を見て思うことがあります。それは「あなたたちの数が多すぎる」ということです。

何ということか!データサイエンスの人材不足が酷いのだから、そのリーダーシップにおける人材不足はもっと酷いのではないか、と言うでしょう。

今日におけるデータサイエンスリーダーのほとんどは、私が”transcended data scientist(超越したデータサイエンティスト)"と呼んでいる方々です。科学、工学、または統計学の公式なトレーニングを終えて、奇跡的にある日、自分たちのために数学的な複雑さを追求するよりもデータを有効活用することに興味を持った方々です。

データサイエンスリーダーは、あらゆる可能性に逆らった存在です

データサイエンスのリーダーは、あらゆる可能性に逆らった存在であるため、あなた方の数は多すぎます。あなた方はほぼ何もトレーニングされてこなかったので、あなた方は値するより多く存在してしまっています。どうしてこのような幸運なアクシデントが起きたのでしょう?誰もあなたにあなたがすべきことをどのようにするかを教えてこなかったので、幸運にも存在してしまっています。10年以上数式を勉強した後、どのようにリーダーシップをとるか、どのように良い意思決定をするのかを勉強する予定でしたか?私のSRE(Site Reliability Engineering)の同僚が言うように、「希望は戦略ではありません」。

そこにはあなたよりもっとたくさんありますが、あなたの計画は?

もしあなたが定理が好きならば、定理はこうです:時間は有限です。なのでもしあなたがファインマンやデフィネッティを学ぶために時間を費やしているならば、他のスキルを構築するために多くの時間を費やすべきではありません。私たちはデータサイエンティストに、即座に良いリーダーや意思決定者になることを知ることを期待することはできません。誰がそれを彼らに教えるのですか?一日中分析コードを書いたり定理を証明することでリーダーシップを学ぶことはできません。

替わりに、よいリーダーや意思決定者になるためには、彼らの萎縮した筋肉の弱さを認識する謙虚さと、2番目の技術を習得するための勤勉さが必要なのです。彼らがその難しい事柄を学んでいる間、時に打撲傷を負うこともあるでしょう。確率論がこの宇宙で最もホットなモノであると考え出した人間として、私はこれがどれほど苦痛であるかを知っています。

そこには態度の問題があります。私たちは本当にそのスキルに価値を置いていますか?

もしあなたの経歴が私と似ていたならば、あなたは”数学礼賛の"サブカルチャーの中で育ったかもしれません。そこでは「ソフト」スキルのような臭いがするものに対して軽蔑を示す風潮があります。ある定理を証明したり、第6番目の言語でコーディングしたりして一晩中起きていることにどれだけ熱心であるかに対し胸が高鳴ります。あなたがそのカルチャーにどっぷりはまっているとき、あなたはリーダーシップ(またはコミュニケーション、ビジネスセンス、クリエイティビティ―、共感、などなど)を大切にすべきだと思わないかもしれません。そして、あなたのクラスメートはもしあなたがそのような「ソフト」スキルに走ったらあなたを尊敬すると思いますか?

私はそれらを「ソフト」スキルと呼ばず、「自動化することが最も難しい事柄」と呼びます

解決の糸口はこれらのスキルが生のデータサイエンスのように魅力的なもので、ハードコアであることに疑いのないものであるという風に風潮を変えることです。もし”気取っていること”が若者にとってなくてはならない場合には、少なくとも両方の種類の筋肉が使えることが最高の名誉であることを彼らに納得させましょう。結局のところ、それは事実です。

ハードルは高く、その仕事についている人全員がそれを満たしているわけではありません

データサイエンスのリーダーシップは、単に学期の成績がトップクラスであることのリーダーシップではありません。意思決定やいかに情報が行動をドライブするかについて深い理解を持っているだけでなく、特定のビジネスドメインに効果的に影響を与える方法のニュアンスに鋭敏な嗅覚が必要であり、大規模なデータサイエンスプロジェクトを成功させるために連携する必要のある多様なスキルのエコシステムについても理解が無くてはなりません。そしてそれは、このゲームに参加するための最低限のことです。

これは非常に高いハードルで、データサイエンスチームをリードするすべての人がそれをクリアしているわけではありません。雇用主の皆さん、データチームを率いるための本物の人物を採用しているかどうかをどのように知ればよいのでしょう?もしあなたのデータサイエンスチームがすでに悪いリーダーシップを発揮してしまっていたら?どのようにそれを判別しますか?あなたの頼れるこの役割に対する知恵はほとんどありません。誰に質問すればよいのでしょう?

データサイエンスはバブルか?

今日、世界ではいまだかつてない量のデータが生成されています。しかし、私は時に「データサイエンスはバブルでしょうか」というような質問を受けます。私は信念をもってそれに「絶対に違います」と答えます。真実は、「場合による」です。残念ながら様々な業界の方と会話すると同じ話を聞きます。「我々のデータサイエンティストチームは使えない。彼らは論文を出すことばかりを考えている。」私たちはこのあまりにも一般的な現象を防ぐことができるような有能なリーダーを獲得することができるのでしょうか。もしデータサイエンティストが自分たちが価値があることを証明できなければ、彼らがその仕事に就くことは長くはないでしょう。

新鮮な香りのする科学のPhDがビジネスに有意義に貢献する方法を知っていると期待するのは不公平でしょう。それは長年かけて彼らが学んできたことではないからです。データサイエンスの内容を理解しており、データをビジネスとをつなげる方法を知っている人からの支援がなければ、彼らにとって不利な条件でしょう。データサイエンスがバブルでないことを確かなものにするために、今すぐに特別なリーダーシップが必要です。それはどこからくるのでしょう?

データサイエンスリーダー向けトレーニングプログラムはどこにあるのか?「希望」は「戦略」ではない

皆さん、私たちは幸運であることに感謝しましょう。いくらか良いデータサイエンスリーダーは存在し、スキルはそこにあります。おそらく苦痛を伴って1つずつ獲得されたスキルであり決して効率的に獲得されたものではありませんが、それでも正しいスキルです。私はあなた方が私と同じように緊急性を感じていることを願います。困難な方法で学んだ一部の人間が、よりよい方法で他の人にトレーニングすることを始めなくてはなりません。

私はその一人として自分の役割を果たすことにコミットしています。私はGoogleにて、データサイエンスの実際に問題への適用にフォーカスを当てたチームの一員として効果的にチームリードし働く立場の、新しい種類の「思想家」を育てることに取り組んできました。正しいスキルを構築するため、データサイエンスとエンジニアリングからアイディアを取り入れ、行動科学と経営科学でそれらを強化しました。共通のコアが理解されるまでそれは学際的なものにしか見えません。その共通のコアが「意思決定とそれをドライブする情報」です。それが私たちがDecision intelligenceと呼んでいる理由です(もしあなたが好みなら応用データサイエンス++と呼んでもよいですが)。

新しい種類の「思想家」(=データサイエンスチームを成功に導くスキルを持った意思決定者)を育てよう

私はデータサイエンスはチームスポーツであると常々考えていて、スキルの多様性によって恩恵が得られると考えています。そのため、私はトレーニングプログラムに様々なバックグラウンドの人の参加を奨励しており、実際参加可能にしています。わかってきたことは、優れたデータサイエンスリーダーは必ずしも超越したデータサイエンティストである必要はないということです。

私たちはGoogleの社員の中でこうしたスキルを育成する中で達成したことを誇りに思います。しかしそれだけでは十分でありません。同じスキルを身に着けるために、他のすべての人が「幸運なアクシデント」や複数領域への完全な没頭に取り組む必要なないのです。これを読むことで、データサイエンスの意思決定者の技術を知る人を数人でもインスパイアし、私たちの知恵を広く共有することに参加するきっかけとなることを願っています。

[翻訳]優れたデータアナリストがしていること

サマリ

  • 機械学習(machine-leaning)、統計(statistics)、アナリティクス(analytics)は、”フルスタック”データサイエンティストの3本の柱
  • 機械学習、統計の卓越性がそれぞれ性能、厳格さであるのに対し、アナリティクスはスピード
  • 機械学習、統計はどちらも狭くて深い仕事であり、掘る穴を間違えると大きなリソースとコストの無駄が生じる恐れがある
  • アナリティクスは機械学習、統計のスペシャリストに依頼する価値のある探求課題(仮説)を意思決定者に発見させるのに役立つ
  • 意思決定のためのアナリティクスでは、アナリティクスの結果のうち意思決定に有望であると判定された仮説に対し、厳密な分析を行うために統計的分析を行う。つまりアナリティクス→意思決定者の判断→統計(アナリティクス→統計ではなく、意思決定が挟まる)
  • 機械学習/AIのためのアナリティクスでは、機械学習に一度に突っ込むには多すぎるデータをフィルタリングするためにアナリティクスを実施する
  • AI/データ分析PJでは、機械学習、統計よりも先にまずアナリティクスができる人材を雇え

原文

Cassie Kozyrkov氏の記事より(2018年12月4日)

hbr.org

 

フルスタック」データサイエンティストとは、機械学習(machine-learning)、統計(statistics)、アナリティクス(analytics)に精通していることを意味します。AIや機械学習が雇用市場から求められるようになったこともあり、今日のデータサイエンスには若干のSF的性質を持ちつつ派手で洗練された風潮があります。その対抗馬として統計がありますが、こちらは1世紀にもわたる厳格さと数学の優位性に対する評判の恩恵を受けています。一方でアナリティクスはどうでしょう?統計の卓越性が厳格さであり、機械学習の卓越性が性能であるのに対し、アナリティクスの卓越性はスピードが全てです。アナリティクスにより初めに仮説を思いつきます。アナリストが成熟すると、何が興味深いかではなく、何が重要かを判別するコツをつかみ始め、意思決定者が仲介者の役割をしなくてよくなります。これら3つのうち、アナリストが最も「意思決定の王位の継承者」として可能性が高いです。

二流市民としてのアナリティクス

もしあなたの主要なスキルがアナリティクス(またはデータマイニング、ビジネスインテリジェンス)ならば、企業や雇用市場、メディアで機械学習や統計がもてはやされるようになったことで自信が揺らいでいるかもしれません。

初心者の方があまり理解していないこととして、データサイエンスの傘の3つの専門性は互いに全く異なるということです。彼らは類似した数式を用いるかもしれませんが、類似性はそれ以上はありません。アナリストは他の2つの専門性のエキスパートと全く劣ることなく、むしろよいアナリストがいることはデータを用いた取り組みにおける前提条件です。もしあなたが彼らを過小評価するならば彼らは退職してしまうでしょう。それはあなたにとって最も危険なことです。

アナリストに対し機械学習のスキルを高めるよう言うのではなく、まず自身の専門性を高めることを促すようにしましょう。データサイエンスでは1つの分野での卓越したスキルを有することは、2つの分野で凡庸なスキルを有していることに勝ります。では、データサイエンスを構成する専門分野において真に優れているとはどういうことかを1つ1つ見ていきましょう。それらがどのような価値をもたらし、どのような個性がそれぞれの仕事で生き抜くために求められるのか。そうすることでアナリストがいかに価値があり、どのように組織が彼らを活用すればよいかが見えてくるでしょう。

統計の卓越性:厳格さ

統計学者はデータから安全に結論を出す専門家です。彼らは不確実な世界でだまされないための最良の防衛線です。彼らにとってはずさんな推測をすることは、何も知見を得られない事よりも罪なことです。優れた統計学者には、あなたの熱狂にブレーキをかけてくれることを期待できます。

得られる成果は?リスクコントロールされた状態でリーダーが重要な意思決定を下すのを手助けするような”視点”です。別の言い方をすれば、彼らはデータからあなたが賢明でない結論を下す可能性を最小化してくれます。

機械学習の卓越性:性能

「99.99999%の精度でテストをパスするモデルなんて作れないだろう」という言葉掛けに対する回答が「やって見せるから、見てろ」ならば、その人は応用機械学習/AIエンジニアでしょう。機械学習スペシャリストは、プロトタイピングと稼働システムの双方に向けたコーディングスキルを有しつつ、彼らは教科書には完璧な解決策は乗っていないということを理解しています。その代わり、彼らはトライ&エラーのマラソンに従事してくれます。それぞれの新しいオプションを試すのにどれくらいの時間がかかるかに対し優れた直観があることは、アルゴリズムがどのように機能するかについての詳細な知識よりも価値があります(もちろん、両方持っていることがよいですが)。性能というのは単に指標をクリアすることだけではありません。本番環境で動作可能な、信頼性があり、拡張性があり、保守が容易なモデルであることを意味します。エンジニアリングの卓越性は必須です。

得られる結果は?統計学者の要求する厳しいテスト基準をクリアし、ビジネスリーダーが要求する大胆なパフォーマンスを実現する、トリッキーなタスクを自動化するシステムです。

広さか深さか

前の二つの役割に共通しているのは、どちらも特定の問題に対して手間のかかるソリューションを提供することです。彼らが取り組む問題に解決する価値がなければ、彼らの時間とあなたのお金が無駄になります。ビジネスリーダーの間でよく聞く悩みは「我々のデータサイエンスグループは役に立たない」です。そして、その問題の根底には、アナリティクスの専門知識の不足があります。

統計専門家と機械学習エンジニアは「狭くて深い」仕事をする人です。まるでウサギの穴の形ように。そのため、彼らの努力に値する問題を指定することが非常に重要です。彼らエキスパートが間違った問題を注意深く解いている場合、あなたのデータサイエンスに対する投資はほとんどリターンを産まないでしょう。「狭くて深い」仕事をする専門家たちをうまく活用するには、すでに正しい問題をとらえていることの確証を得るか、問題を見つけるための「広く浅い」アプローチが必要です。

アナリティクスの卓越性:スピード

最高のアナリストは大量のデータセットを素早く扱える、超速コーダーです。他の専門家がホワイトボードを要求するより早く、潜在的な洞察を発見し表面化します。彼らのおよそずさんなコーディングスタイルは、従来型のソフトウェアエンジニアを困惑させます。スピードは彼らの最高の長所であり、それに続いて潜在的に有用な”宝石”(気づき)を特定する能力が来ます。また、情報のビジュアルプレゼンテーションに習熟していることも役立ちます。美しく効果的なグラフは情報を早く抽出することに役立ち、結果として潜在的な洞察をより早く得ることにつながります。

得られる成果は、”企業がそれ自身の動向を把握し、これまでは知られていなかった事柄に対し目を向けられるようになること”です。これにより得られる示唆は、意思決定者に統計専門家や機械学習エンジニアに依頼するための価値ある探求課題を選択することに役立ち、彼らスペシャリストが「数学的に印象的だが役に立たないウサギの穴の掘削」をしてしまうことから救うことができます。

ずさんなナンセンスか輝かしいストーリーテリング

「しかし、アナリストの”インサイト”のほとんどはナンセンスです」と統計専門家は反対します。つまりアナリストの探求から得られるものはノイズだけを反映している可能性があるということです。しかしおそらく話には続きがあります。

アナリストはデータのストーリーテラーです。かれらの使命は興味深い事実を集約し、示唆を与えるためにデータを使用することです。ある組織ではこれらの事実と示唆がそのまま意思決定者にとってのインプットになることがあります。しかし、より洗練されたデータの運用においては、データドリブンな示唆は適切な統計的フォローアップに向けたフラグがつけられます。

よいアナリストは「データを超えた結論を出すな(そして、オーディエンスにもさせるな)」という黄金律に対しゆるぎない敬意を持っています。優れたアナリストを見分ける1つの方法は、彼が柔らかく、断定的でない表現を使うかどうかです。たとえば、「私たちはこう結論付ける」ではなく、「私たちはこのように不思議に思うようになった」のように。彼らはまた、それぞれの示唆に対し可能性のある解釈を複数強調することによって、リーダーの自信過剰を思いとどまらせます。

アナリストが「このような結果が出ています」というだけで事実の報告に執着している限り、あまりそれを重く受け止めないでください。彼らが冒す最大の失敗は、だれかの時間を無駄にすることです。

仮説を検証するには統計スキルが必要ですが、最初に仮説を立てるにはアナリストの助けを借りるのが最善の策です。例えば、彼らは「これは相関に過ぎませんが、これは~によって引き起こされている可能性があります」などと言ってなぜそう考えるかを説明するかもしれません。

これには、データの背景で何が起こっているのかについての強い直観と、統計専門家を働かせることを正当化するのに十分重要な仮説かどうかを判断する意思決定者に選択肢を伝えるコミュニケーションスキルが必要です。アナリストが成熟すると、何が興味深いかではなく、何が重要かを判別するコツをつかみ始め、意思決定者が仲介者の役割をしなくてよくなります。

これら3つのうち、アナリストが最も「意思決定の王位の継承者」として可能性が高いです。対象分野に対する専門知識はより早くデータから興味深いパターンを見つけ出すことに役立つため、優れたアナリストはドメインに精通することに真剣に取り組みます。これを怠るとレッドフラグが立てられます。アナリストの好奇心によりビジネスに対する感覚を養われていきますので、誤報の寄せ集めのような報告から、注意深く集められた意思決定者が興味を持ちそうな報告内容へとシフトしていくことを期待してください。

意思決定のためのアナリティクス

無駄な時間を省くため、アナリストは自分の伝えたい内容に合わせてストーリーを組み立て、意思決定者のところへ出す前にその内容が筋道が通るかの詳細な確認に向けて事前にいくつかの観点でチェックしておく必要があります。この時意思決定者は探索的データ解析と統計的厳密さの間のフィルターとして機能する必要があります。もし意思決定者の誰かが、アナリストの調査結果が彼らの意思決定に対し有望であると気づいた場合、次に、より厳密な分析を行うために統計専門家がより厳密な分析をすることを承認します。(このプロセスは、なぜアナリストに統計スキルを身に着けるよう指示することだけが、重要なポイントを見逃しているかを示しています。2つの活動が分離していることに加えて、別の人がその間に存在しているのです。つまり、1人の人が両方のことを行うのが必ずしも効率的とは限りません。)

機械学習とAIのためのアナリティクス

機械学習スペシャリストは大量の潜在的な入力データを準備し、パラメータ設定を微調整し、適切な出力がされるようになるまでイテレーションを続けます。ここにはアナリティクスの要素はないように聞こえるかもしれませんが、実際にはビジネスの現場においては、一度にブレンダーに突っ込むにはあまりにも多くの材料があります。一つの有用な入力セットのフィルタリングの方法はドメインの専門知識です。事象がどのように振舞うかについて人に聞くということです。もう一つの方法がアナリティクスです。料理のたとえを出すと、機械学習エンジニアはキッチンを使いこなすのは得意ですが、彼らは実際には大量の食材でいっぱいの巨大で暗い倉庫の前に立っています。彼らは枕闇の中無計画にそれらの食材をつかんでキッチンに持っていくか、それともまずライトがついたバンで最初に倉庫内を回るか、です。アナリストはそのバンです。彼らの素早くここに”何があるのか”をまとめて伝える能力は、機械学習のプロセスにおいてとても重要です。

アナリストを過小評価することの危険性

優れたアナリストは、機械学習エンジニアの粗雑なバージョンではありません。彼らのコーディングスタイルはスピードに最適化されており、目的に沿っています。まして彼らは悪い統計専門家でもありません。なぜなら彼らは不確実性を扱っておらず、事実のみを扱っているからです。アナリストの主な仕事は次のように言うことです。「データの内容はこの通りです。私はこれが何を意味するのかを話す役割ではありません。統計専門家に質問を投げかけるように意思決定者に示唆を与えることです。」

もし機械学習と統計に採用と報酬を偏らせすぎると、アナリストを失うことになります。誰が彼ら(機械学習エンジニア、統計専門家)がどの問題を解決するのが価値があるのかを理解することを手伝ってくれるのでしょう?有用性の乏しいプロジェクトにアサインされた惨めなエキスパートたちとともにあなたは取り残されてしまうでしょう。データは役に立たないまま無造作に転がっている状態になります。

疑わしい場合は、他の役割よりも先にまずアナリストを雇ってください。彼らに感謝し、報酬を与えてください。彼らが選んだキャリアを向上させるように励ましてください(他の誰かのキャリアではなく)。この論考で言及されているキャスティングの中で、すべてのビジネスにおいて必要なのは意思決定者とアナリストだけです。それ以外のキャストが必要になるのは、あなたが彼らが何のために必要なのかをはっきりと把握している時だけです。アナリティクスから始めよ。そしてあなたの目の前にある潤沢で美しい情報に目を向ける新たな能力を誇りに思ってください。データドリブンなインスピレーションは強力なものです。

 

[翻訳]AIとデータサイエンスの10の役割

サマリー

  • AI/データ分析PJのメンバーの増やす順序は、データエンジニア→意思決定者→アナリスト(一般/高度)→統計専門家→機械学習エンジニア
  • オプショナルとしてデータサイエンティスト、分析マネージャー、定性専門家、研究者
  • データサイエンティストとは高度アナリスト+統計専門家+機械学習エンジニアのハイブリッド(レア人材)
  • 分析マネージャーはデータサイエンティスト+意思決定者のハイブリッド(最強人材)
  • 定性専門家は社会科学とデータのバックグラウンドをもち、データと意思決定の橋渡しのトレーニングを受けた人材であり、意思決定者のサポート役
  • 研究者は最後の手段
  • その他、ドメインエキスパート、倫理専門家(AI倫理)、ソフトウェアエンジニア、UXデザイナー、信頼性エンジニアなどもポイントで必要
  • プロジェクトのステージと、目指すシステムの規模を踏まえ、徐々にチームを大きくする

原文 

Cassie Kozyrkov氏記事より(2018年7月27日)

hackernoon.com

はじめに

応用データサイエンスは、非常に学際的なチームスポーツです。視点の多様性が重要!あなたがデータを活用した意思決定アプローチを実施しようとしている場合において、私が考えるチームを成長させる順序は以下の通りです。

#0 データエンジニア

もちろんデータが無ければ始まらないので、まずデータを取得する能力が必要です。もし、小さなデータセットを扱う場合には、データエンジニアリングはスプレッドシートに数値を入力するだけです。もしそれなりの規模のデータを使用する場合、データエンジニアリングはそれ自体が洗練された分野になり、チームの誰かが、メンバーの使用するデータを提供するというトリッキーな作業を担うことになります。

#1 意思決定者

PhDのデータサイエンティストを雇う前に、データドリブンな意思決定のアートとサイエンスを理解した意思決定者がいなくてはなりません。
チームがデータから価値を引き出すためには、意思決定スキルがまず先になくてはなりません
この人が以下のような判断をすることが求められます。

  •  その決定/判断がデータに基づいてなされる価値があると特定する
  •  決定/判断をフレーミングする(メトリックのデザインから、統計的仮定の采配を取ることまで含め)
  •  ビジネスに与えるインパクトに基づき、分析の厳格さに求められるレベルを決定する

「おっと、それは考えていなかったな」と決して言わないような、深い思考ができる人でなければなりません。

#2 アナリスト

次は、あなたと一緒に働いている皆さんです。皆、データを見て感銘を受ける資格があります。もしあなたがデジタルの写真を見たことがあるならば、あなたはすでにデータ可視化と分析をしているのです。RやPythonはデータ可視化のためのツールのアップグレードに過ぎません。
気を付けなくてはいけないことは、データを超えて判断を下してはならないことです。湖畔に映る黒い影の画像を見たからといって、ネッシーが実在すると判断してはなりません。

#3 高度アナリスト

次に超高速バージョンを導入してください。この人物はデータをより早く見られる人物です。ここでのゲームはスピード、探索、発見、、、面白さです。(「分析」の別の用語は「データマイニング」です。)この役割は厳密で注意深い結論を下すことではなく、意思決定者がより注意深く追求する価値があることを理解できるように、あなたのチームがデータにより多く目を向けるのを手助けする人です。
ここでの仕事はスピードであり、潜在的な洞察にできるだけ早く遭遇することです。
直観に反するかもしれませんが、立派で堅牢なコードを書くようなエンジニアにこの仕事は任せないでください。この仕事はスピード重視なので、コードの品質にこだわる人はこの仕事で求められる早さでデータを見ていくことは難しいかもしれません。
もし早くてずさんなコーディングをする人が会社で評価されていない場合、彼らは会社を去り、あなたはなぜあなたのビジネスの現況を把握できないのだろうと悩むことになるでしょう。

#4 統計専門家

メンバーがデータを闊達に分析/探求するようになったら、チームが不適当な結論を出すことを防ぐ役割が必要です。

 Inspiration is cheap, but rigor is expensive.

 「示唆」は安い、「厳密さ」は高い

 もっと多くのコストを支払わなければ、あなたは単なるインスピレーションで満足してしまうでしょう。

例えば、一つのデータセット機械学習システムが動作した場合、「そのデータセットにおいて」機械学習システムが動作したにすぎません。稼働開始後のデータで動作するか?ローンチできるか?こういった問いに答えるには統計のスキルが必要です。

もし完璧なファクトがない中で重要な決定を下したい場合には、スローダウンして慎重なアプローチを取りましょう。データから安全に結論にたどり着くために統計専門家の助けを借りましょう

#5 応用機械学習エンジニア

応用AI/機械学習エンジニアに求められていることは、アルゴリズムがどう動くかを理解することではありません。彼らの役目はアルゴリズムを使う、作ることではありません(それは研究者がやることです)。さまざまな既存のアルゴリズムを試しながら、あなたのデータをかき回すことが求められています。自分が何をしているか、何を思っているかは関係なく、とにかくたくさんのアルゴリズムを試します。仕事の大部分は盲目的に試すことであり、それを楽しめる個性が求められます。

完璧主義者はMLエンジニアとして苦労する傾向があります。何がうまくいくかは初めからわからないので、とにかくたくさんのアプローチを試して、解決策に向けてイテレーションを回していきましょう

ここでのアルゴリズムへの入力とするデータは、もちろんアナリストが興味深いと期待できると特定したものです。それがアナリストを前段で雇った理由です。

また、機械学習エンジニアは厳密さ(rigor)が求められる「評価」に細心の注意を払わなければなりません。正しい判断を下すために、前に雇った統計専門家の判断を仰ぎましょう。

#6 データサイエンティスト

私がこの「データサイエンティスト」という単語を使う場合、前3つの役割における十分なエキスパートである人を指します。すべての人がこの私の定義を使用しているわけではありません。3つの役割のうち1つを持つ人を指して「データサイエンティスト」と呼んでいる求人を目にすることもあります。

この「Three in One」の人材を雇うことは非常にコストがかかるので、#6においています。もし予算内でこの人材を雇うことができるならばもちろん良いですが、そうでない場合、既存の1つの役割におけるスペシャリストを育てていくのがよいでしょう。

#7 分析マネージャー / データサイエンスリーダー

分析マネージャーは金の卵を産むガチョウ:彼らはデータサイエンティストと意思決定者のハイブリッドです。彼らの役割は、ビジネスに新たな価値を追加するのではなく、データサイエンスチームの活動が無駄にならないようにすることで、チームの価値を増強するものです。

この人物は次のような問いかけを自身にしながら、夜寝ないような人です。

  • 正しい問い(課題)をいかにデザインすべきか
  • いかに結論に導くか
  • 我々のエキスパートをいかに配置するか
  • 何をすることが価値があるのか
  • スキルやデータは、要件に適しているか
  • どのように良いインプットデータかどうかを確認するか

もし幸運にもこのような人物を雇うことができたら、抜けられないようにしましょう。

#8 定性的専門家 / 社会科学者

時に意思決定者は意思決定のアートとサイエンスのスキルを有していないことがあります。意思決定は才能以上のものです。意思決定者がそのような技術に長けていない場合、とても大きなダメージがあります。

そのようなスキル不足の意思決定者を解雇するのではなく、定性専門家を加えることで強化するという手があります。

この人物は社会科学とデータのバックグラウンドを持っています―行動経済学者、神経経済学者、JDM(Judgement and Decision-Making)心理学者は特に専門的なトレーニングを受けていますが、独学の人でもできます。この役割は意思決定者にアイディアを明確化し、あらゆる角度から検討し、あいまいな直観をチームのほかのメンバーが実行しやすい言語で表現された良く考え抜かれた指示に転換することを助けることです。

社会科学者は通常、データサイエンティストより、意思決定者の直感や意図を具体的な指標に落とし込む能力に長けています。

社会科学者はすべての場面で采配を取ることはできませんが、意思決定者が彼らに采配を取らせることができる場面を把握させることはできます。彼らは、信頼できるアドバイザーであり、ブレインストーミングの仲間であり、意思決定者の相談役です。彼をボードメンバーに置いておくことはプロジェクトを正しい方向にスタートさせる上で非常に良いでしょう。

#9 研究者

AIとデータサイエンスのプロジェクトの最初のチームメンバーとして元教授を加えた方がよいと考えている採用マネージャーが多くいますが、その分野において必要なアルゴリズムが提供されていないことが予め分かっている場合以外はこのようなPhD保有者は必ずしも必要ではありません。まずスタートしてみて、入手可能な既製の解決策があまり役立たないと感じたら、研究者を雇うことを検討すればよいのです。チームが十分に発展し、研究者に何を求めているのかがはっきりと理解されるまで待つ方がよいでしょう。

#10 追加要員

その他、意思決定インテリジェンスプロジェクトに歓迎したい人は次のような人たちです。

  • ドメインエキスパート
  • 倫理学
  • ソフトウェアエンジニア
  • 信頼性エンジニア
  • UXデザイナー
  • インタラクティブビジュアライザー/グラフィックデザイナー
  • データ収集スペシャリスト
  • データプロダクトマネージャー
  • プロジェクト/プログラムマネージャー

多くのプロジェクトは彼らなしでは成立しません。彼らがトップ10にリストされていないのは、意思決定インテリジェンスが彼らの主要なビジネスではないからです。

大きなチームか小さなチームか

全部読んだ後、あまりにもたくさんの役割にあなたは圧倒されてしまうかもしれません。しかし、あなたのニーズに応じて、最初のいくつかの役割からでも十分な価値を得ることができます

応用機械学習とキッチンの改革のアナロジーに立ち返ると、もしあなたが革新的なピザを提供する業務スケールのピッツェリアを立ち上げたいなら、あなたは大きなチームまたはプロバイダー/コンサルタントと提携する必要があるでしょう。もしあなたがこの週末のための特別なピザを作りたいだけなら、、、それでも上で言及したすべての要素について考える必要があります。あなたは何を作るかを決め(役割#1)、どの材料を使うかを決め(役割#2, #3)、どこで食材を入手するかを決め(役割#0)、どのようにレシピをカスタマイズするかを決め(役割#5)、あなたが感動させたいお客に提供する前にどのように味見をするかを決め(役割#4)ます。しかしリスクの少ないカジュアルバージョンの場合、すべてあなた自身ですることができます。そしてもしあなたが一般的なピザを作りたいだけならば、そのようなことすらする必要はありません。誰かが試したレシピと食材をそのままつかって料理をするだけなのですから。

AIのアナロジー

Cassie Kozyrkov(GoogleのChief Decision Scientist)より

hackernoon.com

 

AIのアナロジー
  • データ:食材
  • アルゴリズム:電子レンジ
  • モデル:レシピ
  • 予測:料理

 もしあなたがパン屋を開業するならば、熟練のパン職人を雇いたいと思うでしょう。さらにあなたはオーブンも欲しいと思うでしょう。しかし、あなたは熟練のパン職人にオーブンの作り方を知っておけ、とは言わないでしょう。なぜ、会社は同様なことをやろうとしてしまうのでしょう。

 

仕事に適切なチームを雇う

 

もしあなたが斬新な調理家電を開発したいならば、研究者を雇いなさい

もしあなたが大規模なスケールでの料理を売るための革新的なレシピを生み出したいのならば、以下のようなメンバーをそろえる必要がある。

 

  • どんな料理が価値があるのか/何が目的なのかわかる人(意思決定者 / プロダクトマネージャー)
  • サプライヤーやお客さんが分かる人(業界専門家、社会科学者)
  • 材料を大量に加工できる人(データエンジニア、アナリスト)
  • 目指すレシピを生み出すために様々な食材と調理器具の組み合わせを試せる人(応用機械学習エンジニア)
  • そのレシピが提供するに値する品質であることを確認できる人(統計専門家)
  • 目指すレシピを大量の料理に効率的に変換できる人(ソフトウェアエンジニア)
  • 異なる専門性のメンバーを一つのプロジェクトの軌道に乗せる人(プロジェクト、プログラムマネージャー)
  • あなたの生み出す料理が一流にとどまることを確認する人、仮に米の代わりにジャガイモが大量に運ばれてきたとしても(信頼性エンジニア)

もちろんこれらが一人ひとり個人に分かれている必要はないが、すべての役割がカバーされていることを確認する必要がある。

 

 

「座禅+思考」をセットで行うとおススメ

頭の中がごちゃごちゃした時、気持ちがもやもやした時、座禅や瞑想、マインドフルネスといったことをするのがよいと言われています。私自身も座禅を取り入れており、朝や業務の休憩時間などに行ったりしています。(今は在宅ワーク中なので、仕事中頭をクリアにしたい時いつでもできる!)

座禅中は何も考え事をしてはいけないとされています。

参考:http://www.joshukuji.info/hishiryo.html

私も座禅中いろいろな考えが頭の中をよぎっても、その考えは追わないようにして、ただただ消え去るのを待つようにしています。そして、考え事をしてしまうのを極力抑えるように自分の呼吸を数えるようにしています(数息観、というらしい)。けれども、ある程度、座禅をした後に訪れる落ち着いた精神状態は考え事をするのにもとてもよい状態です。

ということで、座禅と考え事をセットで行ってみてはどうかということを考えて、やってみたところ、今のところとても良いなと感じています。やり方は簡単で、座禅を組んだ後、そのまま座禅を組んだ姿勢で考え事をするのです。それぞれに時間を決めて行っていて、私は座禅3分、考え事3分という風にしています。(もちろん座禅は通常もっと長い時間をやるものではあるのですが、考え事も含めて日常の合間に行うにはこれくらいの時間しか捻出できないのです。)これをすることで座禅をした後のクリアな頭の状態ので思考ができるので、些細な(しかし、座禅をする前は些細だと思えなかった)ことに捕らわれず、本質的なポイントに直接注意を払って、自信をもって判断することができます。

もしかしたら、座禅の時間を2分とか、もっと短くしても大丈夫かもしれません。そのあたりはまだ探索中です。また、その時の頭の状態にも因ると思います。

考え事の内容は、座禅に入る前に悩んでいた仕事で直面していることであったり、座禅中に頭をよぎった考えの中でこれは考えておきたいということであったり、また朝であれば今日一日、残りの人生の最初の日として何をして過ごすかといったことであったり、いろいろです。考え事の内容によっては3分かからずに答えが出てしまい、開始早々に考え事を終えることもありますし、残りの時間で別のテーマを考えるといったこともあります。逆に、考え事がまとまらない時は考え事の時間をもっと伸ばすこともあります。

ちなみに、私は座禅をするときはスマホの座禅タイマーを使っていて私がいろいろ試した中で一番よさそうなのがInsightTimerの無料版です。

play.google.com

こちらで座禅時間(アプリ中では瞑想時間)を6分に設定し、インターバルチャイムとして3分経過後に1度チャイムを鳴らすようにしています。こちらのアプリはチャイムの音などをいろいろ選べて気に入っています。

もしよかったら試してみてください。迷いごとにすっと答えを出せるかもしれません。

人生が過ぎていく

座禅を15分やった。今度はもっと心穏やかにできた。心をよぎることがあっても焦ることなく、過ぎ去るのを見送ることができた。

 

ふと、人生が過ぎていることについて考えを巡らせるタイミングがあった。現生はいわば一本の太いパイプのようなもので、毎日毎秒新しい命がそのパイプの中に流れ込んでいて、一方で同じように命が現生のパイプから流れ出ている。僕の命もそのパイプの中にだいぶ前に流れ込んで、今はそのパイプの真っただ中。ただ、果たして今自分の命はそのパイプの半分くらいなのか、1/3くらいなのか、はたまたもう終わりに近づいているのか、それは分からない。僕の親戚は先日突然亡くなった。まだ60代半ばだったのに。僕もそのくらいの寿命だったとしたら、もう半分近く来ていることになる。

 

そんな中自分は今の人生の使い方をして悔いはないのだろうか。満足しているんだろうか。毎日毎日、今日は自分の残りの人生の最初の日として、存分に生きられた、と思って生きていきたい、そう思った。