［翻訳］AIとデータサイエンスの10の役割

サマリー

AI/データ分析PJのメンバーの増やす順序は、データエンジニア→意思決定者→アナリスト（一般/高度）→統計専門家→機械学習エンジニア
オプショナルとしてデータサイエンティスト、分析マネージャー、定性専門家、研究者
データサイエンティストとは高度アナリスト＋統計専門家＋機械学習エンジニアのハイブリッド（レア人材）
分析マネージャーはデータサイエンティスト＋意思決定者のハイブリッド（最強人材）
定性専門家は社会科学とデータのバックグラウンドをもち、データと意思決定の橋渡しのトレーニングを受けた人材であり、意思決定者のサポート役
研究者は最後の手段
その他、ドメインエキスパート、倫理専門家（AI倫理）、ソフトウェアエンジニア、UXデザイナー、信頼性エンジニアなどもポイントで必要
プロジェクトのステージと、目指すシステムの規模を踏まえ、徐々にチームを大きくする

原文

Cassie Kozyrkov氏記事より（2018年7月27日）

はじめに

応用データサイエンスは、非常に学際的なチームスポーツです。視点の多様性が重要！あなたがデータを活用した意思決定アプローチを実施しようとしている場合において、私が考えるチームを成長させる順序は以下の通りです。

#0 データエンジニア

もちろんデータが無ければ始まらないので、まずデータを取得する能力が必要です。もし、小さなデータセットを扱う場合には、データエンジニアリングはスプレッドシートに数値を入力するだけです。もしそれなりの規模のデータを使用する場合、データエンジニアリングはそれ自体が洗練された分野になり、チームの誰かが、メンバーの使用するデータを提供するというトリッキーな作業を担うことになります。

#1 意思決定者

PhDのデータサイエンティストを雇う前に、データドリブンな意思決定のアートとサイエンスを理解した意思決定者がいなくてはなりません。
チームがデータから価値を引き出すためには、意思決定スキルがまず先になくてはなりません。
この人が以下のような判断をすることが求められます。

その決定/判断がデータに基づいてなされる価値があると特定する
決定/判断をフレーミングする（メトリックのデザインから、統計的仮定の采配を取ることまで含め）
ビジネスに与えるインパクトに基づき、分析の厳格さに求められるレベルを決定する

「おっと、それは考えていなかったな」と決して言わないような、深い思考ができる人でなければなりません。

#2 アナリスト

次は、あなたと一緒に働いている皆さんです。皆、データを見て感銘を受ける資格があります。もしあなたがデジタルの写真を見たことがあるならば、あなたはすでにデータ可視化と分析をしているのです。RやPythonはデータ可視化のためのツールのアップグレードに過ぎません。
気を付けなくてはいけないことは、データを超えて判断を下してはならないことです。湖畔に映る黒い影の画像を見たからといって、ネッシーが実在すると判断してはなりません。

#3 高度アナリスト

次に超高速バージョンを導入してください。この人物はデータをより早く見られる人物です。ここでのゲームはスピード、探索、発見、、、面白さです。（「分析」の別の用語は「データマイニング」です。）この役割は厳密で注意深い結論を下すことではなく、意思決定者がより注意深く追求する価値があることを理解できるように、あなたのチームがデータにより多く目を向けるのを手助けする人です。
ここでの仕事はスピードであり、潜在的な洞察にできるだけ早く遭遇することです。
直観に反するかもしれませんが、立派で堅牢なコードを書くようなエンジニアにこの仕事は任せないでください。この仕事はスピード重視なので、コードの品質にこだわる人はこの仕事で求められる早さでデータを見ていくことは難しいかもしれません。
もし早くてずさんなコーディングをする人が会社で評価されていない場合、彼らは会社を去り、あなたはなぜあなたのビジネスの現況を把握できないのだろうと悩むことになるでしょう。

#4 統計専門家

メンバーがデータを闊達に分析/探求するようになったら、チームが不適当な結論を出すことを防ぐ役割が必要です。

　Inspiration is cheap, but rigor is expensive.

　「示唆」は安い、「厳密さ」は高い

もっと多くのコストを支払わなければ、あなたは単なるインスピレーションで満足してしまうでしょう。

例えば、一つのデータセットで機械学習システムが動作した場合、「そのデータセットにおいて」機械学習システムが動作したにすぎません。稼働開始後のデータで動作するか？ローンチできるか？こういった問いに答えるには統計のスキルが必要です。

もし完璧なファクトがない中で重要な決定を下したい場合には、スローダウンして慎重なアプローチを取りましょう。データから安全に結論にたどり着くために統計専門家の助けを借りましょう。

#5 応用機械学習エンジニア

応用AI/機械学習エンジニアに求められていることは、アルゴリズムがどう動くかを理解することではありません。彼らの役目はアルゴリズムを使う、作ることではありません（それは研究者がやることです）。さまざまな既存のアルゴリズムを試しながら、あなたのデータをかき回すことが求められています。自分が何をしているか、何を思っているかは関係なく、とにかくたくさんのアルゴリズムを試します。仕事の大部分は盲目的に試すことであり、それを楽しめる個性が求められます。

完璧主義者はMLエンジニアとして苦労する傾向があります。何がうまくいくかは初めからわからないので、とにかくたくさんのアプローチを試して、解決策に向けてイテレーションを回していきましょう。

ここでのアルゴリズムへの入力とするデータは、もちろんアナリストが興味深いと期待できると特定したものです。それがアナリストを前段で雇った理由です。

また、機械学習エンジニアは厳密さ（rigor）が求められる「評価」に細心の注意を払わなければなりません。正しい判断を下すために、前に雇った統計専門家の判断を仰ぎましょう。

#6 データサイエンティスト

私がこの「データサイエンティスト」という単語を使う場合、前3つの役割における十分なエキスパートである人を指します。すべての人がこの私の定義を使用しているわけではありません。３つの役割のうち１つを持つ人を指して「データサイエンティスト」と呼んでいる求人を目にすることもあります。

この「Three in One」の人材を雇うことは非常にコストがかかるので、#6においています。もし予算内でこの人材を雇うことができるならばもちろん良いですが、そうでない場合、既存の1つの役割におけるスペシャリストを育てていくのがよいでしょう。

#7 分析マネージャー / データサイエンスリーダー

分析マネージャーは金の卵を産むガチョウ：彼らはデータサイエンティストと意思決定者のハイブリッドです。彼らの役割は、ビジネスに新たな価値を追加するのではなく、データサイエンスチームの活動が無駄にならないようにすることで、チームの価値を増強するものです。

この人物は次のような問いかけを自身にしながら、夜寝ないような人です。

正しい問い（課題）をいかにデザインすべきか
いかに結論に導くか
我々のエキスパートをいかに配置するか
何をすることが価値があるのか
スキルやデータは、要件に適しているか
どのように良いインプットデータかどうかを確認するか

もし幸運にもこのような人物を雇うことができたら、抜けられないようにしましょう。

#8 定性的専門家 / 社会科学者

時に意思決定者は意思決定のアートとサイエンスのスキルを有していないことがあります。意思決定は才能以上のものです。意思決定者がそのような技術に長けていない場合、とても大きなダメージがあります。

そのようなスキル不足の意思決定者を解雇するのではなく、定性専門家を加えることで強化するという手があります。

この人物は社会科学とデータのバックグラウンドを持っています―行動経済学者、神経経済学者、JDM(Judgement and Decision-Making)心理学者は特に専門的なトレーニングを受けていますが、独学の人でもできます。この役割は意思決定者にアイディアを明確化し、あらゆる角度から検討し、あいまいな直観をチームのほかのメンバーが実行しやすい言語で表現された良く考え抜かれた指示に転換することを助けることです。

社会科学者は通常、データサイエンティストより、意思決定者の直感や意図を具体的な指標に落とし込む能力に長けています。

社会科学者はすべての場面で采配を取ることはできませんが、意思決定者が彼らに采配を取らせることができる場面を把握させることはできます。彼らは、信頼できるアドバイザーであり、ブレインストーミングの仲間であり、意思決定者の相談役です。彼をボードメンバーに置いておくことはプロジェクトを正しい方向にスタートさせる上で非常に良いでしょう。

#9 研究者

AIとデータサイエンスのプロジェクトの最初のチームメンバーとして元教授を加えた方がよいと考えている採用マネージャーが多くいますが、その分野において必要なアルゴリズムが提供されていないことが予め分かっている場合以外はこのようなPhD保有者は必ずしも必要ではありません。まずスタートしてみて、入手可能な既製の解決策があまり役立たないと感じたら、研究者を雇うことを検討すればよいのです。チームが十分に発展し、研究者に何を求めているのかがはっきりと理解されるまで待つ方がよいでしょう。

#10 追加要員

その他、意思決定インテリジェンスプロジェクトに歓迎したい人は次のような人たちです。

ドメインエキスパート
倫理学者
ソフトウェアエンジニア
信頼性エンジニア
UXデザイナー
インタラクティブビジュアライザー／グラフィックデザイナー
データ収集スペシャリスト
データプロダクトマネージャー
プロジェクト／プログラムマネージャー

多くのプロジェクトは彼らなしでは成立しません。彼らがトップ10にリストされていないのは、意思決定インテリジェンスが彼らの主要なビジネスではないからです。

大きなチームか小さなチームか

全部読んだ後、あまりにもたくさんの役割にあなたは圧倒されてしまうかもしれません。しかし、あなたのニーズに応じて、最初のいくつかの役割からでも十分な価値を得ることができます。

応用機械学習とキッチンの改革のアナロジーに立ち返ると、もしあなたが革新的なピザを提供する業務スケールのピッツェリアを立ち上げたいなら、あなたは大きなチームまたはプロバイダー/コンサルタントと提携する必要があるでしょう。もしあなたがこの週末のための特別なピザを作りたいだけなら、、、それでも上で言及したすべての要素について考える必要があります。あなたは何を作るかを決め（役割#1）、どの材料を使うかを決め（役割#2, #3）、どこで食材を入手するかを決め（役割#0）、どのようにレシピをカスタマイズするかを決め（役割#5）、あなたが感動させたいお客に提供する前にどのように味見をするかを決め（役割#4）ます。しかしリスクの少ないカジュアルバージョンの場合、すべてあなた自身ですることができます。そしてもしあなたが一般的なピザを作りたいだけならば、そのようなことすらする必要はありません。誰かが試したレシピと食材をそのままつかって料理をするだけなのですから。

AI・機械学習を中心に

AI/機械学習/データ分析/子育て/日々の雑感