データサイエンティストへの歩み② 勉強したことがお客様の価値になるデータサイエンティストとしての喜び(前編)のサムネイル
デジタルテクノロジー

データサイエンティストへの歩み② 勉強したことがお客様の価値になるデータサイエンティストとしての喜び(前編)

近年急速なIT化が進み、「AI(人工知能)」「機械学習」「ディープラーニング」をビジネスに活用する企業も増えてきました。そこには「データサイエンティスト」という肩書で活躍する人たちがいます。今回はLTSのデータサイエンティストチームの若手メンバー2名にインタビューを実施しました。
鈴木 航輔(LTS コンサルタント)

業務システムの開発・導入支援を経験した後、データサイエンティストチームに参画。金融・商社を中心に、データ利活用の促進を支援。最近では、デジタルマーケティング施策の企画・設計にも携わる。アウトドアブームに乗りキャンプに行き始める。(2021年8月時点)

LTSデータサイエンティストチーム リーダー

坂内 匠(LTS マネージャー)

データ分析、AI開発領域の様々な業界のプロジェクトを担当。コンサルタントとして企画立案から、エンジニア・データサイエンティストとして分析の実装まで幅広く経験。プロジェクトデリバリと平行して、大学と連携した研究にも従事しており、科学論文を執筆している。(2021年6月時点)  ⇒プロフィールの詳細はこちら

データサイエンティスト協会は、データサイエンティストを「データから価値を創出し、ビジネス課題に答えを出すプロフェッショナルのこと」と定義しています。企業のデータを収集・分析し、企業における事業課題や、まだ見ぬ可能性の発見など、幅広い価値を提供する人たちを指します。

LTSのデータサイエンティストチームでは、企業内のデータに着目し、データ収集・データベース設計、アルゴリズム・モデリング開発、解析結果の実務適用まで幅広いサービスでお客様を支援しています。

今回はそのチームの若手メンバー2人に、データサイエンティストを目指したきっかけは何だったのか、どのように勉強したのか、課題や障壁を感じた部分はあったか、今後挑戦したいこと、などを伺いました。データサイエンティストを目指したい、勉強を始めたいが何から手を付けたら良いか分からない、という人におすすめの記事です。

データサイエンティストとは

データサイエンティストの定義

新しい概念で定義は曖昧

舟山
データサイエンティストという概念は比較的新しくて、2010年以降のビックデータという言葉が出た後のものです。近いところでは○○エンジニアと言われる、例えば、製造業のものづくりエンジニアや、建設業の設計エンジニア、比較的新しいITエンジニアなどと比べても、歴史がかなり浅いんですよね。なので、データサイエンティストの定義って、まだ曖昧ですね。

鈴木
そうですね。個人的には、データサイエンティストは「データを使って意思決定することを支援できる人」なのかなと思います。グラフやモデルの作成、データの集計などは、その手段としてあるイメージです。

舟山
データサイエンティストという言葉が出始めのころは、統計数理やアルゴリズムを要求されていて、ビジネスの側面についてはあまり求められてなかったですよね。でも、社会的に「モノを作るだけではダメだ」と考えられるようになり、データでもAIでも「モノを作ったらしっかり業務に浸透させることが大切だよね」という認識が強まりました。

企業によっても異なる定義

鈴木
あと、あまり「サイエンティスト」という言葉に縛られないほうがいいですね。データサイエンティストは、お客様の課題解決のためにどんなことが必要か俯瞰的に見て、その解決までの道筋を考え・設計し、アルゴリズムを書いたり分析をしたり…というところもやるので、先ほど舟山さんからもあったように、定義は結構難しいです。

データサイエンティストってかっこいい響きで、新しい職業なので誤解されがちなこともあるんですよね。データサイエンティストの求人に応募して会社に入ったら「期待していた分析や課題解決はできず、ただデータベースからデータを依頼通りに出力するだけの集計屋さんだった」みたいなケースもあるので、企業によってデータサイエンティストの定義が違う場合もあるということを知っておいてほしいですね。

舟山
それはありますね。データサイエンティストに必要な経験値や役割の難易度は、経験を積んだプロマネ(プロジェクトマネジメント)に近いレベルだと思うんですよね。役割はプロマネに近いものの、課題解決の手段としてデータを使う役割、だからデータサイエンティストなんだと理解してもらえると分かりやすいかもしれません。

データサイエンティスト、データアナリスト、マシンラーニングエンジニア

鈴木
データサイエンティストと言われると、統計数理を極めていて、予測するモデルのアルゴリズムをカスタマイズするなど、数理寄りのイメージがあるのかなという気がします。でも、似たような職種で「データアナリスト」という人たちが居ますが、データアナリストはもう少しビジネス寄りで、データがどのような業務に使用されていて、どのような意思決定が必要で、その意思決定にはどんなデータが必要なのか、ということを整理・明確化する役割と言われています。

舟山
役割というと、データサイエンティストに求められるスキルセットって、かなり多岐にわたっているんですよね。でも、一人の人間にそこまで求めるのは正直難しいと考えられていて、大手企業でも採用も育成も難航しているようです。なので、求められるスキルを分割して、データサイエンティスト、マシンラーニングエンジニア、データアナリストの3つが誕生したという背景があります。

データアナリストは、先ほど鈴木さんがおっしゃったように、分析の作業や可視化の作業がメインです。マシンラーニングエンジニアは、機械学習を使ってプログラムを書いて結果を求めることができる人です。データサイエンティストは、どちらにも近い要素はありますが、課題に対しアルゴリズムを書くといった「結果を出す道筋を考えることができる人」という違いがあります。

写真1 対談中の様子 鈴木(上)、舟山(下)

データサイエンティストのキャリアプロセス

舟山
キャリアの実態として、データアナリストやマシンラーニングエンジニアを経て、データサイエンティストになるという進み方が多いのかなという気はしますね。初めはみんなプログラミングを書いたり、分析の作業をしたりして、結果を求められるプロジェクトなどに従事します。その後、よりお客様の課題の源泉にたどり着くことができるようになり「お客様と一緒に解決までの道筋を考える」ことに近づいていくと、データサイエンティストになるのかなと。

鈴木
そうですね。お客様のスキルセットや、お客様が案件に求める役割によって、我々データサイエンティストは柔軟に対応する必要があります。そのためには明確な役割の線引きをせずに、お客様の意思決定のために必要なことや、自分に求められていることを考えながら行動するのが大事です。

舟山
比較的成熟した企業であれば、データサイエンティストになるためのキャリアパスを描かれているところもありますが、そうでない企業においても、データの集計作業やSQL※1を使うところからスタートして、そこからさらに一歩先の分析手法を学ぶなど、いろいろやり方はあります。領域を絞らずたくさん経験していくことで、徐々にそれが「分析のため」のものではなく、「課題解決のための手法の一つ」として使うことができるようになります。そこから、データサイエンティストに近づいていくんでしょうね。

※1 SQLとはStructured Query Languageの略で、 リレーショナルデータベース (RDB:Relational Database)の管理や操作を行うための問い合わせ言語の一つのこと。

データサイエンティストのスキル

多くの手法や技術を持っているほうが有利

経験で培われる課題解決力

鈴木
単純な分析作業や可視化であれば、第1回のインタビューでもあったような書籍やセミナー参加で、基本的な知識は習得できます。ただ、データサイエンティストの「課題に対してアプローチする」というスキルは、経験で獲得するものが多いと感じます。

データを扱っていると、業務の中から出てきたデータを使って、どうにかして求められている数字を出すというところに落ち着いてしまいがちです。でも、そうではなくて、そのデータはどのようなプロセスの中で出てきて、現場の人はどのようなことをしていて、データから割り出した数字を誰が何のために使うのかを知った上で、もっと業務側に手を伸ばすことが必要だと思います。数字の利活用方法を、実際の業務と紐づけて考えることが大切です。

そのような経験を主体的にプロジェクトの中で積んでいくことで、データサイエンティストとしてお客様の要求に応えることができるようになるのかなという気はします。能動的にいろんな情報を収集しに行くというところも大事ですね。

課題解決のために多様な技術を使いこなす

舟山
あとは、特定の業界にはこだわらず、経験する技術の種類にこだわる、いろんなプロジェクトを経験することにこだわることが重要だと思います。製造業で画像分析のプロジェクトを経験したら、その内容は製造業でしか使えないのかと言われると、そうではなくてその画像分析の技術はどの業界、ファッションでも建設業でも応用できます。

画像解析や、文字の解析である自然言語、基本統計に基づく可視化の分析、多変量解析法※2を使った予測モデルの作成など、分野としてはいろいろありますが、とにかく自分が使える技術を経験によって増やしていくのに尽きると思います。そうすることで、お客様の課題に対して、解決までの道筋を設計することができるようになっていくんですよね。

※2 多変量解析法:複数の変数に関するデータをもとに、これらの変数間の相互関連を分析する統計的技法の総称のこと。

技術マップで自身のスキルを確認する

舟山
技術マップは色々出ているので、それを活用して自分のスキルを磨いていくという方法もあります。例えば、グーグルで「機械学習アルゴリズムマップ」と画像検索していただければわかりやすい画像が出てきて、データ分析技術の外観を把握できるので、それら一つずつ経験していくことを目標にするもの手です。これは一つの例ですが、やっぱりそういうところを目指していくのがデータサイエンティストだなと思いました。

鈴木
そうですね。手法によってできること・できないことがあったり、技術を使うのに向き・不向きなケースがあったりするので、お客様の課題に対してより高い精度で、良い提供価値を出すためにいろんなカードを手元に置いておくのは大事ですよね。

あとは、お客様の期待値コントロールも重要です。AIというと「何でもできる魔法みたいなものだよね!」と思われがちですが、できないこともしっかりお客様に伝えた上で、落としどころを考えられることもデータサイエンティストのスキルの一つだと思います。

舟山
確かに。そのためにも、技術セクションをよく理解しておくのが良いですね。データ分析技術には、自然言語の分析、画像の分析、構造化データの分析、最適化などという大きなくくりがあって、それを理解しておくことで、このデータ構造だったらこれで分析できるなというイメージが湧きます。なので、自分の経験をより有用なものにするためにも、どんな技術があるのか頭の中に入れておくことは大事ですね。

写真2 対談中の様子 鈴木(上)、舟山(下)

…後編に続く


ライター

大山 あゆみ(LTS コンサルタント)

自動車部品メーカーにて、グローバルで統一された品質管理の仕組みの構築・定着化を支援。産休・育休を経て、CLOVER Lightの立ち上げ、記事の企画・執筆を務める。現在、社内システム開発PJに携わりながら、アジャイル開発スクラムを勉強中。Scrum Alliance認定スクラムマスター(CSM)、アドバンスド認定スクラムマスター(A-CSM)、Outsystems Delivery Specialist保有。(2023年12月時点)