データサイエンティストへの歩み① すぐに始められるデータサイエンティストになるための勉強法のサムネイル
デジタルテクノロジー

データサイエンティストへの歩み① すぐに始められるデータサイエンティストになるための勉強法

近年急速なIT化が進み、「AI(人工知能)」「機械学習」「ディープラーニング」をビジネスに活用する企業も増えてきました。そこには「データサイエンティスト」という肩書で活躍する人たちがいます。今回はLTSのデータサイエンティストチームの若手メンバー2名にインタビューを実施しました。

インタビュアー

鈴木 航輔(LTS コンサルタント)

業務システムの開発・導入支援を経験した後、データサイエンティストチームに参画。金融・商社を中心に、データ利活用の促進を支援。最近では、デジタルマーケティング施策の企画・設計にも携わる。アウトドアブームに乗りキャンプに行き始める。(2021年8月時点)

インタビューに答えた人

井上 翔太(LTS マネージャー)

データ分析・AI導入において、コンサルティング(業務課題特定・要件整理)からアルゴリズム開発までをリードしている。最近では、消費財メーカーにおける棚割自動化や製造業における大規模言語モデルの活用を推進。数理最適化、ベイズ統計、深層学習(画像処理、言語処理、強化学習)と幅広い領域で経験を持つ。特に、数理最適化の領域を専門としている。(2024年1月時点)

村井 寿理(LTS コンサルタント)

教育展開支援、基幹システム刷新PMO、業務分析支援など多岐にわたる領域で支援を経験。市場調査や中長期戦略のレポーティング、新規事業立ち上げ支援にも携わる。今後は、データ分析やプログラミングのスキルを磨きながら、データ分析領域の支援に携わっていく予定。(2021年8月時点)

LTSデータサイエンティストチーム リーダー

坂内 匠(LTS マネージャー)

データ分析、AI開発領域の様々な業界のプロジェクトを担当。コンサルタントとして企画立案から、エンジニア・データサイエンティストとして分析の実装まで幅広く経験。プロジェクトデリバリと平行して、大学と連携した研究にも従事しており、科学論文を執筆している。(2021年6月時点)  ⇒プロフィールの詳細はこちら

データサイエンティスト協会は、データサイエンティストを「データから価値を創出し、ビジネス課題に答えを出すプロフェッショナルのこと」と定義しています。企業のデータを収集・分析し、企業における事業課題や、まだ見ぬ可能性の発見など、幅広い価値を提供する人たちを指します。

LTSのデータサイエンティストチームでは、企業内のデータに着目し、データ収集・データベース設計、アルゴリズム・モデリング開発、解析結果の実務適用まで幅広いサービスでお客様を支援しています。

今回はそのチームの若手メンバー2人に、データサイエンティストを目指したきっかけは何だったのか、どのように勉強したのか、課題や障壁を感じた部分はあったか、今後挑戦したいこと、などを伺いました。データサイエンティストを目指したい、勉強を始めたいが何から手を付けたら良いか分からない、という人におすすめの記事です。

データ分析って「おもしろそう!」

鈴木
井上さんは新入社員研修後、すぐに我々データサイエンティストチームの部門に配属になったと思いますが、データ分析に興味を持ったきっかけって何だったんですか?

井上
はじめは、大学でプログラミングの授業を取ったのがきっかけですね。そこで、オセロのアプリを作ったんですけど、その時に「プログラミングってすごいな…」って純粋に思ったんです。その後、Webプログラミングを学ぶ「テックキャンプ」っていうスクールに通って。このあたりが、1つ目のターニングポイントですかね。

もう一つは、ビックデータっていうバズワードから「おもしろそうだな~」と興味を持って、機械学習※1を独学で身につけようと思ったのが、二つ目のターニングポイントだと思います。その時、東大の人工知能技術の研究開発をされている松尾先生のもとでインターンをしていた兄が「これからの時代、データ分析がすごいぞ!!」と熱く語っていたのに引き込まれて…(笑)。本格的にやってみようかなと思いました。

※1 機械学習:機械学習とは、経験からの学習により自動で改善するコンピューターアルゴリズムもしくはその研究領域で、人工知能の一種。「訓練データ」もしくは「学習データ」と呼ばれるデータを使って学習し、学習結果を使って何らかのタスクをこなす。

鈴木
村井さんは僕と同期なんですよね。入社後は、システムの導入支援とかを経験してたと思うんですけど、具体的にはいつごろデータ分析に興味を持ったんですか?

村井
入社して5年間は、いろんなプロジェクトを幅広く経験してきました。システムの導入に際した教育展開とか、業務の高度化に向けた可視化・標準化、基幹システム導入支援でのPMO…、などをやっていました。

2015年くらいの就職活動の時に、ビックデータなどがバズワードになってて。LTSに入社して、立ち上げたばかりのデータサイエンティストチームがあるっていうことを知って、いつかはチャレンジしてみたいなっていう風に思っていた領域ではありました。

実際に、データ分析とかAIで何ができるのか、っていうところは正直あまりイメージが湧かなかったんですよね。「AIってすごいんですよね?!」くらいに思ってて(笑)。いつかやってみたいとは思いながらも、実態をつかめないまま時間を過ごしていました。

これまで、いろんなプロジェクトを経験した中で、自分の経験したことがないことでも、一定期間携わることである程度の価値を発揮できるんだな、というのは感じていたんですよね。なので、未知の世界だからこそやってみたい、と思って。2020年の年末くらいに上司や周りの人に相談をし始めて…。

BIツール※2も使ったことない状態だったんですよ(笑)。唯一あるプロジェクトでOffice365におけるアプリケーションの利用状況の分析を経験した程度でした。その時は、バラバラの情報をクレンジングして統計する…という。そのプロセスがすごく楽しいなと感じていたんですよね。

※2 BIツール:ビジネスインテリジェンスツールの略で、企業に蓄積されたデータを収集・分析し、迅速な意思決定を助けるのためのツールのこと。

鈴木
それ分かります!熱中しちゃいますよね。

おすすめ学習法 オンライン講座で全体像を掴み、書籍で情報を補強する

鈴木
井上さんは大学時代に、プログラミングと機械学習という2つの軸で勉強してたんですよね。プログラミングはテックキャンプで…と言っていましたが、機械学習はどうやって勉強したんですか?

井上
テックキャンプのオプション講座で、卒業生だと安く受講できる機械学習のスクールがあるんですよ。なので、大枠のベースはそこで学んだ感じです。その後は、独学でやってました。あとは、オライリー(O’Reilly)から出版されている、ディープラーニングの教科書をがっつり読んでましたね。

鈴木
データ分析ってめっちゃ幅広いんですよね。機械学習ってその中の一つの手段だと思ってるんですけど、機械学習を勉強してた時は、データ分析の一つのツールだってことを意識してやってたんですか?

井上
いえ、意識してなかったですね。アルゴリズムのロジックがどうなってるんだろう…という興味でした。それがスキルセットの一つになることは、考えてなかったです。むしろ実業務では、勉強していないデータのラングリング※3の処理が80%を占めていて、そういうスキルは業務を通じて勉強しましたね、鈴木さんにも教えていただきつつ…。

※3 データのラングリング:生のデータをアクセス可能な形式にクリーニングおよび再構築するプロセスのこと。

鈴木
機械学習を入り口に勉強し始めると、もうきれいなデータがある前提で、それをいかに分析しやすく加工して結果出すかってところがメインになるんですよね。実際の業務って、だいたいデータがバラバラなので、それを整理するところから始めるんですよ。そこは大変ですよね。では、これまでの勉強は書籍よりもオンラインの講座に比重を置いていたんですね。

井上
そうですね。テックキャンプみたいなオンライン講座で良いなと思ったのは、講師に質問ができるところで。初心者ってつまずいても、何でつまずいているのかが分かんないんで…分からないことはすぐに聞けるという環境が良かったです。

鈴木
確かに。それはいいですね。村井さんの勉強の仕方って、周りの人をうまく巻き込んでやっていた、と聞いていましたが、それ以外に個人でやってたことってありましたか?

村井
基本的には、書籍やQiita(キータ)※4で勉強していましたね。書籍は基本的な知識がないと読み解けないような難しいものではなく、「文系がデータサイエンティストになる道!」みたいな入門編のものを使っていました(笑)。

※4 Qiita:Incrementsが運営するプログラミング情報のナレッジコミュニティのこと。

村井
とにかく平易で簡単なもの、分かりやすいもので勉強してました。でもそれだけだと、いただいていた課題に対応できなかったので、…インターネットをフル活用しました!Qiitaを読んで、プログラミングをコピペして。自分のやりたいことができるようにカスタマイズして…。

鈴木
最近は、そういうブログやコミュニティも多いですよね。〇〇をやってみた!みたいな記事とか。でも、書籍って選ぶの難しいですよね。内容のレベル感もそうなんですけど、どんなトピックに重きを置いているのかとか、ページ数が多いものもあるし…何を基準に選んでいましたか?

村井
わたしの基準は、絵が多くて分かりやすいものですね(笑)。ちょうど勉強し始めたころに、わたしの夫もPythonの勉強をやり始めていて、「オライリー(O’Reilly)の本が定番」と聞いたのでそれを読んでましたね。

井上
僕のポリシーは、とにかく数当たって読んでみることですね。これだ、と思うものは何度も読み返しますが、はずれだと感じたらすぐに手放しますね(笑)。

鈴木
メンバーにどんな書籍がおすすめか聞くというのも一つの手だと思いますよ!

(写真1)対談中の様子 村井(左上)、坂内(左下)、鈴木(右上)、井上(右下)

データ分析を体系的に学ぶ難しさをどのように克服するか

鈴木
プログラミングに比べて、データ分析っていろんな手法とか観点があって、その全体像が見えづらいんですよね。個人的には、何をどう学んだら良いのか苦労しました…。自分は何が分からないのか分からない、っていう状態が続いたので、そこを可視化することから始めたんですけど、お二人は何か苦労したところとかありましたか?

井上
テックキャンプで学んだあと、独学でやったこと、そこが苦労したところですね。講師の方がいると、分からないことってすぐに聞けるんですけど、独学だと一人で机に向かって…、その勉強方法のギャップがつらかったかもしれないです。

そこを突破するために、Udemyっていうオンライン講座を受けはじめました。最近はyoutubeやprogateなどの無料コンテンツも充実していますが、有料ではあるものの高品質で体系化しやすいUdemyもおすすめです。トピックも多いので、そこで情報を集めて体系化してから、書籍で勉強するようにしました。

鈴木
書籍だけだと情報が膨大で、何が本当に必要な知識か分かりづらいですよね。動画で学びながら情報を集めて、体系化するのに書籍を利用する…良いですね。書籍によっては分厚いものもあって、初めから読むにはなかなか勇気が必要で(笑)。村井さんはどうですか?

村井
わたしが現時点で難しいなと感じてるのは、分析の目的に合わせた観点の設定です。今は、機械学習自動化ツールっていう、モデルを自動で生成してくれて、精度のチューニングや、欠損値の特定、クレンジングとかもやってくれて、…っていう便利なものがあって、分析を実装するところの情報って多いので、自分でもなんとかできると思うんです。その前の、どんな観点でデータを見るか?っていうところが、現時点では解決策が見つけられていないです…。

鈴木
うーん…明確なタスクではなくて、解く課題によっては、はっきりとした答えが見つからない、難しいポイントなんですよね。それは、どのようにデータを加工するか、っていうところにも関係しますね。機械学習とかプログラミング以外にも、実業務では様々なスキルが必要ですが、そこはどうやって勉強しましたか?

井上
そこに関しては、正直あまり分からないです…。お客様のあるべき業務を設計して、それを実現するために、現状の課題を解決するための機械学習のプログラミング…ってどのように学べるんですか…。経験していくしかないんですかね。AIの案件は前例が少なくて、難易度が高いと思うんです。なので、その場その場でクリエイティブに解を考えるしかないんですかね…方法論はないんでしょうか。

鈴木
個人でできる勉強の範囲は、とにかく引き出しを増やすことですね。こんなアルゴリズムを知ってます、こんな処理方法を知ってます、っていうバリエーションを増やしてプロジェクトに参画する。そしてそこでお客様の課題に対して、どの引き出しを開けたらいいのかっていうのは、周りのメンバーを見て学ぶのが一番だと思います。

ここで経験豊富なデータサイエンティストの意見として、坂内さんに話を聞いてみましょう!自力の勉強だけではカバーできないような、知識以外の業務に直結する部分はどうやって学ぶのが良いのでしょうか。

※LTSデータサイエンティストチーム リーダーとしてこの対談に出席していた坂内さんは、終始メンバーたちを見守っていました。

坂内
経験を積むことが一番かな、とは思っています。ただ、プロジェクトに参加しないとそれは習得できない…それは本当にそうなのかな?とも思います。それは運任せな考え方になってしまいますよね。

今目の前にある、一見それとは無関係なプロジェクトで、お客様には求められていないけれども、アプローチを変えてみるとデータ分析で解けるかもしれない、と自ら考えてやってみる、という心がけが大切かなと思っています。

わたしが入社した2012年くらいの時は、会社規模も今より小さく、LTSにデータ分析案件ってなかったんですよね。コンサルティングの案件が中心で、プロジェクトの提案も業務コンサルティングでした。

でも、個人的にはデータ分析やAIをやりたいから、業務コンサルティングはやりつつ、別のアプローチ/解き方でデータを使うとこんなことができますよ、みたいなことを報告書のAppendixに独断で入れたりしていました(笑)。そうやって、パーツ―パーツの経験を積んでいきました。たぶん、そういうことの積み重ねなんじゃないかなと思いますけどね。

学びを継続し、今後挑戦したいこと

鈴木
今後、勉強していきたいところとかありますか?興味のある領域とか。

村井
そうですね…。異常検知っていう分野で、ビジネスの中で投資が集まりやすい領域について考えていて。お客様のミッションクリティカルな課題に対する、AIを活用したアプローチを検討・提案していくことができたらいいなと考えています。データ分析だけではなく、幅広い視野で、いろんなものを見られたらいいなと思いますね。

鈴木
井上さんは、もう一人でプロジェクトを回していますよね。

井上
データ分析の市場が人材不足っていうこともあり、少ない経験年数でも現場で力になれるチャンスが多くあるなと実感しています。大きなことを任されたときのプレッシャーもあるんですけど、やりがいもありますね。今後も、積極的にいろんなことに挑戦していきたいです。

これから学ぼうとしている人へ「興味があったら、まずはやってみて」

鈴木
今データ分析やAIに興味を持っている人とか、これから勉強したいと思っている人に向けてコメントをお願いします!

井上
分からないことをすぐに聞ける環境は、お金を払ってでも作っておくと良いのかなと思います、ほんとに。また、書籍の前に動画教材で体系的に学ぶのがお勧めです。書籍だと、環境の構築や諸々の設定が省略されていて、コードだけが紹介されていることもあるので、一連の流れをしっかりつかむことができる勉強法が良いと思います。

データ分析の勉強って、やる気さえあればできると思います。やりたいと思ったら、まずやってみて、面白いと思えるところまで踏ん張ってみてほしいです。体系的に身についてくると、面白さが増幅されていって楽しくやれるので。

村井
個人的には、キャッチ―な面白いことをやってみるのがおすすめですね。例えば、TwitterからAPIで特定のキーワードを引っ張ってくる、Word2Vec※5で類義語を引っ張ってくる、とか。実際に「モデルに西野カナの歌詞を読ませ、西野カナの世界観で愛とは何かを調べてみた」ということをやった人もいるようで(笑)。それって難しくもなくて、楽しくできると思うので、いいきっかけになると思います。

※5 Word2Vec:テキスト処理を行うためのニューラルネットワークのこと。膨大なテキストデータを解析し、単語の意味をベクトル化することでその意味の類似性を計算したり、単語同士の意味を足し引きしたりできるようになる。

村井
勉強して感じたのは、自分が思ってたよりもデータ分析とかAIって身近なんだな、ってことです。興味があったら、まずはやってみてほしいですね。自分が思っている以上にできると思うので、頑張りましょう!

(写真2)楽しげな様子 鈴木(左上)、井上(左下)、村井(右上)、坂内(右下)

インタビュアー&LTSデータサイエンティストチーム リーダーコメント

鈴木
アルゴリズムや機械学習、プログラミング…学ぶことはたくさんあるけれども、学ぶこと自体は比較的誰でもできるのかなと思っています。難しいのは、全体感を理解し体系的に勉強すること、テキストにはない実業務で必要なスキルを勉強すること、だと思います。しかし、その実業務のスキルこそが、データ分析をやる上での醍醐味でもあると感じています。

坂内
データサイエンティストに興味を持ってくれる仲間が集まってくるのは嬉しいです。10年くらい前までは、AIやデータ分析って流行っているけれどもLTSの居るコンサルティングという業界とは違うし、自分たちがやる分野ではないという雰囲気でした。それがいまではより身近になって、少し勉強するとデータ分析ができるようになるということで、勉強し始める人が増えたんですけど、それってとても良いことだと思っています。勉強しやすい環境もあるので、このまま続けていって、将来的にはLTSの新入社員研修のコンテンツの一つにデータサイエンスが入ってもいいのではないか、と個人的に考えています。それくらい、データサイエンスのスキルって汎用的なものなので、みんながコンサルスキルとデータサイエンススキル両方持っています、という世界が来るといいなと思います。


ライター

大山 あゆみ(LTS コンサルタント)

自動車部品メーカーにて、グローバルで統一された品質管理の仕組みの構築・定着化を支援。産休・育休を経て、CLOVER Lightの立ち上げ、記事の企画・執筆を務める。現在、社内システム開発PJに携わりながら、アジャイル開発スクラムを勉強中。Scrum Alliance認定スクラムマスター(CSM)、アドバンスド認定スクラムマスター(A-CSM)、Outsystems Delivery Specialist保有。(2023年12月時点)