データサイエンティストになるための勉強方法

こんにちは!
IT企業に勤めて、約2年間でデータサイエンティストになったごぼちゃん(@XB37q)です!

このコラムでは、データサイエンティストになるための勉強方法を紹介しています!
データサイエンティストを目指す人は、是非このコラムを活用して目指していってください!

データサイエンティストになるための勉強法

データサイエンティストになる4つのステップ
データサイエンティストになる4つのステップ

データサイエンティストになるための勉強方法は、4ステップに区別できると考えています。
このコラムでは、4ステップがなぜ必要かを紹介した後、それぞれのステップでどのような勉強法があるかを紹介します!

  • データサイエンティストについて理解する
  • 統計学を学ぶ
  • pythonを使用して実際に手を動かす
  • 技術×業界を意識して自分の専門領域を作る

データサイエンティストについて理解する

まず初めにデータサイエンティストがどういった職業なのかを理解する必要があります。
その上で、必要なスキルを理解し、学び始めることが重要だと思います。

他コラム「データサイエンティストになるために必要な能力」など、私のサイトでも紹介しているので、参考にしてみてください!

また、私がデータサイエンティストになってから気づいた点などをまとめたnoteも公開しています!
2年間でデータサイエンティストになるノウハウnoteで公開!
https://note.com/ai_laboratory

統計学を学ぶ

統計学を学ぶためには、書籍やネットなど、下記の3通りがあると思います。
データサイエンティストになるために所属している学校や会社が支援してくれている場合、セミナーで学ぶことが有意義かもしれませんが、そのような人は私のコラムのようにネットのみで調査を行う必要はありません。

そのため、このコラムでは書籍とネットの2通りの学び方を紹介します!

  • 書籍で学ぶ
  • ネットで学ぶ
  • セミナーで学ぶ

書籍で学ぶ

統計学を学ぶには、「統計学が最強の学問である」シリーズを学ぶことをお勧めします!
具体的な知識を学ぶより、統計学がどのように使われていて、どのように役立つかを紹介している書籍です。

私もデータサイエンティストになる初めの1か月で下記の書籍を読みました。
統計学の面白さを役立て方を理解でき、データサイエンティストを目指すやる気が向上したのを今でも覚えています!

ネットで学ぶ

基本的に私は書籍で統計学全般の知識を学ぶことが多いですが、ネットで調査するときは、下記のサイトで学んでいます!
このコラムや、他の統計学に関係するブログなど、世の中には様々なブログが存在しますが、初めはなるべく信頼性の高いブログから学ぶことが有用です。
信頼性の高いブログには、統計学全般の知識しか載っていない場合が多いため、少し深い知識や専門的な知識は、信頼性に注意しながら個人のブログを見て学ぶことをお勧めします!

BellCurveの統計WEB
https://bellcurve.jp/statistics/

セミナーで学ぶ

信頼性が高いものを見ながら学ぶことが良いと紹介しました!
セミナーでは、ある程度の金額を払って学ぶセミナーなどがあるため、そちらもおすすめです。
私は会社のセミナーを受けることが多いため、その都度どのセミナーを受講するかは変化します。

統計学の理解を確認する

実際に書籍やネットで学んだあとは、資格試験を受講することをお勧めします!
知識の確認や、就職活動や転職活動でも、話のきっかけやデータサイエンティストを目指す背景にもつながってくるため、使いどころは多いと思います!

しかし、資格試験を取ることが目的ではなく、取得したからデータサイエンティストに慣れたと確定するわけではありません。
資格試験は単なるシンボルのようなものだと認識しておきましょう。

資格試験は「統計検定2級」がおすすめです!
統計検定は1級までありますが、準1級と1級は数学的な証明が多くなり、ビジネスで使う場面があまり多くないことから、2級までで十分だと思っています。

私は大学で統計学を学んでいたため、参考書は使いませんでしたが、初めて統計学を学ぶ方は過去問を参考にして受験したほうがいいかもしれません。

pythonを使用して実際に手を動かす

あとはひたすらpythonやRなどのプログラミング言語を使用して、手を動かしながら学んでください!
理論だけではなく、実際に手を動かすことで理解が深まることや、思ったより精度が向上しなかった場合など、様々な経験が出来ます。

pythonに関しては、以下のコラムで紹介しています!

技術×業界を意識して自分の専門領域を作る

技術力×業界で専門領域を作る
技術力×業界で専門領域を作る

技術力を磨くだけではなく、その技術力をどの業界に適用するかを意識することにより、自分の得意な専門領域を作ることができます。
私の場合は、「テキストマイニング」×「アンケート」、「テキストマイニング」×「コールセンター」、「決定木」×「需要予測」、「時系列分析」×「需要予測」などが得意な領域です。

データ分析の案件に関わることが出来る人の場合、関わる案件によって自動的に業界が決まり、業界に対して適切な技術を磨くという順番になると思います。

業界は経験から磨くことが出来ますが、技術は自分で学ぶしかありません。
以下は私が使用しているおすすめの書籍です。

技術を専門にする 深層分析

技術を専門にする 自然言語処理

技術を専門にする 時系列分析

データサイエンティストになるための注意点

分析屋にならないように注意する

データサイエンティストになるために、ただの分析屋にならないことが重要です。
世の中のAIブームに応じて、分析だけが得意な人はたくさんいます。

データサイエンティストは、データを使って特定の課題を解決する職業です。
そのため、データ分析の能力だけでなく様々な能力が必要です。

私が書いたnoteには、分析屋ではなく、データサイエンティストになれるようなロードマップを紹介しています!

https://note.com/ai_laboratory

インプットだけにならないように注意する

人はアウトプットをすることにより、脳が知識を記憶すると言われています。
教科書で理論だけをインプットするのではなく、手を動かすことや周りの人と話す、または教えることで、知識をアウトプットしていってください!
理想的な比率は、インプットが3割、アウトプットが7割と言われています。
私も、SNSやこのブログなどでアウトプットの癖をつけることにより、知識が蓄積されていき、経験が増えていきます。

自分でも理解していないことが分かることもあるので、SNSなどの発信はおすすめです!

まとめ

  • データサイエンティストを目指すステップ
    1. データサイエンティストについて理解する
    2. 統計学を学ぶ
    3. pythonを使用して実際に手を動かす
    4. 技術×業界を意識して自分の専門領域を作る
  • データサイエンティストになるための注意点
    • 分析屋にならないように注意する
    • インプットだけにならないように注意する