データサイエンティストになる初めに学ぶ!データ分析の目的と手法

ここんにちは!
IT企業に勤めて、約2年間でデータサイエンティストになったごぼちゃん(@XB37q)です!

このコラムでは、データ分析について簡単に紹介しています!
別のコラムでは、なぜAIが流行したのかや、AIの原理や仕組みを簡単に紹介しました。

ここではもう少し詳細にAIの原理を紹介しようと思います。

データ分析の概要

データをグラフ化
データのグラフ化

AIには厳密な定義が存在しませんと別のコラムで紹介しました。

そして、そこでは私なりの定義【AIとは、多量のデータに共通するある傾向を、コンピュータが学ぶこと】としてAIを紹介しています。

そのように私がAIを定義した内容は、「データ分析」と呼ばれている考え方です。つまり、AIは「データ分析」の考え方を根本に置いたシステムだとも言えます。

じゃあその「データ分析」とは何なのかを、このコラムで紹介していこうと思います。

「データ分析」とは、【AIとは、多量のデータに共通するある傾向を、コンピュータが学ぶこと】と説明しましたが、少しビジネスよりに言い換えると【文字や数値などを収集し、分類や整理をしたうえで、価値のある意味を見出す】ことです。

ここでは簡単な概要までとしましょう。次の章からは、もっと詳しくデータ分析を理解するために、目的や実際に使う手法などを紹介していきます。

データ分析の目的

データ分析の3つの目的
データ分析の3つの目的

主に3つの目的に対して、データ分析を使うことが可能です。

  • 予測
  • 識別
  • 把握

それぞれやりたいことは違っており、解決したい課題に対して3つの目的から1つを設定します。

予測(例)将来の売上がいくらになるのかどうかを予測する
識別(例)生産品の画像を検知し、不良品かどうかを識別する
把握(例)売上に影響を与えている項目を把握する
(例)アンケートの感想を要約して現状を把握する
データ分析の目的とその例

例えば、予測がしたい場合は、将来の売上がいくらになるのかどうかを予測するなどが可能です。

次に、識別がしたい場合は、生産品の画像を検知し、不良品かどうかを識別するなどが可能です。

最後に、把握がしたい場合は、売上に影響を与えている項目を把握するなどが可能です。

このように、データ分析という考え方を使えば、未来予測を行ったり、過去の傾向を把握したりなど、様々な使い方が考えられます。現在の別のコラム「AIブームは現在で3回目?」で紹介した第3次AIブームでは、このデータ分析をビジネスにも応用できないかといった取り組みに注目されています。

この章ではデータ分析がどのようなことに適用できるかといった内容を紹介しました。

次の章では、実際にデータ分析に使われる数々の手法を簡単に紹介します。

データ分析の手法

目的別の分析手法
目的別の分析手法

先ほどデータ分析は様々な事象に適用できると説明しました。しかし1つの考え方で様々な事象に適用できるわけではありません。

データ分析の中にも様々な分析手法が存在するため、分析の目的に合わせて分析手法を選ぶ必要があります。

このコラムでは、分析の目的と手法の特性に合わせて分析手法を整理しました。各手法の詳細説明は、別コラムで載せる予定のため、ここでは割愛します。ここでは、分析の目的と手法の特性に沿って様々な手法を使い分けることが大事と覚えておいてください。

分析手法を選ぶ際、まずは分析の目的を意識する必要があります。未来の予測がしたいのに、テキストマイニングという手法を使えなかったり、把握をしたいのに、時系列分析は使えないといったことが起きてしまうからです。これを防ぐためには、各分析手法の理解を進める必要がありますが、ここはAI専門家に任せればいいでしょう。やりたいことによって使えない手法もあるということを覚えておいてください。

次に、各分析手法には手法の特性が存在します。ここではそれを目的変数ありと目的変数なしと説明しています。詳細は別のコラムで説明しています。

このように手法にはそれぞれ特性があるため、この特性を使い分ける必要があります。また、手法の特性だけでなく、データに目的変数がない場合などもありますが、この場合は目的変数なしの分析手法を必然的に選択することになります。