ディープラーニングが無双!画像解析の基本とできること

こんにちは!
IT企業に勤めて、約2年間でデータサイエンティストになったごぼちゃん(@XB37q)です!

このコラムでは、画像解析の基本について紹介していきます。

画像解析でできること

物体検知と物体判別
物体検知と物体判別

主に物体検知と物体判別の2つの分野に対して、画像解析が使われます。

物体検知とは、分析に使う画像データの中から、特定の物体の位置を検知する分野です。

主にコロナ対策による人の顔の温度検知や、自動運転による危険物の検知などで使われています。

物体判別とは、分析に使う画像データに対して、特定の物体だと判別する分野です。

主に工場による正常品と不良品の判別や、部品の判別などに使われています。

このように画像認識はイメージがつきやすく、比較的取り組みやすい分野だと思われます。そして、この画像認識にもやはりAIが使われているのです。

必要な画像

画像解析に必要な画像
画像解析に必要な画像イメージ

必要な画像は検知したい、または判別したい対象がある画像データがあれば、AIのモデルを構築することが可能です。

例えば、正常品と不良品の判別をしたい場合は、正常品の画像データと不良品の画像データが必要になります。

また、画像認識には特にディープラーニングが使われることが多い分野です。ディープラーニングを使う場合は、画像データの量が多ければ多いほどより精度の高いAIモデルを構築することができます。一概に何枚必要かといったことは言えませんが、最低でも100枚から500枚は欲しいところです。

画像解析の学習の流れ

画像データの形式
画像データの形式

では、どうやって実際に画像データを使ってAIが学習するのでしょうか。

AIは数字しか扱うことができません。そのため、まずは画像データを数字で表す必要があります。

元々画像データは、RGBと呼ばれる3種類の値が合体して1枚の画像データとなっており、赤 (Red)、緑 (Green)、青 (Blue)をそれぞれ表しています。色とは、赤・緑・青の各要素がどれだけ含まれているかで記述することができるというのが、画像分野の考え方になります。

そして、色の明度というのが存在します。この明度は0から255までの256個の数字でも表現され、これは各要素の明度をコンピュータで表現しやすくした値になっており、コンピュータにおける色の表示によく使われています。

そして、ファイル上では画像データのRGBの並びは1行につらなっており、その中に0~255の数字が入っているため、これを数値データとしてAIモデルを構築していくことができるという流れになります。

AIを構築するための詳細な流れは次回のコラムで紹介することにし、このコラムでは画像解析の基本を覚えていただければと思います。