11/23/2019 0 Comments AI

「機械学習」について知りたい! ―教師あり学習って?-



Yuki Igarashiです。

前回は「人工知能」の種類がいろいろある話をしましたが、「機械学習」という言葉も良く聞きますよね。今の人工知能ブームのきっかけになったのは機械学習という分野の発展が大きなきっかけでもあります。今回は機械学習について説明したいと思います。

「機械学習」というのは、コンピュータがたくさんのデータ(訓練データ)から何らかの「モデル」を生成し、それに基づく予測を行います。「マシンラーニング(Machine Learning)」とも言われます。

教師あり学習」、「教師なし学習」といった言葉は聞いたことがあるでしょうか? 
機械学習は、「教師あり学習」「教師なし学習」「強化学習」の3つに大きくわけられます。今回はこの中で、教師あり学習について、解説したいと思います。

教師あり学習では、入力とそれに対応するラベル(出力)をあわせて機械に入力していきます。例えば、犬の画像を入力したときには「イヌ」とラベルをつけておく。猫の画像を入力したときには「ネコ」とラベルをつけておく。これを大量のデータで学習させることで、ネコともイヌともラベルのついていない1枚の画像を「ネコ」と判別することが可能になります。

画像以外にも、私たちの身の回りでは、迷惑メールフィルタの分類などに使われています。メールの文章の中に出てくる単語に注目をして、その単語が通常のメールのやりとりの中に出てくる確率と、迷惑メール(スパムメール)の中に出てくる確率を計算し、迷惑メールらしさ(確率等、数値で表したもの)を算出します。このときの機械学習の入力は「迷惑メールの文章そのもの」、対応する出力はこの「迷惑メールらしさ」を使います。これにより、何かメールの文章がきたときに、そのメールが迷惑メールらしいかどうか、を判断することができ、その結果が「迷惑メールの可能性が高い」と判断したものを迷惑メールフォルダへと自動で入れることができるのです。

教師あり学習の問題は、上記の2つの例のように「分類」するタイプの問題の他に「回帰」というタイプの問題にわけることができます。分類は入力に対して順番のないラベルを対応づける問題であるのに対して、回帰は入力に対して連続した数値を対応づける問題です。

回帰では、年齢と身長のデータが複数人分あったときに、新しい年齢の入力がきたら、どのくらいの身長なのかをある程度の誤差を許せば予測することができる、といった問題を扱います。

実際に自分の手で機械学習を動かしてみることも簡単にできます。初めての人は、『Pythonで動かして学ぶ!あたらしい機械学習の教科書』(翔泳社)や、『OpenCVとPythonによる機械学習プログラミング』(株式会社マイナビ出版)などが参考になるでしょう。後者は、Michael Beyelerによる書籍『Machine Learning for OpenCV』を訳出した書籍で、書籍の中では公開されている有名な機械学習データセット(「ボストン住宅価格データセット(Boston housing prices dataset)」等)を用いて、具体的にソースコードを書き下しながら解説していて、わかりやすいのでお勧めです。

 

Yuki Igarashi(五十嵐悠紀)

profile
コンピュータグラフィックス、ユーザインタフェース分野の研究者。子育て中の母でもある。
著書に『AI世代のデジタル教育 6歳までにきたえておきたい能力55』(河出書房新社)、『スマホに振り回される子 スマホを使いこなす子 (ネット社会の子育て)(ジアース教育新社)、他。

ABOUT US



Share: