機械学習 – ITエンジニアの技術ノート

機械学習は大量のデータをコンピュータに覚えさせ、データからからパターン認識や規則を導くことです。

機械学習に向いているプロセッサ
ニューラルネットワーク
教師あり学習・教師なし学習
1. 教師あり学習における「分類」
2. 教師あり学習における「回帰」

機械学習に向いているプロセッサ

通常のパソコンの脳みそに該当するプロセッサはCPUですが、AI（特にディープラーニング）の処理においてはGPU（Graphics Processing Unit）の方が適しています。
CPUは少ないコアで少数の処理を順番に処理するのが特徴ですが、GPUは数千個の小さなコアを搭載しているので同時に大量の計算を並列で処理できます。
AIの分野においては並列計算が得意なGPUが圧倒的に有利なのです。

ニューラルネットワーク

ニューラルネットワークは生物の脳の神経回路を模倣した機械学習モデルの一種で、大量のデータを用いてパターンを学習し、予測や分類などのタスクを実行できる人工知能（AI）の技術です。
入力層、隠れ層、出力層から成っており、入力層はテキストや画像などのデータを受け取り、隠れ層では特徴の抽出などが行われ、出力層で結果を返します。

教師あり学習・教師なし学習

教師あり学習とは、入力と正解（ラベル）をセットにしたデータを使って、パターンを学習する方法です。

教師なし学習は、学習データにラベルを付けないで学習する方法です。
先ほどの例の続きで説明すると、画像をラベルなしで1週間読み取るうちに、AIが自律的に「猫」というものを認識するようになるということです。

教師なし学習は、似たものをグループ化するクラスタリングという手法が使われます。
クラスタリングを使って顧客を「似た行動をとるグループ」に分類し、それぞれに最適な広告戦略を考えるといった活用がされます。

教師あり学習における「分類」

分類は未知のデータをクラスに分けて学習させる手法です。

分類は例えば、迷惑メールと正常メールを使って文章の特徴とクラスの関係を学習させ、新着メールがどのクラスに当てはまるのかを予測するときに使えます。

教師あり学習における「回帰」

回帰はデータの関係性を見つけることができる学習です。
例えば、過去の気象データから翌日の気温を予測したり、商品の広告費や季節などから来月の売上を予測したりできます。