G学院を運営する株式会社GimoGimoのオウンドメディア「G-MEDIA」

G学院のコラム

2019.10.11 Fri.
AIに欠かせない機械学習って何?

AIに欠かせない機械学習って何?

AIを学習するときに必要となるキーワードの中に、機械学習というものがあります。
最近では、機械学習も全てAIと同じものにされてしまっていると思います。
AIの基礎知識としても知っておきたい、機械学習とは一体どのようなものかを、しっかり学習しておきましょう。

機械学習とは何か?

機械学習とは、英語ではMachine Learningと言い、AIに含まれているものになります。

 

コンピュータに特定のタスクを実行させて、法則などを自動化することを目的にしています。機械学習の種類としては、アルゴリズムや手法があるのですが、その中のひとつにディープラーニングがあります。そしてこの機械学習の理解をする際に重要になるのが、特徴をつかんで法則化することと、この法則を自動化することにあるのです。

 

機械学習は、その名の通りに学習する機械のことを指していて、データから反復学習をして学習結果を元に法則化を行い、傾向や特徴を学習します。

 

さらにこれらの傾向や特徴を自動化することで、次回からは法則に従って実行させることができるようになります。機械学習とはシステムそのものを指していて、機械学習を動かすときに様々なプログラムが必要になりますが、法則を自動化する部分については、ノンプログラミングで行うことがポイントです。

 

機械学習の本質

AIの目標のひとつとして、コンピュータ上で人間の知能を実現させることにあります。
その手段として機械学習があるのですが、機械学習は大量にあるデータから、世の中の特定のことについてデータを解析して、はっきりとした指示を用いることなく、パターンから結果を導いていきます。

 

その結果を学習して、判断や予測を行うためのアルゴリズムや統計モデルの科学研究を使用した手法と言えます。

 

機械学習が活用される分野

機械学習は、金属工学、画像処理、自動運転、生物学など、様々な分野で活躍して大きな影響を与えています。

具体的に分析という状態から言えば、Webサイトなどのクリックデータの分析や、購買の履歴を元にして、興味や関心がありそうな情報を提供するレコメンデーション、郵便物の配達をする際に仕分けをすることにも使用されていますし、スマホなどに搭載されている顔認識機能にも利用されています。

 

ゲーム分野においても活躍していますが、代表的なゲームタイトルとしてはLeaque of Legendsがあります。

 

機械学習の歴史

機械学習という研究分野が定義されたのは、1959年からなので、実に60年は研究されている実績があります。

この機械学習を定義したのは、IBMのエンジニアであるアーサー・サミュエルという人物です。

 

アーサーは、チェッカーというボードゲームをプレイするプログラム開発に取り組んでいたことが切っ掛けで、次にどんな手を打つべきかをコンピュータに考えさせるといったことを、色々と考えたみたいです。そしてコンピュータと何千回、何万回とチェッカーをプレイして、その膨大な対局データの中から、どのように進めれば勝ちパターンになるのか、負ける傾向にあるのかなどを、機械に学習をさせたのです。

 

アーサー自身は、チェッカーが得意ではなかったので、不得意な人間が勝ちパターンを教えても無駄という考えから、機械に勝ちパターンを発見させる仕組みを考えたと言います。

 

いずれにしてもアーサーの狙いは上手くいき、1961年にはアメリカで第4位のチェッカープレイヤーを倒すことに成功した実績を持っています。そしてこの機械学習を、コンピュータにプログラムしていなくても、学習する能力を持つようになることを研究する分野にしました。

 

機械学習とデータマインニング

機械学習とデータマインニングは、交差する部分が大きく混同されることが多いです。

それぞれの目的として、機械学習は訓練データから学んだ特徴に基づいた予測のことを言い、データマイニングは、それまで知られていなかったデータの特徴を発見することにあります。

 

この二つの関係は、様々な面でオーバーラップしていて、データマイニングは機械学習の技法を使いますが、その目的は若干異なる使用となっています。

 

機械学習もデータマイニングの技法として、教師なし学習をすることがありますが、正確性を向上させる処理として用いることがあります。

 

アルゴリズム分類

機械学習とは、コンピュータに何らかの学習をさせることができれば、そう呼ばれます。

 

しかし一般的に機械学習と言えば、コンピュータに大量のデータを与えて、その中に潜んでいるパターンから法則を見いだしたときのことを指すことが多いのですが、学習させるデータによっても質が異なります。そこで機械学習のアルゴリズムの分類というものがあります。

 

この分類は大きく分けて3つ、教師あり学習、教師なし学習、強化学習に分けられます。

教師あり学習では、入力と正解データをセットにしてデータを与えると言うものになります。

 

例えば大量のデータを用意して、正しいデータと間違っているデータに分けて学習させれば、あるデータを入力するとそれが不正なのかを、コンピュータ側が独自判断してくれるようになるのです。

教師なし学習では、機械にたくさんのデータを与えるだけで、その中にある隠れた規則性を自ら発見させることができます。
例えばECサイト上の大量のデータから、同じようなパターンを持つクラスタを把握したい場合には、人の手が入ると年齢や住居などから、人が考えた枠組みの中でしか分類することしかできません。

 

機械がデータに基づいたクラスタ分けをすると、あるクラスタの誰かが買った商品を同じクラスタの他のユーザーにレコメンドした、といった分け方も可能になります。

 

強化学習も、教師なし学習同様に大量のデータだけを与えるだけですが、機械に達成させたい条件を設定し、アルゴリズムが何らかの判断を行い、その結果に応じて報酬を与えるようにします。

それを繰り返すことで報酬がフィードバックになり、機械自らが正しい答えを導き出してくれます。

 

つまり行動を繰り返していく中で、徐々に学習していく感じになります。

 

ニューラルネットワークと機械学習

ニューラルネットワークは、機械学習の研究課題の一つとして挙げられていて、人間の脳内に存在する神経細胞の働きから着想を得て、作成されたシステムのことです。

人間の脳の働きは完全には解明されていないところもありますが、あくまでも人間の脳の一部から着想を得たというところが、ポイントになっています。

 

機械学習が何故話題になるのか

機械学習が話題になる理由として計算能力の高さ、大量データの取得が簡単ということが挙げられます。

計算能力の高さについては、機械学習へのGPUを適用したことにより、CPUに比べて10倍以上のパフォーマンスが発揮できるようになったという実績があります。

 

これは例えば、CPUで48時間かかっていた処理でも、GPUを使用すれば約5時間で終了させることができるなど、作業の効率が遥かに向上することになります。

 

そして大量のデータの取得が簡単であることは、データセットの重要性が広がり、ネットの普及により公開されているデータを簡単に集計することができるようになることは大きいです。

 

機械学習のメリットは、単純な条件であればルールベースの対応で解決度を上げられることができますし、人によるうっかりミスなどが起きるリスクも少ないなどを言えるでしょう。

 

機械学習について紹介しました。
AIや機械学習は、専門的な言葉や知識が多く登場しますので、不明な点が多くなることは仕方のないことだと思います。
説明した用語は、もちろんネットで調べても理解できますが、できれば専門の機関で勉強をした方が理解の幅も広がるでしょう。

この記事を友だちにシェアする

  • line
  • twitter
  • facebook

前の記事へ

一覧へ戻る

次の記事へ