機械学習や深層学習(ディープラーニング)に続く、AI時代をリードする技術として注目されている「転移学習(Transfer Learning)」です。既存の学習モデルを別の領域に応用することで、少量のデータから新たなことを学習するための技術です。この転移学習について、機械学習や深層学習との違いや、「ビジネスの可能性を最大化する」と期待されている理由について見ていきましょう。
転移学習を理解するためには、AI(人工知能)の自己学習方法である機械学習、深層学習(ディープラーニング)との違いについて理解しておく必要があります。
AIは既存の膨大なデータから学習し、広範囲な知識と分析能力をもって問題の解決を図ります。「AIはデータから学ぶ」と考えると、わかりやすいでしょう。
これまで、コンピューターが特定のタスクを実行するためには、それを指示するプログラミングが必要でした。とくに何かの事象を判別するには、詳細な特徴に対する膨大な分岐が発生するため大量のプログラミングが必要でしたが、AIでは、トレーニング用のデータセットなどから物事の判別に対するルールを学習することで、この人手によるプログラミングなしに、新たなデータに対し判別、予測ができるようになります。例えば、売上やパフォーマンスの成果、天候など、現時点においては結果が分からない「未知のモノ」の予測を行います 。
これにより、たとえば、顧客が求めている商品やサービスについて知ることができるほか、問題点や改善点を早期に把握できるなど、広範囲なビジネス分野で役立てることが可能です。
このAIにおける学習方法として機械学習、そして深層学習があります。深層学習は機械学習の一種ですが、両者の最大の違いは、問題を解決する際のアプローチです。機械学習はデータを構造化したり、画像にラベルを付けたりするなど、一定の「学習指標」を必要とします。一方深層学習は、ニューラルネットワーク と呼ばれる人間の脳をモデルとするアルゴリズムを持ち、機械学習のような指標を必要としません。ただし、機械学習よりもはるかに多くのトレーニングデータを必要とします。
転移学習とは深層学習の進化版と言われ、特定のタスクに対してトレーニングされた学習モデルを、別のタスクに転移(=応用)するための技術です。既存の学習モデルを再利用することで、一からトレーニングする手間や時間を大幅に縮小することができます。
この「既存の学習モデルを再利用する」とは、人がオートバイの運転を練習する時、自転車に乗るために習得したバランス調整技術を使っていることを考えると理解しやすいでしょう。
転移学習の研究・採用が活発化しているビジネスケースとして、ロボットアームなど産業用ロボットへの採用が挙げられます。ロボットアームと一言にいっても、用途や利用分野は様々です。それぞれの作業に合わせた最適なプログラミングが施されていますが、形状が多様性に富むモノ(人や野菜、果物など)すべてに対応させるためのプログラミングは困難である点が指摘されています。
そこで、ロボットの制御にAIを活用し、より効率よく学習させる手段として転移学習を導入する試みが行われています。既存の学習モデルを新たなスキルの学習に役立てたり、ロボット同士でお互いに学習し合わせたりといったことが可能で、従来よりも短時間での学習が可能となっています。
画像認識やシミュレーション、ゲームなどの分野では、すでに転移学習の実用化が進んでおり、今後はさらに広範囲なビジネスの領域に、転移学習が浸透すると考えられています。
現時点の主なメリットとして、学習モデル(特定の領域で学習したこと)のトレーニングに費やされる時間やコスト、設備投資の大幅な削減が挙げられます。
特定のデータセットのパターンを学習したアルゴリズムを、多様な分野で利用することができるようになれば、新しいアプリケーションを構築したり、既存のアプリケーションに機能を追加したりすることも容易になるでしょう。
また、顧客分析やインテリジェンス(知能)を備えたチャットボットであるインテリジェント・ボットのトレーニングにおいても、作業の効率化やタスク・パフォーマンスの向上に役立つでしょう。
深層学習の発展的な使われ方とも言える「転移学習」。ただし、現状は課題があり、改善が必要との指摘もあります。
特に「ネガティブ・トランスファー(負の転移)」は、現時点における最大の課題です。これは、「ベースとなる第1の学習モデルと、それを応用しようとする第2の学習モデルに十分な共通点がない」とアルゴリズムが判断した場合に起こる現象です。2つのモデルの差異が大きすぎると、トレーニングをまったく行わない時よりもパフォーマンスが低下することがあるのです。
例えば、車を判別できる第1の学習モデルを、第2の学習モデルに転移学習させ、2人乗りの赤いスポーツカーを特定させるとします。このとき第1の学習モデルにおける赤い車の定義が、キャンピングカーやトラックなど、2人乗りのスポーツカーから特徴が大きくかけ離れている場合、第2の学習モデルでは「十分な共通点」を見出せず、本来は10台あるはずの2人乗りの赤いスポーツカーを、たった1台しか特定できないかも知れません。
このように転移学習は、現時点において、どのようなタイプのトレーニングに十分な関連性があるのか、また「十分な共通点」をどのように測定すべきかについての判断基準やルールが明確になっていません。
また、以前に学習したことが、新たな学習の妨げとなる場合、ここでもネガティブ・トランスファーが起こります。「ドイツ語を学習した後、中国語を学習すると頭が混乱する」「左ハンドルの車の運転に慣れていると、右ハンドルの車の運転が困難に感じる」など、1つのタスクを学習すると、他のタスクの学習が難しくなるのは、人間に限った現象ではありません。
ターゲットタスクのパフォーマンスを向上させるためには、「知識のどの部分を転移できるか」について、慎重に判断する必要があります。
現在、AIのさらなる普及の壁となっている導入コストやリードタイムの長さにおいて、転移学習の技術は、大きく解決できる可能性を持っているものと期待できます。
その一方、多様な領域で実用化するためには、前述のネガティブ・トランスファーなど、クリアすべき課題があります。最近では、第1の学習モデルのデータが一般的なものであるほど、ネガティブ・トランスファーが起こりにくいと報告されており、研究や採用がさらに進むことで、それぞれの課題の解決策が見えてくるでしょう。
技術のイノベーションは、新たな発見と改良の繰り返しにより発展を遂げる分野です。最新情報にアンテナを張り巡らせることで、新たな投資チャンスが見つかるかも知れません。