ディープラーニング(深層学習)とは?基本と実用例・応用例をわかりやすく説明します
本ページにはプロモーションが
含まれていることがあります
ディープラーニングは深層学習とも呼ばれ、機械学習の分野で、現在最も注目を集めている手法です。
今回は、
「ディープラーニングって最近よく聞くけど何だろう?」
「データサイエンスに興味があって詳しく知りたい」
という方に向けて、ディープラーニングとはどんな技術なのか、基本的な情報と仕組み、そして活用例を紹介します。
資料請求でデータサイエンスの基礎が学べる講義を無料プレゼント
・講座(G検定・機械学習・データ分析など) 約3時間分
現役プロ講師によるわかりやすい講義
1分で簡単!今すぐ見れます(会員登録→お申込み→講座視聴)
目次
ディープラーニング(深層学習)とは?
機械学習の一種である「ディープラーニング(Deep Learning)」は大量のデータをもとに自動で特徴量を抽出し、学習していくAI技術です。
基本的には3層以上からなる、多層のニューラルネットワークによって構成されています。
ニューラルネットワークとは人間の神経細胞を模倣したアルゴリズムで、入力されたデータを自動で処理・学習して次の層へと受け渡します。
それぞれの層の繋がりは、データから抽出した特徴量の重み(重要性)によって強くなったり弱くなったりし、データの処理方法を学習していきます。
このように、ディープラーニングでは非常に複雑な分析処理が実行されます。
以前はこの処理にかかる時間が膨大なものでしたが、近年コンピューターの性能が飛躍的に向上したことにより、一気に実用化が進みました。
ディープラーニングの特徴 特徴量を自動で抽出できる
ディープラーニングの特徴は、従来の機械学習で必須だった「特徴量の設計」が不要である点です。
特徴量とは、データの分類に必要な情報のことです。
例えば画像認識の場合、色や画像のエッジ(形)などが特徴量として扱われます。
機械学習による予測では、データを分類する際にどの数値に着目するのか、またその範囲をどう扱うかなどを事前に人が指定しなければなりません。
そのため、画像やテキストのような構造化されていないデータでは非常に複雑な設計が必要になるため、取り扱いが困難でした。
一方ディープラーニングでは、入力されたデータがニューラルネットワーク内の「隠れ層」を経由するうちに、データの判別に必要な特徴量が自動で抽出されていきます。
つまり、テキストや画像などの特徴量の指定が難しいデータでも、どのような情報に注目すればよいかを直接判断させることができ、人の手では指定しにくい複雑な特徴も捉えることができるのです。
1000万枚の猫の画像を入力することによって、人が教えることなく、猫を認識できるようになったグーグルの話が有名です。
ディープラーニングの仕組み:ニューラルネットワーク
ディープラーニングは神経の構造を模倣したニューラルネットワークにより構成されています。
この構造は「入力層」「隠れ層(中間層)」「出力層」の3種類から構成されています。
「入力層」は外部からのデータを受け取る層、出力層は「結果・結論」を出力する層です。
そして、その間に存在する「隠れ層」が情報を処理し、データをラベリングする特徴量を抽出して受け渡していきます。
複雑につながった「隠れ層」の経路や組み合わせのパターンによって、「出力層」の結論が導かれるのです。
何層もの「隠れ層」のうち、浅い層では部分的なミクロな特徴が、より深い層ではそれらを組み合わせたマクロな特徴が抽出されます。
最終的に、全体的な特徴から入力データが判断され、「出力層」から出力されます。
かつては「隠れ層」が1層のみの、計3層のネットワークが精度を出せる限界でした。
ですが、現在は4層以上からなるディープニューラルネットワーク(DNN)が一般的になっており、100層以上の「隠れ層」がある複雑なモデルも存在します。
もっとも、隠れ層の数が多いほど正確なモデルとなるわけではありません。
不要な特徴を誤って学習することにより精度が低下してしまうことは珍しくないため、適切なモデル設計が重要です。
ディープラーニングの実用例
ディープラーニングが得意な分野は、「画像認識」「音声認識」「文章認識(自然言語処理)」など、人の手で特徴を指定するのが難しい非構造化データの処理です。
以下、身近な実用例を紹介します。
実用例1 オンライン画像検索
みなさんもGoogleなどの画像検索システムを使ったことがあるかもしれません。
これは、画像データをアップロードすると、膨大なWEBサイト上から類似の画像を見つけ出してくれる機能です。
このシステムにもディープラーニングが利用されており、“アップロードした画像の特徴を抽出して、映っているものを判断し、その結果に基づいて近い特徴を持つ画像を検索する”という処理が働いています。
実用例2 医療画像診断
ディープラーニングによる画像認識は医療の現場でも活用されています。
組織の顕微鏡画像を学習させることで、正常な組織なのか、がん細胞などの異常な組織なのかを判別させることができる技術が構築され、NECなどからシステムの販売が開始されています。
医師の目でも見つけられない微細な兆候も判別できる場合があり、今後の医療発展への貢献が期待されています。
実用例3 ホームアシスタントデバイス
人の声に反応し、命令に応じた動作や提案をするsiriやアレクサのようなデバイスにも、ディープラーニングが用いられています。
人の声は性別、年齢、地域などの要因によって差が大きく、前処理によるラベル化が困難なデータの一つですが、ディープラーニングによる音声認識で指示に該当する特徴を抽出・認識し、対応する処理を実行しています。
実用例4 自動翻訳
「自然言語処理」と呼ばれる、テキストデータを分析する手法はディープラーニングの得意とする領域です。
例えば、有名な「DeepL」というソフトでディープラーニングが活用されているのは有名です。
詳細については公開されていませんが、複雑な処理が可能な「畳み込みニューラルネットワーク(CNN)」と呼ばれる手法が用いられています。
話し言葉はもちろんのこと、難解な専門用語や方言も自然に翻訳でき、ニュアンスを活かした自然な翻訳ができると評価されています。
実用例5 書き文字認識
これまでも、OCRというシステムによって、定型のフォーマットでの文字認識は可能でした。
ですが、これは配送伝票のような ”どこに何のデータが入っているか” があらかじめ決まったものにしか使用できません。
ディープラーニングの登場によって、文字の曲がり、とめ、はねなどの特徴を学習し、文字をより高い精度で判別できるようになりました(AI-OCR)。
これにより、文書やメモ書きのようなどこに何が書かれているか事前に判別できない文字列でも、データとして処理することができるようになっています。
このような書き文字認識の技術は、記述式の試験問題の採点プロセスの効率化や、郵便などの文字認識精度の向上に役立てられています。
ディープラーニングの応用例
ここからは、現在検証が進められている新しいディープラーニングの活用について簡単に紹介します。
応用例1 自動運転
自動運転技術は、ディープラーニングを利用した技術の中で、最も期待される技術のひとつです。
日本でもトヨタをはじめとした様々な会社で自動運転システムの開発の実証実験が進められています。
車の運転は、目的地へのルート設定をはじめ、道中の信号や道路標識、対向車や歩行者など、多くの情報の認識と判断が求められます。
これらの判断をAIに任せる上で、特に「画像認識」の面にディープラーニングが活用されています。
たとえば、道路標識や信号などは規定の形が決まっているため、比較的認識が容易なデータと言えます。
いっぽう障害物や歩行者は一定の姿をしておらず、特徴量を指定するのが難しいデータです。
これらを素早く認識し対処するために、直接特徴量を判別し情報を処理できるディープラーニングが重要になっているのです。
応用例2 オンラインショッピングの満足度向上
マーケティングにおける顧客満足度の向上や、返品率低下のためにもディープラーニングは応用されています。
たとえば、ファッション系オンラインショッピングの場合、サイズとフィットの悪さが返品における第一の要因と言われています。
これまでも身長・体重の数値などからサイズの目安を提案してくれるアルゴリズムはありましたが、単純な数字から体型を正確に予測することはできません。
また、サイジングやフィット感の好みなどは人によって違うため、その特徴を捉えた最適な提案システムを作ることは困難でした。
2021年に報告された以下の研究では、大規模な返品データについてのディープラーニングを活用した「SizeFlags」と呼ばれる手法によって、サイズに関する返品を効果的に削減することが実証されています。
応用例3 広告の最適化
オンライン広告は、広告主にとっての重要なマーケティングツールであり、同時にYoutubeやWEBサイトなどのコンテンツの作り手にとっては主要な収入源です。
そのため、ユーザーの好みに最適化され、ついクリックしたくなるような広告の自動表示システムが望まれています。
ですが実際のところ、私たちがインターネットをしているとき、あまり興味がない広告ばかりが表示されてしまう、といった経験も少なくないかと思います。
このようなミスマッチを防ぐため、広告主の想定とマッチするユーザーにのみ広告が表示されるよう、ディープラーニングを利用した新しい広告システムが開発されています。
まとめ
ディープラーニング(深層学習)とは?
- 大量のデータをもとに自動で特徴量を抽出し、学習していくAI技術を指す
- 特徴:従来の機械学習で必須だった「特徴量の設計」が不要である点
ディープラーニングの実用例
- オンライン画像検索
- 医療画像診断
- ホームアシスタントデバイス
- 自動翻訳
- 書き文字認識
ディープラーニングの応用例
- 自動運転
- オンラインショッピングの満足度向上
- 広告の最適化
資料請求でデータサイエンスの基礎が学べる講義を無料プレゼント
・講座(G検定・機械学習・データ分析など) 約3時間分
現役プロ講師によるわかりやすい講義
1分で簡単!今すぐ見れます(会員登録→お申込み→講座視聴)
実践的な
Python・データ分析スキル
を身に付けたい方へ
何から手をつけたら良いかわからない
独学で挫折したことがある
専門的な内容で身近に相談できる人がいない
このような悩みをお持ちでしたら
AI Academy Bootcampにご相談下さい!
この記事の著者 アオミ ソウ
薬学系大学院の修士課程を主席卒業後、大手製薬企業で有機合成・データサイエンス関連業務に従事(専門は生物有機化学)。
現在は研究の傍ら、ライターとして記事の執筆・イラストの制作を行っている。
主な執筆分野はサイエンス(医療、生化学、情報科学)をはじめ、ガジェット、資格など。
保有資格
2018年 危険物取扱者甲種
2021年 データサイエンス数学ストラテジスト(上級)
2021年 応用情報技術者