【人工知能】畳み込みニューラルネットワークの仕組み

どうも、とがみんです。

この記事では、画像認識で圧倒的な成果を挙げてきた、畳み込みニューラルネットワークの仕組みについて紹介していきます。

Contents

畳み込みニューラルネットワークとは?
畳み込みニューラルネットワークの仕組み
まとめ
参考文献

畳み込みニューラルネットワークとは?

畳み込みニューラルネットワーク(Convolutional Neural Network)は、ニューラルネットワークの中間層に、

「畳み込み層」と「プーリング層」を配置したニューラルネットワークで、

主に画像認識によく使われます。

画像に含まれる物、人などの検知とラベル付け
音声のテキスト変換
自動車の自動運転技術における道路把握、障害物検知

等、幅広い応用例があります。

通常(全結合)のニューラルネットワークでは1次元の情報しか汲み取れなかったのに対し、畳み込みニューラルネットワークは3次元の空間的な情報も汲み取ることができます。

次に、畳み込みニューラルネットワークの仕組みについて紹介していきます。

畳み込みニューラルネットワークの仕組み

畳み込みニューラルネットワークの仕組みについて紹介していきます。

畳み込みニューラルネットワークの全体構造

畳み込みニューラルネットワークの仕組みの全体像は、以下の図のように、「畳み込み層」、「プーリング層」、「全結合層」で構成されます。

「畳み込み層」と、「プーリング層」の仕組みについて紹介していきます。

畳み込み層の仕組み

畳み込み層は、入力画像に対してフィルタと呼ばれる2次元の重み信号を用いた畳み込み演算を行う層です。

フィルタを次々とスライドさせて畳み込みの計算を行い、特徴マップを作成します。

プーリング層では、畳み込み層から受け取った特徴マップに対して、最大値や平均値を取ることで、重要な特徴を残してデータを圧縮します。

プーリング層の結果は、1次元データに変更され、全結合層へと渡されます。

全結合層の結果が活性化関数で変換されて、出力層に渡され、

出力層の活性化関数によって、値が変換され、最終的な出力結果を得ます。

畳み込みニューラルネットワークは、特徴量をピクセル単位ではなく、領域単位で抽出するため、位置のずれ、見え方によるずれを小さくすることができます。

パディングの仕組み

上記のように、畳み込み層とプーリング層で特徴量を抽出していくと、データのサイズが元のサイズよりも小さくなっていってしまいます。

データのサイズを保ちたい場合は、特徴量の周りをゼロで埋める「ゼロパディング」と呼ばれる手法を用います。

これにより、

端のデータに対する畳み込み回数が増えるので、端の特徴も考慮されるようになる。
データのサイズを保つことができるので、層の数を調整できる。

といったメリットがあります。

畳み込みニューラルネットワークの学習

以下の記事で、ニューラルネットワークの学習の仕組みを紹介しました。

畳み込みニューラルネットワークの学習も仕組みは同じです。

出力層で得られた結果と、正解データを比較し、誤差関数を用いて誤差を計算します。

その誤差が最小になるように、「フィルタ」のパラメータを更新していきます。

畳み込み層では、「フィルタ」のパラメータが重みパラメータにあたります。

まとめ

畳み込みニューラルネットワークについて説明しました。

畳み込みニューラルネットワークには、畳み込み層とプーリング層が中間層に導入され、

これらによって、位置のずれや見え方の違いによるずれを小さくしてくれ、画像認識の分野で広く応用されています。

参考文献

＞畳み込みニューラルネットワーク

＞畳み込みニューラルネットワークの仕組み

ゼロから作るＤｅｅｐ　ＬｅａｒｎｉｎｇＰｙｔｈｏｎで学ぶディ-プラ-ニングの理論と実装 /オライリ-・ジャパン/斎藤康毅

posted with カエレバ

楽天市場

Amazon

仕組み人工知能機械学習畳み込みニューラルネットワーク

【人工知能】畳み込みニューラルネットワークの仕組み

畳み込みニューラルネットワークとは?

畳み込みニューラルネットワークの仕組み

畳み込みニューラルネットワークの全体構造

畳み込み層の仕組み

パディングの仕組み

畳み込みニューラルネットワークの学習

まとめ

参考文献

【人工知能】再帰型ニューラルネットワークの仕組み

【人工知能】機械学習で行われる学習方法について。バッチ・ミニバッチ・オンライン学習。

【人工知能】機械学習とは?教師あり学習と教師なし学習

【人工知能】活性化関数の種類と使い分け・選び方についてまとめる

【神秘学】精神の探求。神秘思想家「ルドルフ・シュタイナー」とは？

【Java】「Spring Boot」でWebAPIの作成。JSONの受信と送信を行うサンプル。

【人工知能】機械学習で行われる学習方法について。バッチ・ミニバッチ・オンライン学習。

【AWS】DynamoDBとRDSのメリットデメリットの比較について

【人工知能】誤差逆伝播法とは。ニューラルネットワークの学習の仕組み。

【自由と哲学】一体自由とはどういう状態なのか。究極の自由とその考察。

【Python】Twitterのフォロワー情報の取得方法