どうも、とがみんです。
この記事では、機械学習ライブラリの「scikit-learn」について紹介します。
Contents
scikit-learnとは
「scikit-learn」とは、Pythonの機械学習ライブラリです。
分類(classification)、回帰(Regression)、クラスタリング(Clustering)、次元削減(Dimensionality reduction)等をするための、機械学習のアルゴリズムが幅広くサポートされています。
scimitar-learnでできないこと
scikit-learnは他の機械学習ライブラリと比較しても、より広範な機械学習アルゴリズムが提供されているので、できることが多いです。
なので、できないことについて紹介していきます。
GPUのサポートがない
以下の「Will you add GPU support?」の質問の回答にもあるように、GPUへの対応は少なくとも近い未来には行われないようです。
scikit-learnは、様々なプラットフォームで簡単にインストールできるように設計されているため、
GPUのサポートすることによって、プラットフォーム固有の問題が発生してしまい、それが難しくなってしまいます。
また、GPUはニューラルネットワーク以外では大きな役割を果たさないためとのことです。
>Frequently Asked Questions|scikit-learn
GPU:画像処理に特化した演算装置。
CPU:コンピュータ各装置の制御や数値計算を行うための演算装置。画像処理など、大量に演算が必要なものを処理させると莫大な時間がかかる。
ディープラーニングに向かない
ディープラーニングは、画像認識や、音声認識、自然言語処理などのデータ分析を得意としていますが、その学習には膨大な演算量を必要としています。
scikit-learnはGPUをサポートしていないため、膨大な演算を必要とするディープラーニングには向きません。
scikit-learnのアルゴリズムチートシート
最後にscikit-learnのアルゴリズムチートシートについて紹介します。
scikit-learnで提供されているアルゴリズムはチートシートとしてすべてリストされています。
これを見れば、目的と学習データ等状況に応じて、どのアルゴリズムが良さそうなのかを簡単に選択することができちゃいますね(笑)
まとめ
機械学習ライブラリ「scikit-learn」について紹介しました。