機械学習

【徹底解説】機械学習（マシンラーニング）とは！まずはここから理解しよう

初心者向けに機械学習（マシンラーニング）とは何か詳しく解説しています。まずはここから理解しましょう。AI（人工知能）を構築する上で必須の機械学習。機械学習の種類やディープラーニングとの違いについて紹介しているので、ぜひ理解しておきましょう。

テックアカデミーマガジンは受講者数No.1のプログラミングスクール「テックアカデミー」が運営。初心者向けにプロが解説した記事を公開中。現役エンジニアの方はこちらをご覧ください。 ※ アンケートモニター提供元：GMOリサーチ株式会社　調査期間：2021年8月12日～8月16日　調査対象：2020年8月以降にプログラミングスクールを受講した18～80歳の男女1,000名　調査手法：インターネット調査

現在、幅広い業種で人工知能（AI）が使われています。またニュースや新聞でも、人工知能の報道を目にしない日はありません。

このような状況の中、人工知能に興味・関心を寄せるエンジニアが増えてきています。また企業においても、人工知能のスキルを持ったエンジニアの採用が活発に行われています。

機械学習は、その人工知能の中核をなすテクノロジーであり、現代のエンジニアにとっては、ほぼ必須の知識とも言えるでしょう。

この記事では、機械学習の概要、各種手法についての解説、ディープラーニングとの違いなどを紹介します。

機械学習とはどのような技術か、実際にどのようなサービスに使われているか、ぜひ知っておきましょう。

なお本記事は、TechAcademyのAIオンライン講座の内容をもとに作成しています。

機械学習とは

人工知能（AI）とは、「コンピューターが物事やルールを理解するための仕組み」の様々な技術の総称です。コンピューターが物事やルールを理解するためには、人間が学習するプロセスと同様に、情報を与えて物事の特徴やルールを学習させなくてはなりません。

この学習方法のことを機械学習（マシンラーニング）と呼びます。

機械学習は、従来のプログラミングと違い、開発者が全ての動作をプログラミングするわけではありません。開発者はコンピューターにデータと分け方を与えます。コンピューターはその情報を元に、データの特徴を学習し、新たなデータに対する正解を予測します。

例えば、以下のような手書き数字の画像データがあったとします。

MNIST

開発者は、この画像データに対する正解、「0」や「1」といった数値をペアで与えます。

コンピューターは、画像データと正解の数値をもとに、数値毎の画像データの特徴を学習します。例えば「画像データのどの位置が濃い」といった特徴です。この学習の成果を「モデル」と言います。

tensorflow.org

また、このことは、機械学習はデータの特徴をモデル化（数式化）できることを前提としている、とも捉えることができますね。

そして、このモデルをもとに、新たな画像データの正解を「予測」します。これが機械学習の大まかな流れです。

なお、人工知能の精度を高めるには、大量のデータでコンピューターに学習させることが必要です。2000年代に入り、高速・高性能なコンピューターが容易に入手できるようになりました。また、インターネットの発展により、従来より格段に多くのデータを収集できるようになりました。このことが、現代の機械学習の技術を支えています。

それでは、次に機械学習の種類について確認して行きましょう。機械学習は大きく「教師あり学習」、「教師なし学習」、「強化学習」の3つに分けることができます。

[PR] AIプログラミングコース

教師あり学習

教師あり学習とは、データと正解を与えて、コンピューターに学習させる方法です。前出の手書き数字の学習例も教師あり学習です。

教師あり学習は、分類問題と回帰問題に分けることができます。

分類問題

分類問題は、データを種類ごとに分けることを目標とします。例えば画像データを与えて花の種類を予測する、音声データを与えて文字を予測する、これらは分類問題となります。

Iris_flower_data_set

回帰問題

回帰問題は、データの特徴から、新しいデータに対する値を予測することを目標とします。

例えば株価の予測や、天気予報、これらは回帰問題となります。

教師あり学習の手法

次に代表的な教師あり学習の手法について紹介します。

線形回帰、線形分類

データを直線で予測するのが線形回帰、直線で分けるのが線形分類です。線形回帰（分類）は、学習も予測も高速で、モデルをシンプルに構築できる特徴があります。また古くから研究されており、以外に線形回帰（分類）できるデータは多いため、まず最初に検討してみるべき機械学習の手法の1つでしょう。

Wikipedia

SVM(サポートベクターマシン)

SVMは線形回帰（分類）の手法の1つです。線形回帰（分類）は直線で分類を行うのに対し、SVMは超平面分離定理という考え方をもとに、空間をねじれさせることで、最終的に曲線で回帰（分類）を行う手法です。

SVMは優れた機械学習の手法の1つで、ディープラーニングが登場するまでは、とても多く使われていました。モデルをシンプルに構築出来、精度も良いことから、現在でも多く使われている手法です。

決定木

木構造のモデルにより分類する手法です。決定木は機械学習の手法としてだけでなく、意思決定を助けるためのツールとしてもよく用いられます。他の手法に比べて、人間が見てもモデルを理解しやすいことから、リスクマネジメントのような、人間の判断が必要な分野の予測によく用いられます。

Wikipedia

ニューラルネットワーク

ニューラルネットワークは、重回帰分析（多変数解析）の手法の1つです。人の神経回路をモデルとしており、機械学習の手法としては、最も古く(1950年代)から研究された来たものの1つです。

Wikipedia

ロジスティック回帰

「回帰」と書いていますが「分類」の手法です。

ニューラルネットワークのモデルの一部を変更（活性化関数をシグモイド関数に変更）したものです。ディープラーニングの1層版です。ディープラーニングはこのロジスティック回帰を複数層組み合わせたモデルです。

教師なし学習とは

教師なし学習とは、データだけ与えて、コンピューターにデータをグループ化（クラスタリング）させる方法です。

例えば通販サイトで商品を購入した時「この商品を買った人はこんな商品も買っています」という文章を見たことは無いでしょうか。これは、コンピューターに「購買履歴」のデータを与えることで、教師なし学習により「商品Aを買った人は、商品Bを買う確率が高い」というようにユーザをグループ化することで実現しています。

また、教師なし学習には主成分分析といって、データ分析をより行いやすくするための方法もあります。

教師なし学習には以下のような手法があります。

k平均法

クラスタ（分類するグループ）の数を決め、クラスタの数分、ランダムな点を起きます。各データは一番近い点に所属させます。所属が決まったら、クラスタに属するデータの中心を新しい点とします。

これを繰り返すことでデータをグループ化します。

主成分分析

機械学習でモデルを構築する際、その前段階として、データの次元（説明変数の数）を削減するために用いられます。変数同士の相関度合いと寄与率をもとに、複数の変数を相関の少ない「主成分」と呼ばれる変数にまとめる手法です。

これにより、機械学習のモデルをシンプルに構築することができるようになります。

強化学習とは

強化学習とは、よい結果には報酬を与えることにより、コンピューター自らに最適な方法を導き出させるようにする学習方法です。ゲームやロボットの学習によく用いられます。

強化学習では、守るべきルールと、行動に対する報酬が与えられます。例えば、トランプのゲームにおいては、守るべきルールはゲームのルール、行動に対する報酬としては、勝つことに対する報酬、のようになります。

コンピューターはその情報をもとに、考えられるパターンをランダムに試行していきます。最初は全く上手く行かないように見えますが、何度も試行していくうちに、コンピューターはより報酬を多く得られる行動を選択するようになります。

代表的な手法として、Q学習といった手法が知られています。

ディープラーニングとの違いとは

それでは、機械学習と並んでよく耳にする、ディープラーニングとは、どのような違いがあるのでしょう。

結論としては、ディープラーニングは機械学習をより発展させたものです。

機械学習はデータの特徴をモデルで表します。しかし、機械学習ではデータの特徴は何かを開発者が指示しなくてはなりません。

手書き数字の画像データを例にすると、「画像データの濃淡」がデータの特徴である、ということを開発者が指示します。

これに対して、ディープラーニングは、データの特徴自体をコンピューターが見つけます。つまり、データのどこに注目すれば良いかということをコンピューター自身が学習して見つけ出すことで、自動的にどんどん賢くなっていく、という訳です。

tensorflow.org

機械学習の代表的なライブラリ

それでは最後に、機械学習の代表的なライブラリを紹介します。

scikit-learn

機械学習のライブラリと言えば、まずはscikit-learnです。教師あり学習・教師なし学習とも、基本的な機械学習の理解を深めるには、初学者はscikit-learnから学習することをおすすめします。

scikit-learnには、多くの機械学習のモデルとテスト用データセットが含まれており、初学者でもすぐ機械学習を試してみることができます。

scikit-learnの特徴は、ほんの少しのソースコードの変更だけで、モデルを変更した機械学習を行える点です。

例えば、最初、SVM(サポートベクターマシン)でモデルを構築したとしましょう。こちらはソースコードの一部です。

from sklearn import svm
clf = svm.SVC(gamma=0.001)
clf.fit(X_train, y_train)

次に、モデルをロジスティック回帰に変更してみます。

from sklearn.linear_model import LogisticRegression # ロジスティック回帰
clf = LogisticRegression() # ロジスティック回帰
clf.fit(X_train, y_train)

このように、わずか2行変えるだけでモデルを変更できます。

現在、機械学習(非深層学習)のライブラリと言えばscikit-learn、ほぼ一択です。現在は深層学習（ディープラーニング）のライブラリが主流となっています。

Tensorflow

深層学習（ディープラーニング）のライブラリで最も有名なものと言えばTensorflowです。TensorFlowはGoogleが開発し、オープンソースで公開しています。

オープンソースで公開されているため、私たちはGoogleの最新の研究成果を自分の手で試してみることができます。例えば、画像分類のInception-v3というモデルは、人間を超える、約96%の画像正解率を達成しています。

TensorFlow Image Recognition

機械学習について、理解は深まったかな？

機械学習の仕組みやライブラリの種類など、勉強になりましたー！

機械学習は、これからエンジニアの必須の知識として必要になってくるよ。深層学習や画像認識、自然言語処理については、また別のところで説明するね。

分かりました。ありがとうございました！

今回は、機械学習について解説しました。

これから機械学習を勉強したい、機械学習を使って何か作ってみたいという方は最初に理解しておきたい内容でしょう。

また、オンラインのプログラミングスクールTechAcademyでは、AIオンライン講座を開催しています。

AI（人工知能）の構築に必要な機械学習・ディープラーニングについて実践的に学習することができます。

現役エンジニアがパーソナルメンターとして受講生に1人ずつつき、マンツーマンのメンタリングで学習をサポートし、習得することが可能です。

この記事を監修してくれた方

太田和樹（おおたかずき）
ITベンチャー企業のPM兼エンジニア

普段は主に、Web系アプリケーション開発のプロジェクトマネージャーとプログラミング講師を行っている。守備範囲はフロントエンド、モバイル、サーバサイド、データサイエンティストと幅広い。その幅広い知見を生かして、複数の領域を組み合わせた新しい提案をするのが得意。

開発実績：画像認識技術を活用した駐車場混雑状況把握（実証実験）、音声認識を活用したヘルプデスク支援システム、Pepperを遠隔操作するアプリの開発、大規模基幹系システムの開発・導入マネジメント

地方在住。仕事のほとんどをリモートオフィスで行う。通勤で消耗する代わりに趣味のDIYや家庭菜園、家族との時間を楽しんでいる。

深層学習のライブラリ！Kerasの使い方【初心者向け】

今回は、深層学習（ディープラーニング）のライブラリであるKerasについて解説します。 Kerasを学習することで、簡単なコードで機械学習のアルゴリズムの...

機械学習

【事例付き】様々なサービスに活用！画像認識技術とは

デジタルカメラのスマイルシャッターや、iPhoneXのFaceIDなど、画像認識の技術は私達の身の回りで多く使われており、生活を便利に豊かにしてくれています。 ...

機械学習

機械学習のライブラリ！scikit-learnとは【初心者向け】現役エンジニアが解説

今回は、Pythonの代表的な機械学習のライブラリであるscikit-learnについて解説します。機械学習というと、複雑な数式を使ったり、なんだか難し...

機械学習

時系列の種類やモデルの紹介！時系列分析とは【初心者向け】

今回は、時系列分析について解説します。時系列の種類や時系列データのモデルについて紹介しているので、どういった分析の仕方があるのかぜひ知っておきましょう。...

機械学習

Pythonで使える！便利な機械学習ライブラリまとめ

今回は、便利なPythonで使える機械学習ライブラリをまとめて解説します。 Pythonで様々なライブラリを使用する際、Anacondaというソフトウェア...

機械学習

【事例付き】自然言語処理とは！仕組みやライブラリを解説

2016年末頃、Google翻訳の翻訳精度が飛躍的に向上し、大きな話題となりました。それまでは、英語を日本語に翻訳すると不自然な文章になってしまうことも多かった...

機械学習

あわせてよく読まれている記事

今回は、機械学習を学ぶのにおすすめの本をまとめています。機械学習やディープラーニングを初めて学ぶ人におすすめの本、仕事でこれから使う人におすすめの本を紹介しています。書籍によって概念中心のもの、実践中心のものなど特徴が違うので、自分の好みに合った本を見つけてみてください。なお本記事は、TechAcademyのAIオンライン講座の内容をもとに作成しています。まず最初に、非エンジニア向けのおすすめ本を紹介します。仕事ではじめる機械学習仕事ではじめる機械学習特徴プロジェクトのはじめ方や、システム構成、学習のためのリソースの収集方法を中心にビジネスサイドの視点を踏まえた特徴があります。対象者深層学習も画像認識も自然言語処理も機械学習も全て含めて人工知能という1つのソフトウェアを使うと簡単に解決できるという思想の上司から、「人工知能のプロジェクト立ち上げるからあとよろしく」と言われて、現場を任された担当者向けです。学習できること最初に機械学習プロジェクトの流れを理解した上で、現場のシステムにおける機械学習の問題点を理解し、その対処方法を考えていきます。アルゴリズムについての学習では、例えば、パーセプトロン・ロジスティック回帰・SVM・ニューラルネットワーク・k-NN・決定木・ランダムフォレスト・GBDTを学習します。実装部分では、映画の推薦システムをつくるという内容で、実際に機械学習を利用した実装の解説があります。 60分でわかる! 機械学習&ディープラーニング超入門 60分でわかる! 機械学習&ディープラーニング超入門 (60分でわかる! IT知識) 特徴新聞を読むような感覚で機械学習とディープラーニングについて理解できます。対象者機械学習とディープラーニングを使うとどんなことができるのか全体像を理解したいビジネスマン向け学習できること自分で機械学習や人工知能について学習したい方だけでなく、だれかに説明することが出来るレベルの分かりやすい解説テキストとして学習利用することができます。 [PR] AIプログラミングコースやさしく学ぶ機械学習を理解するための数学のきほんアヤノ＆ミオと一緒に学ぶ機械学習の理論と数学、実装までやさしく学ぶ機械学習を理解するための数学のきほん ~アヤノ&ミオと一緒に学ぶ機械学習の理論と数学、実装まで~ 特徴忘れかけた高校卒業程度の数学の知識でも読むことが出来るという、機械学習というタイトル本の中でも抜きん出て安心感の有る文系向け機械学習解説本です。著者は、LINE Fukuoka株式会社に勤務しているデータエンジニアです。対象者機械学習に興味があるけど、数式が出てきた時点で意味がわからなくなってしまうという方向けです。学習できること基本的な機械学習の内容と、必要な数学の復習、PythonとNumPyの基礎について学習できます。ここから先はエンジニア向けの機械学習書籍です。 Pythonではじめる機械学習 ―scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎 Pythonではじめる機械学習 ―scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎特徴 scikit-learnのリリースマネージャである筆者が、機械学習の基礎だけでなく、「特徴量エンジニアリング」と「モデルの評価と改善」について詳しく解説している特徴があります。ここでは網羅できないほど多岐にわたる開発手法に関して、ちょうどよい掘り下げ方で解説してある点が特徴的です。対象者「特徴量エンジニアリング」と「モデルの評価と改善」に関しても関心があるエンジニア向け。学習できること scikit-learnと関連ライブラリの環境設定から、教師あり学習や、教師なし学習についても、その種類とメリット・デメリットに関して細かく解説してあります。「特徴量エンジニアリング」、「モデルの評価と改善」、「アルゴリズムチェーンとパイプライン」、「テキストデータの処理」等実践的な内容も学習できます。機械学習スタートアップシリーズベイズ推論による機械学習入門機械学習スタートアップシリーズベイズ推論による機械学習入門 (KS情報科学専門書) 特徴ベイズ主義機械学習に基づいた、モデルの構築→推論の導出という手順をステップ・バイ・ステップで解説してあるとう特徴をもちます。対象者ベイズ推論について学習したい入門者向け学習できること基本的な確率に関する期待値・離散確率分布・連続確率分布などの説明から、ベイズ推論・ポアソン混合モデルや、ガウス混合モデルを学習します。最終的には、線形次元削減・非負値行列因子分解・隠れマルコフモデル・トピックモデル・テンソル分解・ロジスティック回帰・ニューラルネットワーク等の応用モデルの学習を行います。機械学習入門ボルツマン機械学習から深層学習まで機械学習入門ボルツマン機械学習から深層学習まで特徴機械学習の基礎的な表現方法や単語の意味だけでなく、その背景を掘り下げて解説してある点が特徴的です。対象者機械学習初心者でもイラストを多用して学習したい入門者向け学習できることイラストを多用した入門者向けにもかかわらず、最終的には、ボルツマン機械学習による画像処理等の学習まで可能です。データサイエンスのための統計学入門 ―予測、分類、統計モデリング、統計的機械学習とRプログラミングデータサイエンスのための統計学入門 ―予測、分類、統計モデリング、統計的機械学習とRプログラミング特徴データサイエンティストに必要な統計学の基礎と、50種類の機械学習の基本概念を学習することができます。対象者データサイエンティストを目指すエンジニア向け学習できることデータの分類、分析、モデル化、予測という一連の手法において統計学の必要な内容・不要な項目を概念・プログラミング理論・数学の見地から学習することができます。分類では、ナイーブベイズ・判別分析・ロジスティック回帰・混同行列やROC曲線等の分類モデルの評価や、不均衡データの戦略についても学習することができます。統計的機械学習では、k近傍法・木モデル・バギングとランダムフォレスト・ブースティングを学習します。最終的には、成分分析・k平均クラスタリング・階層クラスタリング・モデルベースクラスタリング・スケーリングとカテゴリ変数を通じて、教師なし学習についての理解を深めることができます。 ITエンジニアのための機械学習理論入門 ITエンジニアのための機械学習理論入門特徴ビジネスサイドの担当者が読むにはハードルがある、機械学習のツールやライブラリの内部処理や、その結果をビジネスでどのように役立てるかを、ITエンジニア向けに解説してあるのが特徴です。対象者ビジネスサイドの要求で機械学習を開始する必要に迫られたITエンジニア向けです。ベイズ推定の専門書を読む前の入門書として良いです。学習できることまず、パーセプトロンによる分類アルゴリズムの基礎を学習します。次に、ロジスティック回帰とROC曲線を通じて、学習モデルの評価方法を習得します。そして、k平均法による教師なし学習モデルの基礎と、EMアルゴリズムによる、最尤推定法の教師なし学習を訓練します。最終的に、ベイズ推定モデルとベイズの定理や、ベイズ推定の回帰分析への応用を学習します。パターン認識と機械学習上パターン認識と機械学習上特徴 2006年の発行以来世界的にトップセールスを続ける機械学習の入門書です。翻訳も日本のトップ研究者たちが行っているため、学術知識に裏打ちされた日本語で読むことができます。各学習の最後には演習問題が用意されています。対象者数学的な見地から機械学習の理論を学習したいITエンジニア向けです。学習できること確率分布では、ベータ分布・ディリクレ分布・ガウス分布・指数型分布族・ノンパラメトリック法等を学習します。線形回帰モデルでは、線形基底関数モデル・ベイズ線形回帰・ベイズモデル比較・エビデンス近似等を学習します。線形識別モデルでは、識別関数（判別関数）・確率的生成モデル・確率的識別モデル・ラプラス近似・ベイズロジスティック回帰を学習します。最後にニューラルネットワークについて学習します。パターン認識と機械学習下パターン認識と機械学習下 (ベイズ理論による統計的予測) 特徴パターン認識に関する統計学的解説をすべて網羅している様な内容の濃い学習書です。機械学習エンジニアの辞書という特徴を持ちます。対象者機械学習エンジニアとして転職を考えるITエンジニア向け学習できること上巻を凌ぐ濃密な内容と共に、ベイズ理論による統計的予測を中心とした学習が可能です。なにより、インターネット上にこの本を元にした解説やサンプルプログラムが多いため、この本だけでは理解しづらい部分も、この本を通じて氷が溶けるように徐々に学習することができます。今回は、機械学習を学ぶのにおすすめの本を解説しました。書籍によって扱っている機械学習の分野も違うものがあるので、自分が学びたい部分があるか確認しておきましょう。言語もライブラリも様々な種類があるので、事前にチェックしておくことが重要です。また、オンラインのプログラミングスクールTechAcademyでは、AIオンライン講座を開催しています。 AI（人工知能）の構築に必要な機械学習・ディープラーニングについて実践的に学習することができます。現役エンジニアがパーソナルメンターとして受講生に1人ずつつき、マンツーマンのメンタリングで学習をサポートし、習得することが可能です。この記事を監修してくれた方中本賢吾（なかもとけんご）アジマッチ有限会社　代表取締役社長開発実績：PHPフレームワークを利用した会員制SNS・ネットショップ構築、AWSや専用サーバー下でLinuxを使用したセキュアな環境構築、人工知能を利用したシステム開発、店舗検索スマホアプリ開発など。その他にも地域の職業プログラマー育成活動を行い、2018年には小学生がUnityで開発したオリジナルAndroidアプリをGooglePlayでリリース。ゲームで遊ぶより作ろうぜ！を合言葉に、小学生でも起業できる技術力を育成可能で有ることを証明し続けている。

機械学習

機械学習のライブラリ！scikit-learnとは【初心者向け】現役エンジニアが解説

今回は、Pythonの代表的な機械学習のライブラリであるscikit-learnについて解説します。機械学習というと、複雑な数式を使ったり、なんだか難しそうなイメージですが、scikit-learnを使うと、とても手軽に機械学習を試してみることができます。ぜひ、この記事を参考に、機械学習にチャレンジしてみてください。目次 scikit-learnとは scikit-learnを利用するには scikit-learnの主な機能 scikit-learnを使った機械学習(1) scikit-learnを使った機械学習(2) scikit-learnとは scikit-learnは、Pythonの機械学習ライブラリです。「サイキット・ラーン」と読みます。 scikit-learnはオープンソース（BSD license）で公開されており、個人／商用問わず、誰でも無料で利用することができます。 scikit-learnは、現在も活発に開発が行われており、インターネット上で情報を探すのも容易です。多くの機械学習アルゴリズムが実装されていますが、どのアルゴリズムでも同じような書き方で利用することができます。また、サンプルのデータセット（トイデータセット）が付属しているため、インストールしてすぐ機械学習を試すことができます。このようなことから、初学者が機械学習を学び始めるには、最適のライブラリと言えます。他にもオープンソースで使えるPythonのライブラリをまとめているので、合わせてご覧ください。 [PR] AIプログラミングコースscikit-learnを利用するには scikit-learnを利用するには、Anacondaなどの開発環境のパッケージを使うのが簡単です。 Anaconda Anacondaは、データ分析やグラフ描画など、Pythonでよく利用されるライブラリを含んだ開発環境です。もちろん、scikit-learnも含まれています。よって、Anacondaを導入するだけで、scikit-learnをすぐ利用することができます。 Anacondaにscikit-learnがインストールされているかは、メニュー画面のEnvironmentsから、Installedを選択し、検索BOXに「scikit-learn」と入力することで確認を行うことができます。なお、Anacondaなどの開発環境を利用せず、手動でscikit-learnをインストールして利用することもできます。中級者向けとなるため手順は省略いたしますが、その場合scikit-learnをインストールする前に、事前に以下のライブラリもインストールする必要があります。 NumPy Scipy Pandas scikit-learnの主な機能次にscikit-learnの主な機能、特に機械学習のモデルについて説明します。以下をご覧ください。これはscikit-learnのアルゴリズムチートシートと呼ばれます。 scikit-learnを用いて機械学習を行う際、自分が行いたい分析（分類／回帰／クラスタリングなど）について、適切なモデルを選択する際の手助けとなるものです。また、scikit-learnでは、簡単にモデルを取り替えて機械学習を行うことができます。モデルを取り替える方法については、以降の項で説明します。分類（classification）与えられたデータがどのクラスに属するかを判別するものです。教師あり学習の分類問題を解くアルゴリズムと表現できます。以下のような種類があります。 SGD（stochastic gradient descent）大規模データ（10万件以上）におすすめな、線形のクラス分類手法です。カーネル近似 SGDではうまく分類できない場合に利用する、非線形なクラス分類手法です。こちらも大規模データ向けです。 Linear SVC 中小規模（10万件未満）におすすめな、線形のクラス分類手法です。 k近傍法 Linear SVCではうまく分類できない場合に利用する、非線形なクラス分類手法です。こちらも中小規模データ向けです。この他、テキストデータの場合、ナイーブベイズという手法があります。回帰（regression）与えられたデータをもとに、目的とする値を予測するものです。教師あり学習の回帰問題を解くアルゴリズムと表現できます。以下のような種類があります。 SGD（stochastic gradient descent）大規模データ（10万件以上）におすすめな、線形の回帰分析手法です。 LASSO、ElasticNet 中小規模（10万件未満）で、説明変数の一部が重要な場合におすすめな、回帰分析手法です。 Ridge、Liner SVR 中小規模（10万件未満）で、説明変数の全てが重要な場合におすすめな、回帰分析手法です。 SVR（ガウスカーネル）、Ensemble Ridge、またはLinerSVRではうまく分析できない場合に利用する、非線形な回帰分析手法です。クラスタリング（clustering）与えられたデータを、なんらかの規則にのっとって分けるものです。教師なし学習のクラスタリング問題を解くアルゴリズムと表現できます。以下のような種類があります。 KMeans いくつのクラスタに分かれるのか、事前に決めることができる場合におすすめな、クラスタリング分析手法です。大規模データの場合、MiniBatchといって、データを分けながら学習させる手法を取ります。スペクトラルクラスタリング、GMM KMeansではうまく分析できない場合に利用する、非線形なクラスタリング分析手法です。 MeanShift、VBGMM いくつのクラスタに分かれるのか、事前に決めることができない場合におすすめな、クラスタリング分析手法です。その他の機能次元削減与えられたデータの次元数が多い場合、学習効率を上げるため、次元削減という前処理を行います。 PCA、カーネルPCA、Isomap、SpectralEmbeddingなどの手法があります。ハイパーパラメータの最適化機械学習を行う際、学習の方法などを調整する数値のことを「ハイパーパラメータ」と言います。グリッドサーチ、クロスバリデーションなどの手法があります。 scikit-learnを使った機械学習(1) それでは、scikit-learnを使った機械学習に挑戦してみましょう。今回は、scikit-learnのトイデータセットにある「手書き数字データセット」を使います。以下はanacondaを使った例で表示しています。データセットの読み込みはじめに、データセットを読み込み、どのようなデータが格納されているか、確認してみます。以下のコードを入力して実行して下さい。 # scikit-learn ライブラリの読み込み from sklearn import datasets # 手書き文字セットを読み込む digits = datasets.load_digits() # どのようなデータか、確認してみる import matplotlib.pyplot as plt plt.matshow(digits.images[0], cmap="Greys") plt.show() 実行結果は以下のようになります。数字の0のように見えますね。今回のプログラムでは、このような手書きの数字の画像データを使い、機械学習のモデルの学習と予測を行います。訓練データとテストデータの準備データセットには、「手書き数字の画像データ」と、それに対する「数字」が含まれます。データを訓練データとテストデータに分け、訓練データで学習した結果を、テストデータで検証します。 # 画像データを配列にしたもの(numpy.ndarray型) X = digits.data # 画像データに対する数字(numpy.ndarray型)。ラベルと言う y = digits.target # 訓練データとテストデータに分ける # 訓練データ：偶数行 X_train, y_train = X[0::2], y[0::2] # テストデータ：奇数行 X_test, y_test = X[1::2], y[1::2] 実行結果は特に表示されません。学習それでは、モデルに学習を行いましょう。以下ではSVMというアルゴリズムを選択しています。 # 学習器の作成。SVMというアルゴリズムを選択 from sklearn import svm clf = svm.SVC(gamma=0.001) # 訓練データとラベルで学習 clf.fit(X_train, y_train) 実行結果は以下のようになります。 SVMというアルゴリズムに対してどのような設定（パラメータ）を行ったかが表示されています。 SVC(C=1.0, cache_size=200, class_weight=None, coef0=0.0,

機械学習

時系列の種類やモデルの紹介！時系列分析とは【初心者向け】

今回は、時系列分析について解説します。時系列の種類や時系列データのモデルについて紹介しているので、どういった分析の仕方があるのかぜひ知っておきましょう。なお本記事は、TechAcademyのオンラインブートキャンプ、AI講座とデータサイエンス講座の内容をもとに作成しています。田島悠介今回は、機械学習に関する内容だね！大石ゆかりどういう内容でしょうか？田島悠介時系列分析について詳しく説明していくね！大石ゆかりお願いします！時系列分析とは時系列分析とは時間の項目を軸に分析を行うことです。時系列分析は英語で、Time Series Analysisと言います。時系列分析は、時系列解析と約されることもあり、時系列分析について調べる場合は、時系列解析についてもキーワードとして調べると良いでしょう。時系列分析は、時系列データを元に、何故そのような時系列になってしまったかを理論的に分析するものです。この、何故そのような時系列になってしまったかという点を、時系列分析ではデータポイント列の背後にある理論と言います。代表的な利用方法としては、完全失業率や住宅価格の推移を元に株式相場の見通しを伝える経済ニュースが日々報道されています。時系列データとは時系列データとは、時系列分析で使用するデータのことです。時系列データは、一定間隔に基づいて集計され、統計学上の相関関係が認められるものをいいます。身近な時系列データとしては、総務省統計局のページから閲覧できる総合統計書があります。時系列データのモデルには様々なものがあります。モデルとは、考え方や理論のことを意味します。 [PR] AIプログラミングコース時系列の種類時系列には定常時系列と非定常時系列があります。実際に使用されるデータは、非定常時系列もののが多いです。そして、実際に解析する際には、非定常時系列データを定常時系列データに変換して解析することが多いです。定常時系列定常時系列とは、定常的な時系列のデータを意味する。定常性とは、確率の性質が一定であり、様々な時点に影響されないことを意味します。非定常時系列非定常時系列とは、非定常的な時系列データを意味する。非定常性とは、定常性が無いことで、確率の性質が一定しておらず、様々な時点の値に影響されるということを意味します。つまり、影響される要素が多いために解析する必要性があるということでもあります。代表的な時系列データのモデル時系列データにはいくつかのモデルが存在します。自己回帰モデル画像引用：wikipedia 自己回帰モデルは、英語でAuto Regression modelと呼ばれ、ARと省略されます。定常時系列データを使用します。現在の値は、過去の値に影響されて記述されるというモデルです。株式相場で、今日値上がりすれば、明日も値上がりするだろ言うというイメージです。自己回帰モデルは、自己回帰移動平均モデル（ARMAモデル）の特殊な例の1つです。また、自己回帰モデルは、ベクトル自己回帰モデル（VARモデル）の特殊な例の1つでもあります。自己回帰モデルは、時間対してある変数をある確率で分布したものを線形で表示します。変数とは、ある値を入れるは箱のようなものです。変数に入れられた日々の値を線形にする例として、株式相場のグラフがあります。移動平均モデル画像引用：wikipedia 移動平均モデルとは、英語でMoving Average modelと言いMAと省略されます。定常時系列データを使用します。移動平均モデルは、現在の値はq個前までの過去のノイズの重み付き和と、現在のノイズとに、平均値を加算したものとして考えるモデルです。つまり、過去のノイズが大きかった場合、現在の値もθの影響を受け変化するということになります。そして、現在の値が過去の移動平均で表現されることから移動平均モデルと言われます。自己回帰移動平均モデル画像引用：wikipedia 自己回帰移動平均モデルとは、英語でAutoregressive moving average modelと言い、ARMAと省略されます。定常時系列データを使用します。自己回帰移動平均モデルは、自己回帰モデルと移動平均モデルを組み合わせたモデルです。つまり、自己回帰モデルの現在の値は、過去の値に影響されて記述されるというモデルと、移動平均モデルの、現在の値はq個前までの過去のノイズの重み付き和と、現在のノイズとに、平均値を加算したものとして考えるモデルを組み合わせることで現在の値を記述するということです。自己回帰移動平均モデルの図式でいうと、p個以前の過去の値とq個以前のノイズの値を組み合わせることで現在の値を記述しています。和分過程和分過程とは、英語でIntegratedと言い、Iと省略されます。和分過程とは、以前の値に現在の値を加算することを意味します。株価などの金融取引に利用するデータで利用する時系列では、和分を利用します。ただ、自己回帰和分移動平均モデルで利用される場合は、和分次数を1と考えることが一般的です。次数とは、何かの指標を求める際に使用する自然数です。指標とは、物事を判断する際に目印となるものです。ここでは自然数を目印にします。自然数とは、正の整数を意味します。自己回帰和分移動平均モデル画像引用：wikipedia 自己回帰和分移動平均モデルとは、英語でAutoregressive Integrated Moving Averageと言い、ARIMAと省略されます。非定常時系列データを使用します。自己回帰和文移動平均モデルは次の3つのモデルを組み合わせてできています。自己回帰モデル（Autoregressive model ）移動平均モデル（Moving Average model ）和分過程（Integrated process）自己回帰和分移動平均モデルは、自己回帰パラメーター（p）と、移動平均パラメーター（q）と、差分の階数（d）とを使用します。和分過程の説明であったように、一般的に和分は1で表されます。つまり、ARIMA(p,1,q)モデルで記述される自己回帰和分移動平均モデルデータは、ARMA(p,q)モデルで記述される自己回帰移動平均モデルの1階和分系列であることを意味します。自己回帰モデルと移動平均モデルは、それぞれ単独であっても高い分析能力があります。自己回帰移動平均モデルは、更に高い分析能力があります。自己回帰和分移動平均モデルはデータの差分を取ることで、データの整形を行った上で、自己回帰移動平均モデルとして、より正しく分析することができます。その他の時系列データのモデル名紹介誤差修正自己回帰モデル誤差修正自己回帰モデルとは、英語でError Correction Modelと言い、ECMと省略されます。分散自己回帰モデル分散自己回帰モデルとは、英語でAutoregressive conditional heteroscedasticity modelと言い、ARCHと省略されます。一般化分散自己回帰モデル一般化分散自己回帰モデルとは、英語でGeneralized Autoregressive conditional heteroscedasticity modelと言い、GARCHと省略されます。確率的ボラティリティモデル確率的ボラティリティモデルとは、英語でStochastic Volatility modelと言い、SVと省略されます。マルコフスイッチングマルチフラクタルマルコフスイッチングマルチフラクタルとは、英語でMarkov Switching Multifractalと言い、MSMと省略されます。今回は、時系列分析について解説しました。この記事を監修してくれた方中本賢吾（なかもとけんご）アジマッチ有限会社　代表取締役社長開発実績：PHPフレームワークを利用した会員制SNS・ネットショップ構築、AWSや専用サーバー下でLinuxを使用したセキュアな環境構築、人工知能を利用したシステム開発、店舗検索スマホアプリ開発など。その他にも地域の職業プログラマー育成活動を行い、2018年には小学生がUnityで開発したオリジナルAndroidアプリをGooglePlayでリリース。ゲームで遊ぶより作ろうぜ！を合言葉に、小学生でも起業できる技術力を育成可能で有ることを証明し続けている。大石ゆかり内容分かりやすくて良かったです！田島悠介ゆかりちゃんも分からないことがあったら質問してね！大石ゆかり分かりました。ありがとうございます！ TechAcademyでは、初心者でも、AI（人工知能）の構築に必要な機械学習・ディープラーニングについて実践的に学習することができる、オンラインブートキャンプAI講座を開催しています。挫折しない学習方法を知れる説明動画や、現役エンジニアとのビデオ通話とチャットサポート、学習用カリキュラムを体験できる

機械学習

MySQLでALTER TABLEを使ってテーブル構造を変更する方法【初心者向け】

MySQLの初心者向けに、基本的な使い方を解説する記事です。今回は、ALTER TABLEを使ってテーブル構造に変更・追加・削除といった操作を加える方法について、テックアカデミーのメンター（現役エンジニア）が実際のコードを使用して初心者向けに解説します。 ALTER TABLEを使うと、MySQLの既存のテーブルの定義（構造）を変更できます。実務でも、ALTER TABLEを使ってテーブル構造に変更・追加・削除し、Webアプリケーションのデータ処理を行うので、ぜひ学習してみてください。目次機械学習とは教師あり学習教師なし学習とは強化学習とはディープラーニングとの違いとは機械学習の代表的なライブラリそもそもPHPについてよく分からないという方は、PHPとは何なのか解説した記事を読むとさらに理解が深まります。今回の記事の内容は動画でもご覧いただけます。テキストよりも動画の方が理解しやすいという場合はぜひご覧ください。今回は、このようなデータの入ったuserというテーブルをもとに解説を進めます。大石ゆかり田島メンター！テーブルを作成して、データを追加できるようになったんですが、作成した後にテーブルの変更ってできるんですか？田島悠介作成したテーブルの内容の変更やフィールドの削除などできるんだ。大石ゆかり後からでも全部作り直せる感じでしょうか？田島悠介そうだね。SQLiteなど簡易なデータベースは注意が必要だけど、普通のデータベースは後からでも変更できるんだ。変更の仕方を見てみよう！テーブル名を変更する際に利用するコマンドテーブル名を変更する際には次のように操作します。テーブル名を表示するコマンドは必須ではありませんが、名前が変更できたかを確認する方が安心です。テーブル名を表示テーブル名を変更テーブル名一覧を表示するコマンドテーブル名を変更する場合、show tables;を利用します。 show tables; テーブル名を変更するコマンドテーブル名を変更する場合、alter tableを利用します。 alter table テーブル名 rename 新テーブル名; テーブルの中のデータを表示するコマンドテーブルの中のデータを表示する場合、select を利用します。 select * from テーブル名; データ型を確認するコマンドテーブルのデータ型を確認するためには、descを利用します。 desc テーブル名; ALTER TABLEを使ってテーブル名を変更してみよう実際にALTER TABLEを使ってテーブル名を変更してみましょう。テーブル名を表示まずはshow tables;を使ってテーブル名を表示させておきましょう。コマンド show tables; 実行結果解説 show tables;というコマンドを実行すると、userというテーブルが表示されました。テーブル名を変更 alter tableを使って、usersという名前に変えてみたいと思います。コマンド alter table user rename users; 実行結果解説 alter table user rename users;というコマンドで、userテーブルをusersテーブルに名称変更しました。「Query OK」と表示されれば変更完了です。テーブル名を再確認のため表示 show tablesを利用して、再度テーブル名を確認します。コマンド show tables; 実行結果解説 userからusersに変わっています。これでテーブル名の変更ができました。 [PR] AIプログラミングコース ALTER TABLEを使ってフィールドを追加する方法テーブルの中にはいくつかフィールドがありますが、新しいフィールドを追加できます。フィールドを追加するためのコマンドは次の通りです。 alter table テーブル名 add フィールド名データ型; テーブルの中のデータを表示現在のテーブルの中身を表示させます。コマンド select * from users; 実行結果解説 select * from users;では、テーブル名がusersのテーブルの中身を表示しています。 id・username・organization_id・email・password・login_num と、6つのフィールドがあります。フィールドを追加するフィールドを追加する方法を解説します。コマンド alter table users add age int; 実行結果 alter table users add

MySQL

概念を理解しよう！深層学習（ディープラーニング）とは

最近、人工知能（AI）関連のニュースでキーワードとしてよく取り上げられる深層学習（ディープラーニング）について解説します。 2010年代から、コンピューターの性能向上とともに、人工知能が盛り上がりを見せています（第3次人工知能ブーム）。この人工知能の盛り上がりのきっかけとなったのが、深層学習（ディープラーニング）という技術です。人工知能の実態を知るためにも深層学習（ディープラーニング）技術の理解は欠かせないでしょう。深層学習（ディープラーニング）とはどのような技術か、実際にどのようなサービスに使われているのか、ぜひ知っておきましょう。なお本記事は、TechAcademyのAIオンライン講座の内容をもとに作成しています。目次深層学習（ディープラーニング）とは深層学習（ディープラーニング）の仕組み、原理とは深層学習（ディープラーニング）の事例深層学習（ディープラーニング）のライブラリ田島悠介今回は深層学習（ディープラーニング）について解説するよ。大石ゆかり田島メンター！深層学習というのは具体的にどのような技術なんですか〜？田島悠介人工知能の学習方法の1つなんだ。詳しく見ていこう。大石ゆかり分かりました！深層学習（ディープラーニング）とは人工知能（AI）を活用したテクノロジーが次々と発表されています。例えば以下の事例はニュースとして聞いた方も多いのではないでしょうか。囲碁AIのAlphaGo（アルファ碁）が囲碁チャンピオンを破った自動運転技術の発展グーグルのAIが動画を見て猫の概念を学習したこれらに共通して使われているのが深層学習（ディープラーニング）という技術です。人工知能とは、「コンピューターが物事やルールを理解するための仕組み」の様々な技術の総称です。コンピューターが物事やルールを理解するためには、人間が学習するプロセスと同様に、情報を与えて物事の特徴やルールを学習させなくてはなりません。この学習方法のことを機械学習（マシーンラーニング）と呼び、その中でも、より人間の脳に近い学習手法の1つが、深層学習（ディープラーニング）という技術です。 [PR] AIプログラミングコース深層学習（ディープラーニング）の仕組み、原理とは深層学習（ディープラーニング）とは、人や動物の脳の神経回路をモデルにした、多層のニューラルネットワーク（ディープニューラルネットワーク）による機械学習の手法です。「神経回路」「ニューラルネットワーク」「多層」、いろんなキーワードが出てきましたね。まずは、神経回路から確認していきましょう。神経細胞（Wikipedia）こちらが神経細胞です。神経回路は、この神経細胞が複数接続されたものです。神経細胞は、他の細胞からの入力を樹状突起（左側の紫色の部分）で受け、他の細胞に軸索（右側の紫色の部分）で出力します。このとき神経細胞では、複数の細胞からの入力を受けたり、内部で入力信号を変化させることで、情報の修飾が行われます。この情報の修飾が、神経回路全体として行われることで、感覚の伝達、視覚の認識、そして脳の知覚、すなわち知能が実現されています。例えば、人間が「0」や「1」といった数字を目で見たとしましょう。この時、1つ1つの視覚細胞では、入力された視覚信号をもとに情報を修飾し、他の細胞に伝達することが行われています。この時の情報の修飾により、「0」であれば「丸い円」、「1」であれば「縦方向の直線」といった「特徴」が認識されます。また人間は、その視覚情報に対して、「0」や「1」といった概念（正解、機械学習ではラベルといいます）を教えてもらうことで、「数字の特徴」と「数字」という概念を対応づける「学習」を行うことができます。この学習を繰り返すことで、人間は、少し違った形の数字であっても、視覚情報から得られる特徴から「数字」と認識できるようになります。では次に、神経回路をモデルにしたニューラルネットワークについて確認します。こちらはニューラルネットワークにおいて、神経細胞と同等の役割を果たすものです。パーセプトロンと呼ばれます。個々のパーセプトロンでは、人間の神経細胞と同様に、他のパーセプトロンからの入力を左側のInputで受け、他のパーセプトロンに右側のOutputで出力します。また、複数のパーセプトロンからの入力を、内部で変化（数学的な計算）させることで、情報の修飾を行っています。ニューラルネットワーク（Wikipedia）パーセプトロンを複数接続したのがニューラルネットワークです。個々のパーセプトロンでは、人間の神経細胞と同様に、入力された値をもとに情報の修飾（数学的な計算）を行い、他のパーセプトロンに伝達することが行われています。この情報の修飾により、入力された情報の「特徴」が認識されます。ただしこれまでは、コンピューターの能力に限界があり、ニューラルネットワークの層（左から右に伝達する間に存在するパーセプトロン群）を増やすことができませんでした。そのため、パーセプトロン同士の接続が（人間の神経回路に比べて）単純であり、特徴を十分に学習させることができない問題がありました。ディープニューラルネットワーク（Wikipedia）しかし近年のコンピューターの著しい能力向上、そして情報修飾（数学的な計算）方法におけるブレークスルーなどがあり、ニューラルネットワークの層を増やしたモデルの構築が可能となりました。それがディープニューラルネットワークです。ディープニューラルネットワークでは、より人間の神経回路に近いパーセプトロンの接続を行うことができます。これにより入力された情報から、多くの特徴を認識できるようになり、機械学習の精度が飛躍的に向上しました。深層学習（ディープラーニング）の事例深層学習には、前出のAlphaGo（アルファ碁）や自動運転技術の他、多くの場面で利用されています。ここでは代表的な例を見ていきましょう。画像認識、映像解析ディープラーニングが大きく注目されるようになったきっかけは、2012年に開催された「ILSVRC2012」という画像認識の大会です。この大会では、ImageNetという大量のラベル付き画像（画像と写っている物の名前のセット）を基に画像認識率を競い会います。前年度までの正解率は、高くても70%台前半でした。ところが2012年、ディープラーニングを使ったモデルが、一気に約85%の正解率を叩き出します。翌年からは、ディープラーニングを使ったモデル同士が競い合うようになり、正解率もどんどん向上して行きました。現在では正解率95%以上、人間を超えるレベルにまで到達しています。現在は、この画像認識／映像解析の技術が、多くの製品で実装されています。 Deep Learning を応用した監視カメラソリューション（株式会社システム計画研究所）日立がカメラ映像の人物を深層学習で特定する技術 IBM Watsonによるガン診断（画像解析）音声解析日本でも、「LINE Clova」や「Google Home」、「Amazon Echo」といったスマートスピーカーが次々と発売されています。また、iPhone／Macの「Siri」やAndroidの「Googleアシスタント」、Windows10の「Cortana」などといった音声入力システム。これらには、ディープラーニングを使った音声解析技術が用いられています。音声解析は、リアルタイムに大量のデータを処理しなければなりません。また、一般用途向け製品、スマートフォンやスマートスピーカー、パソコン等、多くのコンシュマーデバイスから日々情報が入力されています。各社とも、具体的な規模は明らかにしていませんが、サーバ数万台が連携した音声解析のクラウドシステムを構築し、対応しているものと思われます。翻訳、言語解析 2016年の秋、Googleはディープラーニングを用いた、Google Neural Machine Translation(GNMT)と呼ばれる新しい翻訳システムを導入しました。これは、これまでの語句レベルでの翻訳から、文章全体を見た、より適切な翻訳を行うシステムです。実際、Google翻訳を使用すると、ほとんどの文章において、自然な文章で翻訳されているのが実感できると思います。また、翻訳の研究は、日本でも古くから行われています。NICT（独立行政法人情報通信研究機構）が開発した音声翻訳アプリには、NICTが開発した多言語翻訳エンジンが使われています。もう一つの事例として、Googleの絶滅危惧言語プロジェクトを紹介しましょう。これは、世界で絶滅の危機に瀕している言語の保存、ドキュメント化を目的としています。これまでの翻訳では、多数の人力を必要としていました。ところがディープラーニング技術を用いると、翻訳例をもとに、モデル自らが学習を進めていきます。そのため、より低コストで質の高い翻訳を行うことが可能になり、従来は費用などの制約から行われてこなかった、利用者の少ない言語の翻訳も行えるようになりました。深層学習（ディープラーニング）のライブラリでは最後に、深層学習（ディープラーニング）のライブラリをいくつか紹介しましょう。 TensorFlow 世界で最も使われている（であろう）深層学習のライブラリです。チュートリアルや解説本も多く、初心者が入門するには最適のライブラリです。 TensorFlow Chainer Preferred Networks(プリファード・ネットワークス、PFN)社が開発した、日本製のライブラリです。日本ではよく使われています。 Chainer Caffe/Caffe2 画像認識に特化しており、高速な処理が可能です。 Caffe / Caffe2 NNabla SONYが開発したライブラリ。Neural Network ConsoleというGUIツールを用いてモデルを作成できるのが特徴です。 NNabla Keras こちらは深層学習を、より便利に使うためのライブラリです。深層学習は層が増えてくると、コードの記述が面倒になりがちですが、それらを解消するためのライブラリです。TensorFlowの他、CNTKやTheanoといったライブラリにも対応しています。 Keras 田島悠介深層学習について、理解は深まったかな？大石ゆかり仕組みや活用事例など、勉強になりましたー！田島悠介深層学習は、これからエンジニアの必須の知識として必要になってくるよ。機械学習や画像認識、自然言語処理については、また別のところで勉強するね。大石ゆかり了解です。ありがとうございました！今回は、深層学習（ディープラーニング）について解説しました。これから深層学習を勉強したい、深層学習を使って何か作ってみたいという方は最初に理解しておきたい内容でしょう。また、オンラインのプログラミングスクールTechAcademyでは、AIオンライン講座を開催しています。 AI（人工知能）の構築に必要な機械学習・ディープラーニングについて実践的に学習することができます。現役エンジニアがパーソナルメンターとして受講生に1人ずつつき、マンツーマンのメンタリングで学習をサポートし、習得することが可能です。この記事を監修してくれた方太田和樹（おおたかずき） ITベンチャー企業のPM兼エンジニア普段は主に、Web系アプリケーション開発のプロジェクトマネージャーとプログラミング講師を行っている。守備範囲はフロントエンド、モバイル、サーバサイド、データサイエンティストと幅広い。その幅広い知見を生かして、複数の領域を組み合わせた新しい提案をするのが得意。開発実績：画像認識技術を活用した駐車場混雑状況把握（実証実験）、音声認識を活用したヘルプデスク支援システム、Pepperを遠隔操作するアプリの開発、大規模基幹系システムの開発・導入マネジメント地方在住。仕事のほとんどをリモートオフィスで行う。通勤で消耗する代わりに趣味のDIYや家庭菜園、家族との時間を楽しんでいる。

機械学習

マネタイズ手法を徹底比較！モバイルアプリ市場の現在とこれからのトレンド

本稿は、Smashing Magazineのブログ記事を了解を得て日本語翻訳し掲載した記事になります。本記事は、instinctools EE Labssのビジネス開発マネジャーのStacy Golmack氏によって投稿されました。モバイルアプリの市場は、ジャックの豆の木よりも急速に成長しています。業界の規模は大きく、毎日成長し、終わりは見えません。予測通り、iOS/Androidエンジニアの人口は急増し、市場に出回っているモバイルアプリの数も増え続けています。世界規模で見ても、モバイルアプリ業界の収益は急増しています。ハイブリッド型の収益モデル（アプリ内広告やアプリ内購入など）は、ビジネスの世界で急速に普及しています。多くの調査は、アプリ内広告が今後のモバイル成長の鍵となることを示しています。この記事では、以下の疑問について明らかにします。統計データと専門家の意見に裏付けされた、包括的な答えを導いています。平均的に、モバイルアプリはどれくらいの収益を生み出しますか？実際に平均収入は増えますか？今日、モバイルアプリ業界が直面している最大の課題は何ですか？今日、市場で最も一般的な収益モデルは何ですか？その中で、今後も成長が予測できるモデルは？どのモデルが生き残るでしょうか？モバイルアプリ市場には成長の見込みがあります App Annieが2015年に報告したレポートによると、モバイルアプリケーション業界は総年間収益が4.4兆円を突破し、5.5兆円まで増加すると予測されています。また、Statistaによると、年間総収入は2020年までに20兆円を超えると予測されています。リサーチ主体によって数字は多少異なりますが、全体像として、市場は決して飽和状態にはないということが示されています。 Forresterのレポートを参照したApp Annieの予測によると、2016年末までにスマートフォンを所有する人は、世界人口のわずか46％です。つまり今話題のモバイル革命は始まったばかりであることを示しています。消費者は企業よりも急速に進化しています。今日、モバイルインターネットは多くのユーザーにとって必要不可欠なものとなっています。アプリの人気に関しては、アグリゲータのアプリが、最上位に移行する可能性が高いです。アグリゲータとは、多数のオンラインリソースからコンテンツを引用して、それらをインターフェース上に見やすくまとめるツールです。コンテンツは、速報ニュースからユーザーの関心のあるニッチな分野に至るまで多岐にわたります。アグリゲータは、多数のWebサイトにアクセスしたり、多数のアプリをインストールする時間や余裕がないユーザーを対象としています。有名なアグリゲーターアプリは、Flipboard、News360、Feedly、IFTTTなどです。アグリゲータのアプリが、ショッピング体験を便利にするものである場合、ユーザーのお気に入りになる傾向があります。たとえば、Facebookはメッセンジャー（Messenger）によってこれを行いました。ユーザーは自分のニュースフィード広告を読んで、たとえばUberの配車を依頼できるのです。金持ちプラットフォーム、貧乏プラットフォームモバイルアプリの2大巨人、AndroidとiOSは、世界のスマートフォン市場を支配しています。 Gartnerの調査によると、2016年の第3四半期には、世界中で販売されているスマートフォンの87.8％がAndroidでした。この数字は、前年比で3.1％の増加です。一方、iOSの市場シェアは11.5％で、2015年比で2.5％の減少です。これらの成長は他の市場プレイヤーの地位を大幅に低下させました。スマートフォンデバイス市場の0.4％を占めていたWindowsは、モバイルプラットフォームの競争では3位となり、シェアは年率2.5％で減少しています。アップルとGoogleは、最大で最も人気の高いアプリストアを持っています。今のところ、アプリケーションやエンジニアの数において、他の競合他社がこれらのストアに対抗できる見込みはありません。 InMobiは、アプリの55％は、収益が10万円未満であると推定しています。さらに、世界中のアプリの3分の1が、製品の合計ダウンロード数が10,000に達していません。収益の格差はAndroidエンジニアの間で顕著であるのに対して、iOSデベロッパーの間ではより収益分配のバランスが取れています。2016年以降、iOSエンジニアの25％以上は毎月の収益が50万円を超えています。一方、Androidエンジニアで同様の収益を達成したのはわずか16％です。モバイルOSごとの月間平均収入を推定した興味深い統計があります。Forbesは、iOSは月平均で40万円を稼ぎ、2位のAndroidは12万円、3位のWindows Phoneは6万円程度を稼ぐと推定しています。しかし、Statistaの調べによると、この推定に反して2016年は、Windows Phoneアプリでは125万円、iOSアプリでは約90万円、Androidでは約50万円の月間平均収入が得られています。また、エンジニアの約75％は、Androidを最も好んでいます。彼らは、Androidベースの製品を開発することで収入を増やすことを考えています。 [PR] AIプログラミングコースモバイルアプリの概観高性能のモバイルCPUは、強力なグラフィック、高品質なディスプレイ、高速インターネット接続を備えることにより、スマートフォンをゲーム機に変えました。 App Annieのレポートによると、モバイルゲームは2011年にはモバイルアプリの収益全体の50％未満を占め、2015年にはモバイルアプリの市場収益の85％を生み出しました。この数字は、世界規模では約3.7兆円に相当します。しかし、ユーザーが他のカテゴリのアプリに費やす時間も急激に増加しています。ゲームアプリ以外のアプリは、アプリ使用時間において、ゲームアプリを追い抜いています。 Flurry Analytics Blogによると、2015年後半までにモバイルアプリの市場には、次のような変化が起きました。カスタマイズアプリ（ランチャー、アイコン、壁紙、ロック画面、デバイスカスタマイズアプリなど）が1位になり、セッションの使用率は332％上昇しました。新聞や雑誌のモバイル版アプリが2位で、135％の成長となりました。生産性向上ツールとアプリは使用率において3位で、125％の成長となりました。ライフスタイルとショッピングのソリューション関連のアプリは81％の成長で、4位となりました。メッセンジャー、ソーシャルアプリ、旅行、スポーツ、健康、フィットネス関連のアプリは、53％から54％に増加しました。ゲームは、ユーザーの使用時間が1％減少した唯一の例外です。収益モデル現在、収益モデルには主に6つのタイプがあります。ダイレクトセールス（直販）ユーザーが有料アプリをまだ購入していない場合、スクリーンショット、説明、動画を、画面上にプレビューします。これらを利用することで、ユーザーにアプリの購入を促し、製品のデモンストレーションを行うことができます。しかし、ダイレクトセールスによってユーザーに購入を決心させるのは困難です。このことは、収益性が最も高いアプリのリストに、有料アプリは入っていないという統計結果にも示されています。有料アプリは人気を失っている唯一のアプリですが、一部のケースではまだその価値が証明されています。たとえば、Minecraft Pocket Editionは、Google Playストアで最も利益を上げている有料アプリです。 2011年に正式にリリースされたMinecraftは、サンドボックスのビデオゲームで、ダウンロードごとに840円で販売されいます。フリーミアム（Freemium）フリーミアム（Freemium）の収益モデル（「無料」と「プレミアム」の組み合わせ）では、ユーザーは無償で基本機能を利用でき、1回限りまたはそれ以降は有料でプレミアム機能を利用できます。そのため、この収益モデルを利用するアプリは、可能な限り多くのダウンロード数を確保することに重点を置いています。フリーミアムモデルはその潜在的な搾取メカニズムについて強く批判されていますが、慎重に利用すれば優れた効果を発揮します。その例はClash of Clansです。サブスクリプション（月額課金）サブスクリプションの収益モデルは、フリーミアムと似ています。違いは、ユーザーは特定の機能だけでなく、アクセスするすべてのコンテンツについて料金を支払うことです。この収益モデルは、顧客ロイヤリティを高く保つことができれば、予測可能で長期的な収益フローを生み出します。この収益モデルを利用した優れたアプリの例は、認知心理学者が脳を訓練するために設計した、50以上の練習問題のあるLumosityです。 Lumosityは、月額（11.99ドル(約1,200円)）と年額（59.99ドル(約6,000円)）の定期購読のオプションを提供しています。 Lumosityは93,000人以上のユーザーから5つ星の平均評価を得ており、購読アプリ部門における驚異的な成功例といえます。アプリ内課金アプリ内課金は、モバイルゲーム、購入商品について料金を請求する商品カタログアプリで、特に一般的です。この収益モデルは柔軟性が高く、ゲームアプリの中にはユーザーに購入を促すものもあります。 2016年2月現在、Tech Timesによると、モバイルゲームのユーザーの約1.9％がアプリ内購入を行い、この数字は着実に増加しています。例として、ユーザーが特定の商品やサービスを購入できるソーシャルアプリであるMeetMeがあります。 MeetMeでは、料金を支払ってプロフィールのビューを増やすことができます。このアプリの開発者は、明確な収益モデルを持っていることで、相当な収入を得ることに成功しています。クラウドファンディングクラウドファンディングは、比較的新しい収益モデルです。アプリの開発者は、KickstarterやIndiegogoなど人気のあるオンライン上のプラットフォームで、アプリのアイデアを提示し、出資を募ります。興味深いプロジェクトであれば、当初募集した額より数倍高い資金を集めることもできます。スタートアップのShadowは理想的な例です。このプロジェクトでは、3,784人の支持者から82,577ドル(約900万円)の資金を集めています。 Shadowは、報酬とプロジェクトに対する独占権も提示して、睡眠と夢を記録するソフトウェアのクラウドファンディングに挑戦しました。 Shadow会員専用のカードを渡された人は、基本的にアプリを無料で利用できますが、利用価格が8ドルに上昇したときには、これを約2万ドルで売却できます。スポンサーシップスポンサーシップは、新しい収益モデルです。ユーザーは、報酬の見返りとして広告スポンサーになります。報酬は開発者にも分配されます。この収益モデルはまだ黎明期にあるため、マーケティング戦略を磨く必要があります。 RunKeeperは、4,500万人以上のユーザーからなるコミュニティを持ち、スポンサーシップを利用したビジネスモデルの素晴らしい例です。ユーザーは、一定の距離をランニングするか自転車で走ると、報酬を受け取ります。広告主がユーザーに支払います。開発者は、迷惑な広告を掲載していないことについて高く評価されるでしょう。広告による収益化これは最も一般的な収益モデルであり、詳しく検討する必要があります。人気の理由は明らかです。ユーザーには無料アプリをダウンロードしたいという需要があり、ダウンロード数が増加するほど開発者の収益も増加します。 IHS Markitのレポートによると、2020年までに、アプリ内広告は年間5.8兆円の市場規模に達すると予想されています。これはモバイルデバイス上の全広告収入の約63％に相当します。他のセクターと同様に、広告ベースのアプリを開発している少数の主要な開発者が、収益の大部分を生み出しています。他の大多数の開発者は、残りの取り分を分け合わなければなりません。 Klick Healthによると、首位はFacebookで、Facebookのアプリには全モバイル広告の44.3％が表示されています。ランキングにおける他の企業は、Alibaba、Google、Tencent、Twitter、Pandora、Yahooです。最高額の広告収入を得ている企業は、しばしば主要な広告スポンサーになります。この傾向は特にモバイルゲームのアプリにおいて顕著です。 Rovio、Gameloft、Disneyなどの最大のベンダーは、比較的人気の低い数百のインディーゲーム製品内で、自社のゲーム製品を宣伝しています。まとめすでに見たように、モバイルアプリ市場の急速な成長はすぐには止まらないと予測できます。競争は激化しているにもかかわらず、開発者は新しい収益モデルを活用して、ユーザーにとってより面白くより便利なソリューションを創造しています。少なくとも2つの新しい収益モデルは効果が高いことが明らかになり、ここ数年で人気が高まっています。上記の収益モデルはどれも効率的です。開発者や発行者は、ケースに応じてこれらの収益モデルを導入することに熟練しています。たとえば、購読モデルは特定のニッチでのみ機能しますが、最も収益性の高いモデルです。また、潜在的に悪意があると批判されているフリーミアムの収益モデルは、慎重に使用すれば優れた効果を発揮します。Clash of Clansがその完璧な例です。有料アプリは、急速に人気を失っている唯一のアプリですが、一部のケースではまだその価値が証明されています。ハイブリッド型の収益モデル（アプリ内広告やアプリ内購入など）は、ビジネス界で特に人気を集めています。多くの調査によって、アプリ内広告は今後のモバイル成長の鍵となることが示されています。今日、iOSとAndroidは主要なモバイルOSであり、大手のモバイルアプリストアを保有しています。時が経てば、モバイルアプリ市場がどのように発展するか明らかになるでしょう。市場の動向からは、市場は将来的にも、より高い収益を生み出し続けると予測できます。今話題のモバイルアプリ革命は始まったばかりです。 TechAcademyでは初心者でも最短4週間でオリジナルアプリが作れるiPhoneアプリ開発オンラインブートキャンプ、Androidアプリ開発オンラインブートキャンプを開催しています。期間中は現役エンジニアのメンターが毎日学習をサポートするので、独学よりも効率的に学ぶことができます。

スマートフォンアプリ開発

記事を検索

ニュース

インタビュー

テクノロジー

キャリア

お問い合わせ

【徹底解説】機械学習（マシンラーニング）とは！まずはここから理解しよう

目次

機械学習とは

教師あり学習

分類問題