データ分析で欠かせない!Jupyter Notebookの使い方【初心者向け】
初心者向けにPythonを使ったデータ分析で便利なJupyter Notebookの使い方を詳しく解説しています。Jupyter Notebookのインストール方法や使い方を分かりやすくまとめているので、ぜひ参考にしてみてください。
テックアカデミーマガジンは受講者数No.1のプログラミングスクール「テックアカデミー」が運営。初心者向けにプロが解説した記事を公開中。現役エンジニアの方はこちらをご覧ください。 ※ アンケートモニター提供元:GMOリサーチ株式会社 調査期間:2021年8月12日~8月16日 調査対象:2020年8月以降にプログラミングスクールを受講した18~80歳の男女1,000名 調査手法:インターネット調査
今回は、データ分析で欠かせないツールであるJupyter Notebookについて解説します。
Jupyter Notebookは、機械学習やデータ分析を行う際に広く使われている「統合開発環境」です。
とても便利なので、ぜひこの記事を参考に、Jupyter Notebookでの作業にチャレンジしてみてください。
目次
Jupyter Notebookとは
Jupyter Notebookとは、機械学習やデータ分析を行う際に広く使われている「統合開発環境」で、「ジュパイター ノートブック」または「ジュピター ノートブック」と呼びます。
Jupyter Notebookは、プログラムや説明テキスト、実行結果などを「ノートブック」と呼ばれるファイルにまとめて管理し、データを分析します。
オープンソースで公開されているため、個人/商用利用問わず、誰でも無料でインストールすることができます。
また、ブラウザで動作するため、OSの種類を気にすることなくチームメンバーとのコード共有も気軽に行えます。
Jupyter Notebookをインストールするには
Jupyter Notebookをインストールするには、以下のようなソフトウェアが必要になります。
- Jupyter Notebook 本体
- Python
- Pythonでよく利用されるデータ分析やグラフ描画などのライブラリ
一般的に、上記をまとめてインストールすることのできるANACONDA(アナコンダ)という開発環境パッケージを利用します。
ANACONDAには無償版(Individual Edition)と有償版(Commercial Edition)がありますが、個人で利用する場合には無償版で問題ありません。
有償版を利用する必要があるのは、社員が200人以上の会社(営利団体)で利用するケースです。
この記事では、無償版について説明していきます。
では、以下のANACONDAのダウンロードページから、インストーラーをダウンロードしましょう。
ページの下の方にある「Anaconda Installers」に示されている、ご自身のOS環境に合わせたインストーラーをダウンロードします。
通常は64-Bitの方を選択すると良いでしょう。
ダウンロードしたインストーラーを実行して、手順通りに進めていきます。
インストールが終わったら、ANACONDA NAVIGATORを起動します。
以下のような画面になります。
ANACONDAは、複数の環境を用意して、用途に応じて環境を切り替えて使うことができるようになっています。
まず、左端のメニューより「Environments」を選択して、画面下のCreateボタンをクリックしましょう。
Nameに適宜名称を入力し、Createをクリックすると新しい環境が作成されます。
ライブラリのインストールもEnvironmentsから行いましょう。
今回はグラフ描画ライブラリである、matplotlibをインストールしてみます。
画面右側で「Not Installed」を選択した上で、右端のテキストボックスに「matplotlib」と入力します。
一覧に候補が表示されますので、matplotlibを選択し、Applyをクリックすると、インストールが始まります。
他のライブラリも、同様の手順でインストールすることができます。
環境の作成が終わったら、左端のメニューより「Home」を選択します。
「jupyter」と書かれたタイルにInstallボタンが表示されていますので、クリックするとJupyter Notebookのインストールが始まります。
インストールが終わり、ボタンの表記が「Launch」に変わったらクリックしてみましょう。
Jupyter Notebookが起動します。
次回以降は、LaunchをクリックするだけでJupyter Notebookを起動することができます。
Jupyter Notebookの使い方
以下は、Jupyter Notebookを起動した直後の画面です。
まずは画面右端の「New」をクリックして、ノートブックを新規作成してみましょう。
表示されたメニューからは「Python3」を選択します。
すると、新たなノートブックが作成され、ブラウザに表示されます。
それでは、「1」と書かれたセルに、以下のように入力してみましょう。
# ソースコードを記述し、Shift+Enterで実行できます。 print(1+2)
入力が終わったら、Shift
キーを押しながらEnter
キーを押します。
すると、ソースコードが実行され、セルの下に実行結果が表示されます。
このようにJupyter Notebookでは、セルごとにソースコードを記述して、実行を行います。
セルの下に表示された実行結果は、再実行の度に再表示されます。
実行することで、さらに下に新たなセルが追加されています。
新たに追加されたセルを選択し、Cellメニューから、Cell Type、Markdownを選択してみてください。
セルには、以下のように入力します。
## CellTypeをMarkDownにする CellTypeをMarkDownにすることで、 *マークダウン記法* により文章を記述することができます
入力が終わったら、Shift
キーを押しながらEnter
キーを押します。
すると、セルに書かれたマークダウン記法が解釈され、「CellTypeをMarkDownにする」というテキストが見出しとして表示されました。
今度は、ノートブックにグラフを表示させる方法をみていきましょう。
以下のソースコードを入力し、実行してみましょう。
%matplotlib inline import matplotlib.pyplot as plt price = [100, 250, 380, 500, 700] number = [1, 2, 3, 4, 5] # グラフを書く plt.plot(price, number) # グラフのタイトル plt.title("price / number") # x軸のラベル plt.xlabel("price") # y軸のラベル plt.ylabel("number") # 表示する plt.show()
すると、以下のような実行結果になります。
ノートブックにグラフが表示されているのが確認できますね。
以上のように、Jupyter Notebookではソースコードと説明テキスト、実行結果をまとめて保存しておくことができます。
そのため、分析結果を他の人に共有したり、分析の試行錯誤の作業がとても行い易くなっています。
最後に、ノートブックの保存方法と終了方法を説明します。
Jupyter Notebookは、定期的に自動保存される仕組みになっていますが、メニューのSaveボタンを押すことで任意のタイミングで保存することができます。
終了する際は、Fileメニューの「Close and Halt」を選択しましょう。
ブラウザを閉じることで終了してしまうと、バックグラウンドでPythonの実行環境(カーネル)が起動したままになってしまうので注意しましょう。
まとめ
今回は、Jupyter Notebookの概要とインストール方法、使い方について説明しました。
Jupyter Notebookについて、理解は深まったでしょうか?
これからJupyter Notebookを勉強したい、機械学習を使って何か作ってみたいという方は最初に理解しておきたい内容です。
Jupyter Notebookは、Pythonのプログラミングを気軽に試すことができるので、たくさんノートブックを作成して学習を深めてみてください。
深層学習や画像認識、自然言語処理については、リンク先の記事で解説しているので、もっと知りたいという人は覗いてみてください。
また、オンラインのプログラミングスクールテックアカデミーでは、AIオンライン講座を開催しています。
AI(人工知能)の構築に必要な機械学習・ディープラーニングについて実践的に学習することができます。
現役エンジニアがパーソナルメンターとして受講生に1人ずつつき、マンツーマンのメンタリングで学習をサポートし、最短4週間で習得することが可能です。