Python

Pythonによるk-meansクラスタリングの実装方法を現役エンジニアが解説【初心者向け】

初心者向けにPythonによるk-meansクラスタリングの実装方法について現役エンジニアが解説しています。k-meansとはクラスタリングの手法の一つで、非階層型クラスタリングのアルゴリズムです。scikit-learnのデータセットを使いクラスタリングを実装して、matplotlibを使いグラフにして表示します。

テックアカデミーマガジンは受講者数No.1のプログラミングスクール「テックアカデミー」が運営。初心者向けにプロが解説した記事を公開中。現役エンジニアの方はこちらをご覧ください。 ※ アンケートモニター提供元：GMOリサーチ株式会社　調査期間：2021年8月12日～8月16日　調査対象：2020年8月以降にプログラミングスクールを受講した18～80歳の男女1,000名　調査手法：インターネット調査

監修してくれたメンター

平野勝靖

製造業のエンジニア兼DX推進リーダー。プログラミング歴は20年。テックアカデミーではPythonコース、データサイエンスコースを担当。

Pythonによるk-meansクラスタリングの実装方法について、テックアカデミーのメンター（現役エンジニア）が実際のコードを使用して初心者向けに解説します。

1. k-meansとは？

k-meansとはクラスタリングの手法の一つで、非階層型クラスタリングのアルゴリズムです。

クラスタの平均を用いて、与えられたクラスタ数 k個に分類することからこの名前が付けられました。k平均法と呼ばれることもあります。

非階層型クラスタリングとは、異なる性質の集団の中から似た特徴を持ったものでクラスタを行う手法のことです。

階層型と異なり、階層的な構造を持たず、予め決められたクラスタ数でサンプルを分類します。サンプルが大量にある正規分布のデータに対して、データをグループ分けを行う際に効果的です。また、クラスタリングは機械学習の手法一つでアルゴリズムから特徴を見つけて分類を行うことから、「教師なし学習」となります。

2. Numpyのインストール

ここからはPythonでクラスタリングを行うための環境をセッティングしていきます。まずは、配列の演算を扱うためのライブラリとしてNumpyをインストールしていきます。

以下のコマンドを実行してインストールします。

pip install numpy

[PR] 未経験からWebエンジニアを目指す方法とは

3. Pandasのインストール

続いて、サンプルデータのファイルを読み込み、データフレームの形式に変換するためにPandasをインストールします。

pip install pandas

4. scikit-learnのインストール

機械学習ライブラリのscikit-learnをインストールします。scikit-laernは機械学習のアルゴリズムやサンプルのデータが同梱されています。

pip install scikit-learn

5. matplotlibのインストール

クラスタリングの結果をグラフにプロットするためにmatplotlibをインストールします。

pip install matplotlib

6. 各ライブラリの使い方

必要なライブラリをインストールできたら、ライブラリのインポートを行います。各ライブラリのインポートは以下の通りです。

from matplotlib import pyplot as plt
from sklearn import datasets, preprocessing
from sklearn.cluster import KMeans
import numpy as np 
import pandas as pd

これで必要なライブラリのインポートは完了です。それでは、具体的にライブラリの使い方を手順を交えて説明します。

データの読み込み

まずはクラスタリングに使用するデータを用意します。ここではscikit-learnを使用してデータセットの読み込みを行います。scikit-learnには分類や回帰といった機械学習の問題に使うことができるデータセットが同梱されています。

使用可能なデータセットは以下の公式ドキュメントにまとめられています。

7. Dataset loading utilities

ここでは、この中からワインの種類のデータセットを使っていきます。以下の記述でデータを読み込みます。

wine_data = datasets.load_wine()

前処理

データを読み込んだ後、データを解析するために必要な前処理を行います。

pandasを使用し、先程読み込んだデータをデータフレームに変換していきます。

df = pd.DataFrame(wine_data.data, columns=wine_data.feature_names)

ここで、このデータセットの構造を確認してみます。以下の1行で変換したデータフレームの最初の5行を出力します。

print(df.head())

結果は以下のように出力され、13列のカラムがあることが分かります。

alcohol malic_acid ash alcalinity_of_ash magnesium ... proanthocyanins color_intensity hue od280/od315_of_diluted_wines proline
0 14.23 1.71 2.43 15.6 127.0 ... 2.29 5.64 1.04 3.92 1065.0
1 13.20 1.78 2.14 11.2 100.0 ... 1.28 4.38 1.05 3.40 1050.0
2 13.16 2.36 2.67 18.6 101.0 ... 2.81 5.68 1.03 3.17 1185.0
3 14.37 1.95 2.50 16.8 113.0 ... 2.18 7.80 0.86 3.45 1480.0
4 13.24 2.59 2.87 21.0 118.0 ... 1.82 4.32 1.04 2.93 735.0
[5 rows x 13 columns]

クラスタリングは2次元の配列を使って行うものなので、今回は、この中から”alcohol”と”color_intensity”のカラムを使っていきます。

そこで、前処理としてクラスタリング用のデータの整形を行います。ここではscikit-learnのモジュールであるpreprocessingを使っていきます。

X=df[["alcohol","color_intensity"]]
sc = preprocessing.StandardScaler()
sc.fit(X)
X_norm = sc.transform(X)
print(type(X_norm))

クラスタリング

いよいよクラスタリングを行っていきます。今回はクラスタ数を3つに設定します。

cls = KMeans(n_clusters=3)
result = cls.fit(X_norm)

結果を出力

クラスタリングの結果をmatplotlibを使って出力します。scatterを使ってプロットをしています。

plt.scatter(X_norm[:,0],X_norm[:,1], c=result.labels_)
plt.scatter(result.cluster_centers_[:,0],result.cluster_centers_[:,1],s=250, marker='*',c='red')
plt.show()

7. k-meansクラスタリングを出力してみよう

前項の内容をもとに作成した全体のコードが以下の通りです。

from matplotlib import pyplot as plt
from sklearn import datasets, preprocessing
from sklearn.cluster import KMeans
import numpy as np
import pandas as pd
 
# datasetの読み込み
wine_data = datasets.load_wine()
# DataFrameに変換
df = pd.DataFrame(wine_data.data, columns=wine_data.feature_names)
print(df.head())
# データの整形
X = df[["alcohol","color_intensity"]]
sc = preprocessing.StandardScaler()
sc.fit(X)
X_norm = sc.transform(X)
 
# クラスタリング
cls = KMeans(n_clusters=3)
result = cls.fit(X_norm)
# 結果を出力
plt.scatter(X_norm[:,0],X_norm[:,1], c=result.labels_)
plt.scatter(result.cluster_centers_[:,0],result.cluster_centers_[:,1],s=250, marker='*',c='red')
plt.show()

実際に実行してみると最終的には以下のグラフのウィンドウが出力されます。図の中の赤い星が各クラスタの中心になります。

Pythonのscikit-learnライブラリのデータセットを使って、k-meansクラスタリングを実装して、グラフに表示するサンプルプログラムの実行結果

7-1. データに異常値が存在する場合

赤い星のクラスタの中心からの距離が遠いデータが存在した場合、そのデータは同じクラスタでも性質が異なることを意味します。

このようなデータを異常値と呼び、この異常値が存在はクラスタリングの精度を低下させます。

そのため、異常値と判断した場合は「該当データの削除」や「データや特徴量の追加」の検討が必要です。

仮に前述のワインのデータセットにおいて、左上の赤矢印のデータが存在した場合を考えてみましょう。

赤矢印のデータは黄色にクラスタリングされていますが、他の黄色のデータと比較して、赤い星のクラスタの中心から距離があります。

そのため、黄色の他のデータとは別の性質を持つ異常値である可能性が高いと判断できます。

また、この異常値によって赤い星のクラスタの中心が、異常値が存在しなかった場合と比較して、左上に移動しており、緑や紫のクラスタとの境界が変わってしまっています。

異常値が存在しなかった場合のクラスタリングを正とした場合、異常値によって誤ったクラスタリングとなっています。

以上のように、クラスタリングを行う場合は、異常値に注意する必要があります。

なお、異常値と判断する距離については、解析の目的やデータセットに依存します。

そのため、データについて深く理解した上で、閾値となる距離の設定するようにしましょう。

7-2. クラスタ数が適切ではない場合

前述のコードではクラスタ数を3つに設定しましたが、クラスタ数が適切でなかった場合（仮に5つに設定）のクラスタリング結果が以下となります。

クラスタ数 3のクラスタリングを正とした場合、5とした場合は正しくクラスタリングできていない事が分かりますね。

このように、正しくクラスタリングを行うためには、クラスタ数を適切に選択する必要があります。

一般的にクラスタ数は分類したいクラスタの数から設定しますが、経験に基づく所が多くあります。

そのため、こちらもデータについて深く理解した上で、仮のクラスタ数を設定し、クラスタリングを実施。

そして、その結果をクラスタ数にフィードバックし、再度クラスタリングを行うトライ＆エラーにより設定しましょう。

7-3. k-meansによるクラスタリングが適していない場合

k-meansは、扱うデータが以下のいずれかに当てはまる場合、クラスタリングの精度が低下します。

1.クラスタが球形でない場合

2.クラスタ間のデータのばらつきが等しくない場合

それぞれについて例を用いて説明します。

7-3.1.クラスタが球形でない場合

k-meansは、クラスタが球形であると仮定します。

そのため、以下のような細長いクラスタなどでは、正しくクラスタリングできないことがあります。

7-3.2.クラスタ間のデータのばらつきが等しくない場合

k-meansは、データをデータのばらつきの等しいグループに分け、クラスタリングを行います。

そのため、以下のようなクラスタ間のばらつきが異なるデータの場合は、正しくクラスタリングできないことがあります。

以上が、k-meansによるクラスタリングが適していないデータの解説となります。

逆に「クラスタが球形であり、データのばらつきが等しい」データの場合は、クラスタリングの手法としてk-meansを試してみるといいでしょう。

8.まとめ

今回はPythonでk-meansクラスタリングを実装しました。

Pythonなら自分で一から実装しなくても簡単にクラスタリングを行うことができます。クラスタリングは異なる特徴の集団から分類を行う際に便利な手法です。大量のデータ分析を行う際におすすめです。

内容分かりやすくて良かったです！

ゆかりちゃんも分からないことがあったら質問してね！

分かりました。ありがとうございます！

Pythonを学習中の方へ

これで解説は終了です、お疲れさまでした。

つまずかず「効率的に」学びたい
副業や転職後の「現場で使える」知識やスキルを身につけたい

プログラミングを学習していて、このように思ったことはありませんか？

テックアカデミーのPythonコースでは、第一線で活躍する「プロのエンジニア」が教えているので、効率的に実践的なスキルを完全オンラインでしっかり習得できます。

合格率10%の選考を通過した、選ばれたエンジニアの手厚いサポートを受けながら、人工知能（AI）や機械学習の基礎を学べます。

まずは一度、無料体験で学習の悩みや今後のキャリアについて話してみて、「現役エンジニアから教わること」を実感してみてください。

時間がない方、深く知ってから体験してみたい方は、今スグ見られる説明動画から先に視聴することをおすすめします！

Pythonで別ファイルの関数を実行する方法を現役エンジニアが解説【初心者向け】

Pythonで別ファイルの関数を実行する方法について解説します。そもそもPythonについてよく分からないという方は、Pythonとは何なのか解説した記...

Python

Pythonにおけるパッケージ管理ツールのpipの利用方法を現役エンジニアが解説【初心者向け】

Pythonにおけるパッケージ管理ツールのpipの利用方法について解説します。そもそもPythonについてよく分からないという方は、Pythonとは何な...

Python

Pythonのシングルクォーテーションとダブルクォーテーションの違い【初心者向け】

Pythonのシングルクォーテーションとダブルクォーテーションの違いについて解説します。そもそもPythonについてよく分からないという方は、Pytho...

Python

Pythonで一定間隔で処理を実行する方法を現役エンジニアが解説【初心者向け】

Pythonで一定間隔で処理を実行する方法について、TechAcademyのメンター（現役エンジニア）が実際のコードを使用して、初心者向けに解説します。 ...

Python

Pythonで画像を回転させる方法を現役エンジニアが解説【初心者向け】

Pythonで画像を回転させる方法について、TechAcademyのメンター（現役エンジニア）が実際のコードを使用して、初心者向けに解説します。 &nbs...

Python

Pythonのプログラムをデーモン（常駐ソフト）化する方法を現役エンジニアが解説【初心者向け】

Pythonのプログラムをデーモン（常駐ソフト）化する方法について解説します。そもそもPythonについてよく分からないという方は、Pythonとは何な...

Python

あわせてよく読まれている記事

データ分析のライブラリ！Pandasとは【初心者向け】｜現役エンジニアが解説

今回は、Pythonのデータ解析用ライブラリであるPandasについて解説します。 Pandasを使うと、データの統計量を表示したり、グラフ化するなど、データ分析（データサイエンス）や機械学習で必要となる作業を簡単に行うことができるようになります。 Pythonでデータ分析を行うには、必須のライブラリなので、ぜひこの記事を参考に、Pandasの使い方を覚えましょう。なお本記事は、TechAcademyのAIオンライン講座の内容をもとに作成しています。目次 Pandasとは Pandasの特徴 Pandasでできること Pandasを使うメリット Pandasを利用するにはダウンロード手順初期設定 Pandasの使い方 Pandasをより便利に使う方法 Pandasの勉強方法大石ゆかり田島メンター！Pandasというのは何でしょうか？田島悠介 Pythonのデータ解析用のライブラリだよ。Pythonでデータ分析や機械学習を行うには、必須のライブラリなんだ。大石ゆかりどのような機能があるのですか？田島悠介例を見ながら説明していくね！ Pandasとは Pandasは、Pythonでデータ分析を効率的に行うためのライブラリです。Pandasはオープンソース(BSDライセンス)で公開されており、個人／商用問わず、誰でも無料で利用することができます。 Pandasを使うと、データの読み込みや統計量の表示グラフ化データ分析に関する作業を容易に行うことができるようになります。また主要なコードはPythonまたはC言語で書かれており、Pythonだけでデータ分析を行うのと比較して、非常に高速に処理を行うことができます。データ分析（データサイエンス）は、機械学習を行うまでの前処理（データの読み込み、クリーニング、欠損値の補完、正規化など）が、全ての作業の8〜9割を占めると言われています。Pandasを使うとそのような処理が効率的に行えるようになるため、Pythonで機械学習を行うには、Pandasは必須のライブラリとなっています。 [PR] 未経験からWebエンジニアを目指す方法とはPandasの特徴 Pythonによるデータ分析で多く使われているライブラリといえば、PandasやMatplotlib、NumPyなどがあげられます。これらのライブラリはそれぞれ以下のような特徴があります。 Pandas Pandasはデータの読込や並べ替え、欠損値（欠けている項目値）の補完などを行うことができるライブラリです。データ分析の前処理段階でとても多く利用されています。データの読込はCSVやテキストだけでなく、エクセルやインターネット上で提供されている株価情報など、多様な形式のデータを読み込むことが出来ます。また、Pandasの特徴はDataFrameという多機能な「表」にあります。DataFrameにはデータの平均値や行数などの概要的な特徴を把握する機能や、並べ替えや列名の変更などのデータを整形する機能があります。またキーを指定しての集計やMatplotlibと連携してのグラフによる可視化など、データ分析のデータ前処理の段階で便利な多くの機能が提供されています。データ分析の過程では、Pandasである程度データをきれいに整えてから、NumPyで数値計算を行うようといったように、使い分けて利用することが多いでしょう。 Matplotlib MatplotlibはPythonで代表的なグラフを描画するライブラリです。2Dだけでなく3Dも含めた多くの種類のグラフを描画することができます。 Matplotlibは慣れると使いやすいのですが、はじめは使い方がやや難しく感じると思います。そのような場合、PandasやSeabornなどのライブラリと組み合わせることで、見た目の良いグラフを簡単に描画することができます。 Matplotlibはデータ分析の様々な段階で、NumPyやPandasと組み合わせてデータの概要を把握したり、特徴を可視化するような目的で使用します。 NumPy NumPyは数値計算や行列演算を行うライブラリです。複数の数値を配列としてまとめて扱ったり、行列演算を行ったりするのが得意です。特にコンピューターで小数点以下を扱う際の標準的な形式である浮動小数点型の行列演算を高速に行うことが出来ます。また三角関数や平方根などの数値計算の機能も豊富です。 NumPyはある程度データの前処理が終わり、きれいに整ったデータに対して数値計算を行うのに向いているライブラリと言えます。 Pandasでできること Pandasには多くの機能があります。主に利用する機能を確認してみましょう。なお以下でDataFrameと記載しているのはDataFrameオブジェクトを指しています。データの読込 CSV形式のデータの読込：read_csv() Excelファイルの読込：read_excel() JSON文字列の読込：read_json() pickle形式(Pythonオブジェクトを保存する形式)によるデータの読込/書込：read_pickle()、to_pickle() インターネット上で提供されている株価情報の読込：pandas-datareader データの特徴を把握データの特徴を表示：DataFrame.info() 要約統計量を表示：DataFrame.describe() データの一部を表示：DataFrame.head()、DataFrame.tail() データの形状を表示：DataFrame.shape 行数を取得：DataFrame.index.values 列名を取得：DataFrame.columns.values それぞれの列の型を取得：DataFrame.dtypes データの切り出し（スライス）データのスライス：DataFrame[]、DataFrame.iloc[]、DataFrame.loc[] フィルタリング：DataFrame.query() データの並べ替え値による並べ替え：DataFrame.sort_values() インデックスによる並べ替え：DataFrame.sort_index() 列名の変更：DataFrame.rename() 集計列の集計：DataFrame.value_counts() 表の集計：DataFrame.groupby() ※groupby().sum()で合計、groupby().mean()で平均値得ることができる可視化 Matplotlibのimportが必要ヒストグラム：DataFrame.hist() 散布図、線グラフ：DataFrame.plot() 棒グラフ：DataFrame.bar() 箱ひげ図：DataFrame.boxplot() 欠損値の扱い欠損値の確認：DataFrame.isnull().sum() 欠損値に値を埋める：DataFrame.fillna() 欠損値のある行を削除する：DataFrame.dropna() その他カテゴリー変数の展開：get_dummies() 列同士の相関を確認：DataFrame.corr() Pandasを使うメリットデータ分析であればExcelなどの表計算ソフトを使えば十分という方も多いでしょう。Pandasを使うと、大量データに対して何度でも同じ処理をプログラムを実行するだけで行うことができるというメリットがあります。大量データの処理が可能 Pandasではパソコンのメモリ容量が許す限り、大量のデータをDataFrameに読み込んで処理を行うことが出来ます。動作速度も表計算ソフトほど遅くはなりません。同じ処理を何度も再実行できる 1つ1つの作業を人間が操作して行うのではなく「プログラム」として記述することで、何度でも全く同じ処理を繰り返し実行することが可能となります。データ分析では再現性が重要であり、手順書をもとにした人間の操作よりも、プログラムで処理自体を記述したほうが、確実に同じ処理を再実行することができます。また、大量データに対する処理は数時間～数日も時間を要することがあります。このような場合でも、人間はプログラムを実行して結果を待つだけです。表計算ソフトのように、付きっきりで操作し続ける必要はありません。さらにパソコンを複数台数用意して、条件を少し変えたプログラムを同時並行で実行して結果を比較する、といったことも容易に実現可能です。他のライブラリと連携し多彩な機能を実現できる他のライブラリと連携することで、プログラムを実行してグラフを描画したり、加工した結果を表計算ソフトのファイルとして出力するなど、Pandasだけでは行えない多くのことを実現することができます。 Pandasを利用するには Pandasを利用するには、Anacondaなどの「ディストリビューション」と呼ばれる開発環境をまとめたパッケージを使うのが簡単です。Anacondaは、データ分析やグラフ描画など、Pythonでよく利用されるライブラリを含んだ開発環境です。ここではAnacondaを例にダウンロード手順と初期設定について確認しましょう。ダウンロード手順 Anacondaの公式サイトからProducts > Individual Edition > Downloadを表示します。 Anaconda – Individual Edition – Download Windows、Mac共に「Python 3.7 – 64-Bit Graphical Installer」をクリックしてダウンロードします。なお、Python2.7は古いバージョンであり、サポート期間が2020年4月とすでに終了しています。どうしても必要な場合を除き、利用することは無いでしょう。ダウンロードしたファイルを実行することでインストールを行うことが出来ます。選択肢などは既定値のままで良いでしょう。初期設定インストールが終わったら、Anaconda Navigatorを起動します。はじめに初期設定として必要なライブラリをインストールしましょう。ライブラリのインストールはEnvironmentsから行います。Environmentsを開き、「Not installed」を選択して検索ボックスに「pandas」と入力します。一覧にPandasが表示されますので、チェックボックスで選択し、画面右下のApplyボタンを押すことでインストールすることができます。また、今回は説明用にscikit-learnのサンプルデータセット（トイデータセット）を使用します。同様にscikit-learnとnumpy、matplotlibもインストールしておきましょう。インストールが終わったらHomeに戻ります。プログラムはJupyter Notebookで作成します。画面の「jupyter notebook」と書かれた部分の「Launch」ボタンをクリックします。初回は「Install」ボタンになっており、クリックするとJupyter Notebookがインストールされます。以降は、Jupyter Notebookをもとに、Pandasの使い方を説明します。 Pandasの使い方 Pandasを使う際は、初めにPandasライブラリをインポートします。併せてサンプルデータセットも利用できるようにしておきましょう。 # Pandas、及び必要なライブラリのインポート import pandas as pd from pandas import DataFrame import numpy as np # サンプルデータセットを取得する from sklearn import datasets boston = datasets.load_boston() 実行結果は特にありません。エラーがでなければ、正しくインポートされています。次に、サンプルデータセットをPandasのDataFrame型に変換しておきます。なお、今回はサンプルデータセットを使いましたが、CSVデータを読み込むread_csvという命令も用意されています。 # PandasのDataFrame型に変換 df = DataFrame(boston.data, columns = boston.feature_names) # 目的変数をDataFrameへ追加 df['MEDV'] = np.array(boston.target) 準備が整いました。それではPandasの命令を幾つか見ていきましょう。データの概要を確認する先頭5行を表形式で表示する df.head() 実行結果は以下のようになります。行列数を表示する df.shape 実行結果は以下のようになります。 (506, 14) 細かい情報を表示する dataset.info() 実行結果は以下のようになります。 <class 'pandas.core.frame.DataFrame'> RangeIndex: 21613 entries, 0 to 21612 Data

機械学習

Photoshopでラスタライズする方法【初心者向け】

Photoshopでラスタライズする方法を初心者向けに解説した記事です。「ラスタライズとは」の説明もありますので、やり方を覚えておきましょう。目次1. k-meansとは？2. Numpyのインストール3. Pandasのインストール4. scikit-learnのインストール5. matplotlibのインストール6. 各ライブラリの使い方7. k-meansクラスタリングを出力してみよう8.まとめPythonを学習中の方へ (※今回の作業はすべてAdobe Photoshop CCのバージョンで行っています) 田島悠介今日はラスタライズについて学んでみよう。大石ゆかり田島メンター！！ラスタライズってそもそも何ですか～？田島悠介そうだね……まずラスタライズの前に、Photoshopで使用する2つの画像データ形式について説明するよ。大石ゆかりはい！よろしくお願いします！ラスタデータとベクタデータコンピュータで扱う画像の形式として、ラスタデータとベクタデータがあります。ラスタデータはピクセル・ドット(画素)で形成された画像で、「ビットマップ画像」「ピクセル画像」とも呼ばれています。デジカメなどで撮影した写真などはラスタデータにあたります。ラスタ形式の画像を拡大すると、小さなピクセル・ドットの1つ1つに色が設定されていることがわかります。対するベクタデータは座標の点と点を結ぶ形で描画される形式で、「ベクター画像」「ベクトル画像」とも呼ばれています。 Photoshopでは図形を描くシェイプなどがベクタデータにあたります。ベクタデータは、拡大縮小を繰り返しても画像が劣化しないのが特徴で、ロゴのように線と塗りだけで構成されたような画像の描画に適しています。ラスタライズとはラスタライズとは、ベクタデータをラスタデータに変換することを指します。 Photoshopは1つのファイル内に、ベクタデータとラスタデータのレイヤーを混在させられますが、ラスタデータのレイヤーにしか適用できない効果が多くあります。例えば、ブラシツールでの描画や消しゴムツールでの部分的な削除、フィルター加工などはラスタデータのレイヤーにしか適用できません。ベクタデータであるテキストやシェイプのレイヤーにそれらを施すには、レイヤーをラスタライズをする必要があります。今回は以下の画像を背景として、上にテキストのレイヤーを1つ、シェイプのレイヤーを1つ作成し、それぞれをラスタライズしてみたいと思います。田島悠介「ペンツール」で描画されたものもベクタデータになるね。大石ゆかりラスタライズするのはどういった目的の時なんですか？田島悠介たとえばフィルターによる画像加工は、ベクタデータのままでは適用できないんだ。ラスタデータでしかできない処理を行いたいときにラスタライズする必要があるんだよ。それでは実際にやってみよう。 [PR] 未経験からWebエンジニアを目指す方法とはテキストレイヤーをラスタライズする方法まず、画面左のツールバーからテキストツールを選択し、画像の適当なところでテキストを入力します。すると、自動でテキストレイヤーが新規作成されます。試しに、作成されたテキストレイヤー上でブラシツールを使って描画してみます。カーソルが下の画像のようになって画面に描画できないことが確認できます。では次に、テキストレイヤーを右クリックして「テキストをラスタライズ」を選択してみましょう。以下はラスタライズしたレイヤーに白のブラシで描画した様子です。テキストをラスタライズしたことで、テキストを入力したレイヤーにブラシで描画できるようになっているのがわかります。シェイプレイヤーをラスタライズする方法次はシェイプのレイヤーを作成してみましょう。画面左のツールバーにてシェイプツールを右クリックし、「カスタムシェイプツール」を選択します。画像の上で右クリックするとウィンドウが表示されますので、好きな形状を選んでみましょう。選んだら適当なところでドラッグしシェイプを作成します。すると、シェイプのレイヤーが自動で新規追加されます。先ほどと同様に、シェイプレイヤー上でブラシツールを使用してみます。やはりカーソルの形が変わり描画できない状態になっています。では、シェイプのレイヤーを右クリックし、「レイヤーをラスタライズ」を選択してみましょう。ブラシツールで描画したり、フィルターを適用したりできるようになりました。以下は、ラスタライズしたレイヤーに網の目のようなフィルターを適用した様子です。ちなみにテキストレイヤーやシェイプレイヤーの状態で描画しようとすると、下のようなウィンドウが開き「ラスタライズしますか」という文章が表示されます。ここで「OK」を押すことでもラスタライズが可能です。気をつける点として、一度ラスタライズされたレイヤーはベクタデータに戻すことが難しくなります。なので、テキストやシェイプの形状などを編集する可能性がある場合は、元のベクターデータを複製して別レイヤーで残しておくなど、バックアップをとっておくことをおすすめします。田島悠介うまくラスタライズできたかな？大石ゆかりできました！これを使うとテキストやシェイプにもいろいろな加工ができるんですね。田島悠介このようにベクタデータからラスタデータにするのはとても簡単だけど、ラスタデータからベクタデータにするにはIllustratorや専用のツールが必要になるから注意しようね。大石ゆかりはい、分かりました。ありがとうございます！まとめ今回はPhotoshopでラスタライズする方法を初心者向けに解説しました。ラスタライズする目的は、ラスタデータのレイヤーでしかできない処理をベクタデータのレイヤーに行うことです。また、ラスタライズすることでファイルサイズを軽くすることにもつながります。注意点として、一度ラスタライズされたレイヤーをベクタデータに戻すことが難しいことも覚えておきましょう。本記事を参考にしてぜひチャレンジしてみてください。 Photoshopを学習中の方へこれで解説は終了です、お疲れさまでした。 Photoshopを調べたけど分かりづらい副業や転職後の「現場で使える」知識やスキルを身につけたい Photoshopの学習や情報収集をしていて、このように思ったことはありませんか？テックアカデミーのPhotoshop講座では、第一線で活躍する「プロのWebデザイナー」が教えているので、効率的に実践的なスキルを完全オンラインでしっかり習得できます。合格率10%の選考を通過した、選ばれたWebデザイナーのチャットサポートを受けながら、初心者でもフォトレタッチをマスターできます。

Photoshop

CSSのリンクの色を変えない方法を現役エンジニアが解説【初心者向け】

CSSのリンクの色を変えない方法について、テックアカデミーのメンター（現役エンジニア）が実際のコードを使用して初心者向けに解説します。目次1. k-meansとは？2. Numpyのインストール3. Pandasのインストール4. scikit-learnのインストール5. matplotlibのインストール6. 各ライブラリの使い方7. k-meansクラスタリングを出力してみよう8.まとめPythonを学習中の方へそもそもCSSの記述方法がわからない場合は、 CSSの書き方について解説した記事を読むとさらに理解が深まります。田島悠介今回は、CSSに関する内容だね！大石ゆかりどういう内容でしょうか？田島悠介 CSSのリンクの色を変えない方法について詳しく説明していくね！大石ゆかりお願いします！リンクの色とはリンクとは、今表示されているページ上で、他のページに移動できるURLが含まれた場所です。例えば1をクリックすると、https://techacademy.jp/magazine/category/webdesign/css　というページに移動します。 2をクリックすると、現在ご覧いただいているページである、https://techacademy.jp/magazine/21233　に移動します。リンクの色とは、3（以下の画像）のようにページ内の文字に対してリンクを指定する場合、文字色が黒色からリンクを表す色に変化した状態（画像では青色）で表示されることを意味します。リンクの色が変わってしまう原因未訪問のサイトと訪問済みのサイトでリンクの色が異なっていることや、マウスカーソルを当てた際、マウスクリックした際にリンクの色が変わることがあります。これらはaタグの:link, :visited, :hover, :active擬似クラスの設定が原因です。 :linkは未訪問のリンク、:visitedは訪問済みのリンク、:hoverはマウスカーソルが当たっているリンク、:activeはマウスクリック中のリンクを指します。 [PR] 未経験からWebエンジニアを目指す方法とはリンクの色が変わらないためにすること「aタグの色を指定して、各擬似クラスの設定は行わない」という方法と、「すべての擬似クラスで同じ色を指定する」という方法があります。「aタグの色を指定して、各擬似クラスの設定は行わない」場合には、以下のようにaタグで色指定するだけで良いです。 a { color: blue; } 「すべての擬似クラスで同じ色を指定する」場合には、:link, :visited, :hover, :active擬似クラスで同じ色を指定すれば良いです。 a:link, a:visited, a:hover, a:active { color: blue; } 基本動作を実際に書いてみようまずはデフォルト動作を見てみましょう。リンクの訪問や、マウスホバー、クリックでリンクの色が変わります。 ※CodePenでは、標準でマウスホバーやクリックで色が変わらないため、:hoverと:activeの設定をしています。 HTML <a href="https://techacademy.jp/programming" target="_blank" rel="noopener noreferrer"> <p>標準リンク(リンク訪問や、マウスホバー、クリックで色が変わる)</p> </a> CSS a:hover { color: red; } a:active { color: green; } CSS解説 1行目のa:hover {では、HTMLの aタグで囲まれた標準リンク(リンク訪問や、マウスホバー、クリックで色が変わる) 　という文字の上に、マウスカーソルを移動させた場合に、color: red;で色を赤色にするように指定しています。 4行目のa:active {では、HTMLの aタグで囲まれた標準リンク(リンク訪問や、マウスホバー、クリックで色が変わる) 　をクリックしたとき、color: green;で色を緑色にするように指定しています。 aタグのことをアンカータグといいます。実行結果 See the Pen link1 by マインクラフトゲームアプリプログラミング学校 (@programjp) on CodePen. 各擬似クラスの設定は行わない方法次に「aタグの色を指定して、各擬似クラスの設定は行わない」方法です。 no-color-changeクラスで色を一括指定しています。リンクの色が変わらないことを確認しましょう。 HTML <a

CSS

データベースに接続！PHPでMySQLを扱う方法【初心者向け】

PHPでMySQLを扱う方法について、テックアカデミーのメンター（現役エンジニア）が実際のコードを使用して初心者向けに解説します。開発作業をしていてプログラムを書くだけでなく、データベースを操作することも多々あります。 MySQLはデータベースの中でもトップクラスの認知度があり、使用する機会も多くあります。使い方を覚えておけば様々なシーンで役立つでしょう。目次1. k-meansとは？2. Numpyのインストール3. Pandasのインストール4. scikit-learnのインストール5. matplotlibのインストール6. 各ライブラリの使い方7. k-meansクラスタリングを出力してみよう8.まとめPythonを学習中の方へそもそもPHPについてよく分からないという方は、PHPとは何なのか解説した記事を読むとさらに理解が深まります。データベースとはデータベースとは、多くのデータを一元管理することができるデータ管理専門のソフトウェアです。データベースのようなソフトウェアをミドルウェアとも言います。ミドルウェアとは、表示処理などを行うWebアプリケーションとサーバ制御するOSとの間に存在するソフトウェアです。ミドルウェアがなくてもシステムとして動作可能ですが、ミドルウェアがあることで大規模システム開発を効率的に行うことが可能です。データベースのメリットデータベースを利用するメリットは大きく3つあります。安全にデータをバックアップできるデータベースソフトウェアの機能を活用できるセキュリティを強化できるデータベースをバックアップするデータベースをミドルウェアとして利用することで、システム内の必要なコンテンツであるデータは、すべてデータベースの中に保存可能です。データベースにコンテンツを保存できるということは、データベースさえバックアップしておけば、システムが破損してもコンテンツの復元が可能だということです。データベースにデータを保存しておくとはつまり、決まった形式でデータを安全に保管できるということでもあります。データベースソフトウェアの機能を活用できるデータベースソフトウェアを利用することで、高速にデータを扱うことが可能になります。データを扱う例としては、データの検索などがあります。データ自体が膨大な量になった時に、データベースソフトウェアの検索速度が高速であれば、それだけで快適に動作します。セキュリティに強くなるデータベースソフトウェアを利用しない場合、データを安全に保管することが難しくなります。例えば、データにアクセスする際にパスワードが設定されていなかったり、複数人で同時にアクセスすることでデータが破損することもあります。データベースを利用することで、セキュリティに強くなるメリットがあります。データベースのデメリットデータベースソフトウェアを利用するということは、データベースに関する知識が必要になります。もし、1ページのみのHTMLで構成される自己紹介ページなどであれば、データベースを利用せずHTML内にコンテンツとなるデータを記載したほうが、サイト公開も保守管理も簡単で良いでしょう。データベースの種類データベースの種類には大きく4つあります。 RDBMS NoSQL 階層型ネットワーク型 RDBMS RDBMSとは、Relational DataBase Management Systemの略です。日本語でいうと関係型データベースと言われることもあります。エンジニアはRDBMSということが多いです。データ構造自体は、表計算ソフトのExcelのような感じで管理されます。データの整合性に強く、管理しやすいため、Webアプリケーション開発時にはRDBMSを利用することが多いです。製品例：OracleDatabase、SQLserver、MySQL 、PostgreSQL NoSQL NoSQLとは、大規模なデータを扱う際に利用します。キーバリュー型、カラム指向型、ドキュメント指向型、グラフ型など、様々な種類があります。データの整合性より、データ処理能力に焦点を当てたGoogle検索などのシステムで利用されます。製品例：Hadoop、Google File System、Firebase（Cloud Firestore、RealtimeDatabase）階層型階層型データベースはアクセス速度が速いメリットがあります。しかし、データの重複が発生するというデメリットがあります。データの柔軟な取り扱いが難しく、高度な知識が必要なため、一般的に利用されることは少ないです。ネットワーク型ネットワーク型データベースは、データの重複を避けられるというメリットがあります。データの柔軟な取り扱いが難しく、高度な知識が必要なため、一般的に利用されることは少ないです。 MySQLとは中身のソースコードが公開されているリレーショナルデータベースで、オープンソース系としては世界的に最も多く使用されています。表計算ソフトであるExcelなどのような感じで、データを表示してくれます。ほとんどのレンタルサーバで使用でき、データを安全かつ高速に検索し、変更の一貫性を保つことができます。大石ゆかり田島メンター！MySQLって何でしょうか？田島悠介データを安全に、そして大量のデータも高速に検索できるソフトウェアなんだ。PHPから接続できるんだよ。大石ゆかり PHPで接続して、データを取得したり、変更したりできるってことですか？田島悠介そうだね。まずはMySQLでできることを見てみよう！ [PR] 未経験からWebエンジニアを目指す方法とはMySQLでできること MySQLなどのリレーショナルデータベースでできることは、主に以下の通りです。データの変更の一貫性を保つトランザクション例えばあるブログで、新規記事を投稿し、その記事が属するカテゴリーの個数を1つ増やしたとします。これらの処理は分離できない処理で、どちらか一方だけ実行されても困ってしまいます。複数の処理を切り離せない処理として実行する、さもなくば複数の処理すべて失敗とみなして実行しない、ということができます。インデックスによる高速な検索コンピュータでもデータ数が多いと検索が遅くなってしまいます。しかしインデックスを用いてデータを整理整頓しておくと、何千万件の中からでも一瞬で目的のデータを検索できます。インデックスは、漫画・コミックなどでいえば巻数順に並べておくようなもので、並べておけば素早く手に取ることができます。条件を指定してデータを検索価格の高い順や低い順などを10件ずつ、といったようにデータに条件を指定して、柔軟に検索できます。 mysql_connectの書き方 mysql_connectはデータベースに接続するために使用します。接続リソース mysql_connect("接続先サーバー","ユーザーネーム","パスワード"); MySQLが置いてあるサーバに対して接続します。 MySQLに設定されたユーザーネームとパスワードで接続します。接続リソースが返ってきますが、その後にMySQLに操作を加える場合にこの接続リソースを使います。 mysql_create_dbの書き方 mysql_create_dbは、データベースを作成する際に使用します。また、mysql_queryでも作成できます。 mysql_query("CREATE DATABASE データベース名 DEFAULT CHARACTER SET utf8"); mysql_create_db("データベース名"); mysql_queryの書き方 MySQLに接続すると、SQL文を発行できます。その時にmysql_queryを使用します。データ追加や検索、その他ヘッダ情報などを取得できます。 mysql_query("SQL文"); 大石ゆかりインデックスやトランザクションって何かすごそうですね！田島悠介データが数億件あっても、一瞬で目的のデータを検索できるんだよ。大石ゆかりそれは、すごいですね！実際に書いてみよう MySQLに接続してデータベースを作成し、データベースの一覧を表示させてみます。 XAMPPとMariaDBで実行していますが、MySQLと互換性が高いのでそのまま使用できます。 test.php <?php $link = mysql_connect("localhost","root",""); mysql_query("create database if not exists test2 default character set utf8"); $result = mysql_query("show databases"); while ($row = mysql_fetch_array($result, MYSQL_NUM)) { echo $row[0]; echo "<br>"; } ?> 実行結果 information_schema mysql performance_schema phpmyadmin test2 wordpress show databasesというのはMySQL専用のクエリで、データベース一覧を表示させます。 mysql_fetch_arrayに結果リソースを渡し、数字配列を選択します。 1行ずつ出力すると、作成されているデータベース一覧が表示されます。 MySQLに接続し、クエリを発行し、結果を受け取るというのが基本操作です。 PHPとMySQLを使用しチャット投稿を表示させてみるそれでは、PHPとMySQLを使用して、チャットサービスの投稿を表示させてみます。チャットサービスとはTwitterやLINEなどのサービスです。チャットサービス表示部分の実装今回は、MySQLにchatデータベースとtitleテーブルが存在すると仮定して実装してみます。テーブル情報 titleテーブルの中には、自動的に連番が追加されるnoカラム、ユーザー名を表すnameカラムと、投稿内容を表すpostカラムが入っています。 PHP処理の説明それでは、それぞれの行について説明します。 MySQLへの接続情報最初に変数dbに対して、MySQLに接続するための情報を格納しています。今回は、mysqli_connectというPHPの関数を使用してMySQLに接続しています。 mysqli_connectの（）内に記載されているパラメータは次のとおりです。 mysqli_connect( '接続ホスト名', '接続ユーザー名', '接続パスワード名', '接続データベース名' ); 接続エラー処理その後、次のif文処理でmysqliに接続できなかった場合にエラーを出力する処理をしています。 if ($db->connect_error) {

PHP

日本政府の衛星データプラットフォーム「Tellus（テルース）」とは【インタビュー】

経済産業省からの委託事業として衛星データプラットフォーム「Tellus（テルース）」を開発・運用するさくらインターネット株式会社の竹林正豊さん（写真左）と田中康平さん（写真右）にインタビューしました。 Tellusとは何か、衛星データとは何か、衛星データの市場規模とTellusの特徴、そして学習方法と今後の展望まで伺いました。お話を伺った人竹林正豊氏さくらインターネット株式会社　新規事業部所属。 Tellus xData ALLIANCE Project/PublicRelation Group Producer 2006年大阪芸術大学芸術学部建築学科修了。慶應義塾大学大学院システムデザイン・マネジメント研究科在学中。ファッション雑誌編集者、広告クリエイティブエイジェンシーを経て2017年さくらインターネット入社。2018年6月より現職。同社では、クリエイティブディレクション、企画の知見を活かし、広報や広告宣伝、外部イベント、トレーニング、データコンテスト、オウンドメディアなどのプロジェクトを統括。田中康平氏さくらインターネット株式会社　新規事業部所属。 Tellus xData ALLIANCE Project/Business Development Group 超小型衛星の開発や衛星搭載電源の研究/開発に従事した後、2019年2月より現職。同社では衛星開発の知見を活かした衛星データの利活用事例検討やビジネス開発を担当。また、宇宙ビジネスメディア「宙畑-sorabatake-」にて企画・編集を担当。 Tellusとは ――最初に、Tellusがどういうものかについてお話いただければと思います。 Tellusとは政府衛星データを利用した新たなビジネスマーケットプレイスを創出することを目的とした、日本発のオープン＆フリーな衛星データプラットフォームです。さくらインターネットが経済産業省から3年間の受託開発と運用を一任されているプロジェクトで、「宇宙産業ビジョン2030」という国の方針に紐づく形で衛星データのオープンデータ化を行っています。 ――衛星データとはどのようなもので、どのようなことができるのでしょうか？前提として、衛星データというと何か難しいもののように思われるのですが、特殊なデータとして見るのではなく、ビッグデータの1つと考えるとよいでしょう。定期的に上空から地上の様子を撮影しているのが、衛星データです。言い換えれば、上空から撮影している画像、と捉えると良いでしょう。なので、プログラミングで画像処理できる人であれば、誰でも解析が可能です。例えば、国立競技場を定期的に撮影すれば、建設の進捗状況を見ることができますし、空港を見れば、航空機が駐機場に何機いるか数えることもできます。他の画像と少し異なる点があるとすれば、単なる画像ではあるものの、波長帯（バンド）ごとの画像がある、というところでしょうか。詳細は省きますが、波長帯ごとの画像を見ることで、対象物の状態を捉えることができるようになります。例えば、ある田んぼを定期的に撮影すれば、稲の育成状況を知ることができますし、地表面で温度が高いところを知ることもできます。 Tellusの場合、これらのデータは統合開発環境でPythonやR言語を駆使して解析できます。そのため、ただ見るだけではなく、解析により田んぼの育成状況を知ったり、収穫時期を予測したりもできます。 credit：JAXA キャプション：衛星で撮影した田んぼ(左)とその活性度を示す指標を解析で求めた結果(右) ――他のデータと比べて、エンジニアから見ると面白い点はありますか。ある意味タイムマシンのようなもので、通常のデータでは測定しにくい変化を捉えられるのが面白いところだと思います。 IoTデバイスでずっと同じ点を観測し続ければ、高頻度に高精度なデータを取得できますが、「設置したとき」からの「設置した場所」のデータしか取得できません。衛星データは面的に世界中を定期的に観測しているので、観測分解能は粗かったとしても蓄積された世界中のデータを確認できます。点として観測している場合には、類推することが難しい問題も、面として観測していれば解決できることもあります。そのため、本質的な変化をより観察しやすいと思います。よく事例として取り上げられているのが森林破壊の問題についてです。インドや中国は経済成長の影響から森林が凄く減っているイメージがありますが、実は森林の面積は増えているそうです。点として、例えば木材の輸出量や林野火災で失われた面積についてのみ見ていたら分からなかったであろうことも、面として見ることで定量的に評価できるようになるのです。衛星データを駆使して面で捉えたからこそ、森林が増えている事実に気付くことができた事例です。他には、何かしらを解析するアプリケーションを作成した場合、日本のみならず、世界中をターゲットにできる点も面白いかと思います。つまりは、日本の田んぼの育成状況を把握するアプリケーションを開発した場合、衛星データ自体は国内外問わず撮影されているため、海外の田んぼの育成状況を解析するソリューションとしてそのまま展開していくこともできる可能性があるのです。そのため、開発したアプリケーションの潜在的な市場が広いということも面白い点と言えるでしょう。 [PR] 未経験からWebエンジニアを目指す方法とは衛星データプラットフォーム市場におけるTellusの特徴 ――衛星データ市場の現状を教えてください。これまで宇宙開発は国主導が多かったのですが、最近では民間の衛星サービスが各国で始まっています。 2010年代には宇宙系のスタートアップ企業も多く出てきてたくさんの衛星が打ち上がりました。今では1社で百何十基の衛星を運用している企業もあり、気軽に衛星が上がるようになっています。それに伴い性能も高まっています。具体的には、撮影する画像の質が上がり始めています。高分解能の画像も撮れるようになったことで、例えば人影が見えたり、自動車のフロントガラスが撮影できたりします。この動きの中で、衛星画像の利用促進施策が、アメリカやヨーロッパや中国などにおいて国主導で進んでいます。衛星データビジネスは世界でも成功事例がまだ多くないため、私たちも手探りの中進んでいます。 ――世界的に見て未開拓な分野なので日本でも市場を延ばす余地があるということでしょうか。その期待値は上がっている状態です。世界を見ると、AmazonやSpaceXなどの企業も次に来るのは宇宙ビジネスだと信じて投資をしています。また、日本でも、2019年には、100億円規模の出資を受けた会社が3社あります。一方で、その注目度と投資額に反して、日本では宇宙ベンチャー企業は少ない現状もあります。日本には70社弱しかなく、そこに100社弱のVCから計500億円程が投資されています。ビジネス活用を促進してさらに宇宙ベンチャー企業を増やすことで、これをバブルにせず継続的な成長ができるよう支援していくつもりです。 ――様々な海外の衛星データが存在する中で、Tellusの独自性はどこでしょうか。クラウド完結型であること、それから地上データを扱える点です。今までの衛星データは、知識がないとどこのサーバに何のデータがあるのか分からない状態でした。またデータサイズが大きく、衛星データを1枚ダウンロードするのに30分から1時間かかりました。このような利用の煩雑さを解決すべく、Tellusは全てクラウド上で完結できるようにしています。クラウド上にデータが揃っていて、クラウド上で解析できる環境を作っているのです。これにより、強いネットワーク環境を持っていない方、高度なマシンスペックを持っていない人でも気軽に衛星データを解析できるようになります。また、Tellus内で地上データを扱えるようにし、少しでも衛星データが活用しやすい状態も作ろうとしています。その他の衛星データプラットフォームは衛星データだけを置いている場合が多いのですが、衛星データだけだと解析結果が正しいかどうか妥当性を検証しにくい点が課題です。 Tellusでは、点の地上データと面の衛星データを同じ場所に置いてあることで、活用の幅を広げていくことを試みています。 ――なぜ地上データの掛け合わせを行うことになったのでしょうか。ビジネス活用による民需の増加がTellusのゴールにあるためです。従来通りの学術利用目的の政府案件だったら、色々な場所に散らばっている衛星データをまとめて使えるプラットフォームを作るフェーズで終わりでした。ただ今回が経済産業省からの案件で、ゴールが多くの人から利用してもらい宇宙産業を発展させることだと考えると、衛星データだけでは得意不得意があるので工夫が必要と考えました。例えば、衛星データには広範囲を撮れる長所はありますが、一方で分解能が粗い短所があります。それを補完できる地上データがあると、衛星データをさらに幅広く使えるようになります。逆も然りで、ある点の情報から、他の点の情報を類推するのに衛星データを利用できます。解析結果と地上データを比較しやすい環境であれば、その妥当性をすぐに検証できるのです。地上データと衛星データを掛け合わせお互いの不得意を補い、ビジネス利用しやすくなることがゴールです。 Tellusの活用事例 ――実際に、Tellusを活用した解析の事例はありますか。オウンドメディアである宙畑を通して、おいしいみかん畑を探してみる、電動自転車が売れる場所の推測、テニスコートの素材、桜の開花時期の予測などを行いました。他には、海釣りで魚が釣れそうな場所の予測も行いました。魚のいる場所はある程度水温や潮目から推測でき、衛星データでそれらが分かるため、場所を割り当てて実際に釣りに行き、その結果、魚がたくさん釣れた事例もあります。これらの様子となぜ釣れたかの考察をオウンドメディアの「宙畑-sorabatake-」で公開しています。メディアで紹介した事例を元に、実践してみたり、アイデアを練ったりして、新たな事例を生み出していってほしいですね。宙畑-sorabatake-『衛星データで漁場を探して、実際に釣りに行ってみようvol.1 ~データ確認編~』の画像衛星データ全体に目を向けると、土砂崩れの検出、船の検出、海氷の検出などを行うアプリケーションが世の中には出始めていています。オイルタンクの貯蔵量から石油の残量を推測して、石油価格を予測する使い方もされています。石油タンクは落し蓋に似た形状になっていて、タンク中の石油残量に応じて蓋の位置が変わります。そうすると、影の高さが変化するため、影の面積から石油の残量を推定できるのです。様々な方が宇宙市場に入っていくことで、このような事例がどんどん出てくることを期待しています。石油タンク監視 Credit : Ursa Space Systems ――Tellusを扱うにはプログラミングの学習は必須なのでしょうか。必須ではないですし、プログラミングを習得していない人でも使いやすい状態を目指しています。 Tellusはインターフェースを2種類提供しており、プログラミングができる人向けの統合開発環境と、プログラミング不要でボタンを押しながら解析できる環境（GUI）があります。 GUIのインターフェースを用意している意図は、プログラミングができない人にも衛星データに興味を持っていただけたらと考えているためです。そして、そのような人が衛星データへの興味を深め、より幅広い活用のためにプログラミングを学習し、ビジネスシーンで活用してくれることが理想です。ただ、プログラミングができる方が、データを扱う上での選択肢は増えますので、より楽しめるとも思っています。そのための施策も合わせて提供していきたいと考えています。 Tellusの学習について ――Tellusを通じた人材育成についてお聞かせください。私たちは衛星データを提供して終わりにするのではなく、ユーザー育成を積極的に行なっています。衛星データとプログラミング共に未経験の人達も、衛星データを使ったビジネスをするステップまで引き上げていきたいと考えています。ユーザーの中には、「Pythonは習得しており、興味もあるが衛星データで何ができるのか分からない」方が多いため、相談会や講習を行っています。 2018年度まではハンズオンのみで講習を提供していましたが、応募された方が1,000名以上と想定より非常に多く、受講できる方が限られてしまいました。そこで、全国誰でも参加できるように2019年度から取り組み始めたのがeラーニングです。また、これまでの学習ターゲットは「衛星データは知らなくても一定Pythonが触れる人」でした。ただ、「Pythonが触れなくても衛星データに興味がある人」も非常に多く、そういった人々に学習の機会を提供すれば衛星データを用いてビジネス活用する人が増えるのではないかという仮説を立て、今回TechAcademyと共同でPythonの学習を行う初心者向けのコンテンツを作りました。 ――eラーニングの施策は現状いかがでしょうか。 SNSを見ていても「良かった」と言ってくださる方が多いので、凄くいい施策だったと思います。 TechAcademyとの施策で言えば、学習者の熱量が高く、質問が想定より多い印象です。初心者向けなので、メンターの存在が重要というのは元々の仮説としてありましたが、実証された形ですね。また、最初はSNSで細々と宣伝しただけだったため、人数が集まらないことを懸念していましたが、フタを開けてみると200人の枠に400人を超えるエントリーがありました。これにより、普段たちが接していない方々にもニーズがあったことに気がつけました。 ――どのような方がエントリーされていますか。今回は初心者向けと銘打ったこともあり、開発経験が1年未満だったりプログラミング未経験の方が大多数でした。また申し込みの際に、400字以内で応募の動機を書く箇所がありましたが、熱意の強い方が多い印象でした。別軸でいうと、中高生、新規事業をしていて最近流行り始めたから知りたい方、他には解決したい明確な課題を持って申し込まれた方が多い印象でした。このような幅広い層の方々が利用することで、衛星データの利活用に関する多くの経験が蓄積し、利用事例に繋がることを期待しています。今回はとてもバランスよく申し込んでいただけたので、今後はさらに幅広い層の方に申し込みしていただければいいなと思っています。そして今後、受講された方々がTellusを使ってみた結果を公開していく流れができるとさらに嬉しいですね。 ――Pythonを習得しているエンジニアがTellusを使うときには、具体的にどういう学習が必要になりますか。 APIの叩き方や、衛星画像特有の前処理があるので、その辺りの知識がある程度必要になります。そのため今回の初心者向けTellus学習コースでも、画像処理の基礎を習得できる構成にしています。普通のカメラはRGB全部まとめて出力されるのですが、衛星はRごと、Gごと、Bごと、と波長毎にスキャンして撮影するので、それぞれの波長を組み合わせながら処理していき、物理的に意味がある値として解析する、ということができるように学習するといいと思います。また、単なる画像として扱い、画像解析した結果から何かを読み取るというのも良いでしょう。近年の流行りとしては、物理的な意味を捉えながら解析するというよりは、機械学習等を用いて画像解析した結果から状態を推測する、という方が中心になっているかもしれません。 Tellusの今後の展望 ――今後、利用者を増やす時に、Pythonやプログラミングが分かるエンジニアの方、ビジネスは分かるけれどもプログラミングは分からない方と大きく分けて2通りの方がいると思われますが、それぞれに動いてほしいイメージはありますか。個人的な思いとしては、まずエンジニアの方々にはTellusを触ってもらいたいです。膨大な観測データが日々蓄積されており、国内外問わず衛星データを用いたコンペティションが開催されている結果データセットも増えており、エンジニアの方々が触って面白いデータが揃ってきている状況だと思っています。それらのデータを触った結果、事例が増え、その中のいくつかがビジネスの種になるといいなと考えています。様々な事例をビジネスパーソンが見たときに、自身の事業と関連のあるものを見つける方もいるでしょうし、ビジネス化の筋道を立てられる技術を見つける方もいるかもしれません。そのためにも、事例を蓄積していくことが重要だと思っています。もちろん、エンジニアとビジネスパーソンの方が同一人物であること、もしくは同じチームにいることが理想的ではありますが。ビジネスパーソンには、宇宙ビジネスに関心を持ち、ビジネス視点から事例創出をしていただけたら嬉しいですね。そのために、オウンドメディアの「宙畑」では、エンジニア向け記事だけでなく、宇宙ビジネスのニュースも提供することでビジネスパーソンにも見ていただけるようにしています。ただ、宇宙ビジネスにはまだこうやったら成功する、という王道がありません。そのため、誰でもアイデア次第では大きく市場を取ることができる可能性があります。アイデアを思いつくにはエンジニアもビジネスパーソンも関係ないので、自分はエンジニアだからここまでしか、とかビジネスパーソンだから技術は…とか考えず、アイデアを考えることが始めの一歩かもしれません。 ――Tellus利用者にこれからどういう使い方をしてもらいたいでしょうか。 2020年度末までは基本的にデータもコンピューティングリソースも無料で貸出ししているので、まずは触ってみて欲しいと思っています。そして、どんなことでもいいので、気になったことを少し見てみて欲しいです。例えば、教科書で学んだこと、テレビで見たこと、日常的に気になっていることなどを、Tellusを利用して自分の目で本当にそうかな？と確かめて欲しいです。より具体的に言えば、地球温暖化に疑問を持ち、本当に起きているのかを気温情報や環境情報を用いて解析してみたり、自分の町がどう年々変わっているのか見てみたり、どんなことでもいいので、それこそまずは遊んでみるような感覚でTellusを触ってみて欲しいと思っています。気になったことを鵜呑みにするのではなく、自らデータで解析してみよう、という人が増えてくるといいですね。そうすることで、遠い存在と思われがちな衛星データが身近になり、課題解決の1つの選択肢として衛星データがあるという考えを持つ人が増えていき、結果として衛星データの利活用が浸透していくといいなと思っています。（インタビュー/編集：テックアカデミー田中翔）テックアカデミーでは、未経験でもアプリやWebサイトを作れるオンラインブートキャンプを開催しています。すべての講師が、第一線で活躍する選抜された現役エンジニアなので、上達の速さ、学習の質が圧倒的に違います。実際に現役エンジニアから学べる無料体験を実施しているので、ぜひ違いを味わってみてください。忙しくて時間がない方は、15分でわかる説明動画をまず見てみましょう。

インタビュー

PHPでフォームからデータを受け取る方法（GETとPOST）

プログラミング初心者向けに、PHPの基礎を紹介する記事です。今回は、フォームからデータを受け取る方法について解説します。最初にフォームの送信方法とPHPでの受け取り方に関しての説明をします。その後、実際に動くコードを作成してデータの送受信を試していきます。フォームでのデータのやりとりはWebサイトなどでは基本なので、ぜひ覚えておきましょう。目次 GETとPOSTとは HTMLのフォーム送信されるデータフォームデータの受け取り方受信データのバリデーション実際にコードを書いてみよう開発環境はXAMPPを使っています。 GETとPOSTとは PHPにおけるデータの受け取り方には、GETリクエストと POSTリクエストを使う2通りの方法があります。 POSTリクエストはフォームからHTTP通信により送信され、送信データはリクエストの本体に含まれます。 GETリクエストはフォームやリンクからHTTP通信により同じように送信されますが、送信データはURLの最後に？に続いて　パラメータ名=値という形式で付加されます。大石ゆかりフォームを使ってデータを送信できるんですね。田島悠介そうなんだ。フォームから送ったデータを、PHPで取得できるんだよ。大石ゆかりいろいろなところで使われてそうですね。田島悠介そうだね。後、フォームじゃないんだけどURLの最後に?p=2とか/p2/もGETでデータを送ってることになるんだ。多くは何ページ目とかに使われるね。HTMLでフォームを作って送信してみよう！ [PR] 未経験からWebエンジニアを目指す方法とはHTMLのフォームサーバにデータを送信するためには、HTMLのフォームを使います。 GETリクエストのフォームフォームの構造は次のようなコードです。 <form action = “index.php” method = “GET”> <input type = “text” name =“comment/“><br/> <input type = “submit” value =“送信/“> </form> formタグのaction属性に送信先のURLを指定します。送信方法はデフォルトでGETリクエストですが、method属性で POSTかGETに指定できます。 formタグ内の inputタグの値が送信するデータです。この時、name属性がリクエストパラメータ名になり、value属性の値やテキストボックスに入力された値がそのパラメータの値です。上のコードでは、フォームのデータは、commentというパラメータ名で入力値とのペアで送られ、送信方法はGETリクエストになり、送り先は index.php です。 POSTリクエストのフォーム POSTリクエストにしたい場合は、次のようにform要素のmethod属性をPOSTに変更するだけです。 <form action = “index.php” method = “POST”> <input type = “text” name =“comment/“><br/> <input type = “submit” value =“送信/“> </form> 送信されるデータここでは、例としてcommentという名前属性のinput要素に hogehogeという文字を入力して送信するとしましょう。 GETリクエストのデータデータがURLの一部として含まれてサーバに送られます。送信先は index.phpとすると、URL全体は次のようになります。 http://index.php?comment=hogehoge ここで注目していただきたいのは、後に付けた?comment=hogehogeの部分です。 GETリクエストのデータは基本的には、 ? の後にパラメータ名=値のペアの形式で送られます。複数のデータの場合は、間を & でつなげます。 http://index.php?comment=hogehoge&title=hello このURLで送られるのは、 comment=hogehogeとtitle=helloという２つのデータ（パラメータ名=値のペア）です。フォームデータの受け取り方 GETリクエストで送信したデータを受け取る GETリクエストで送信したデータは、グローバル変数である $_GET に連想配列という形で入っています。そこで、PHPでデータを受け取るときは、この　$_GET を使います。先ほどの例では、comment=hogehogeというデータが送られましたが、$_GETには、[‘comment’ => ‘hogehoge’] という連想配列で保存されます。 $_GETからデータを受け取るには、受け取りたいinput要素の name属性

PHP

記事を検索

ニュース

インタビュー

テクノロジー

キャリア

お問い合わせ

Pythonによるk-meansクラスタリングの実装方法を現役エンジニアが解説【初心者向け】

監修してくれたメンター

平野勝靖

目次

1. k-meansとは？

2. Numpyのインストール

3. Pandasのインストール

4. scikit-learnのインストール

5. matplotlibのインストール

6. 各ライブラリの使い方

データの読み込み

前処理

クラスタリング

結果を出力

7. k-meansクラスタリングを出力してみよう

7-1. データに異常値が存在する場合

7-2. クラスタ数が適切ではない場合

7-3. k-meansによるクラスタリングが適していない場合

7-3.1.クラスタが球形でない場合

7-3.2.クラスタ間のデータのばらつきが等しくない場合

8.まとめ

Pythonを学習中の方へ

関連するキーワード

あわせてよく読まれている記事

データ分析のライブラリ！Pandasとは【初心者向け】｜現役エンジニアが解説

Photoshopでラスタライズする方法【初心者向け】

CSSのリンクの色を変えない方法を現役エンジニアが解説【初心者向け】

データベースに接続！PHPでMySQLを扱う方法【初心者向け】

日本政府の衛星データプラットフォーム「Tellus（テルース）」とは【インタビュー】

PHPでフォームからデータを受け取る方法（GETとPOST）

TechAcademyから
現役エンジニアの方へ
お知らせ

記事を検索

ニュース

インタビュー

テクノロジー

キャリア

お問い合わせ

監修してくれたメンター

平野 勝靖

目次

1. k-meansとは？

2. Numpyのインストール

3. Pandasのインストール

4. scikit-learnのインストール

5. matplotlibのインストール

6. 各ライブラリの使い方

データの読み込み

前処理

クラスタリング

結果を出力

7. k-meansクラスタリングを出力してみよう

7-1. データに異常値が存在する場合

7-2. クラスタ数が適切ではない場合

7-3. k-meansによるクラスタリングが適していない場合

7-3.1.クラスタが球形でない場合

7-3.2.クラスタ間のデータのばらつきが等しくない場合

8.まとめ

Pythonを学習中の方へ

記事を検索

関連するキーワード

関連する記事

あわせてよく読まれている記事

TechAcademyから 現役エンジニアの方へ お知らせ

平野勝靖

TechAcademyから
現役エンジニアの方へ
お知らせ