Pythonで画像の座標を取得する方法を現役エンジニアが解説【初心者向け】
初心者向けにPythonで画像の座標を取得する方法について現役エンジニアが解説しています。PythonでOpenCVを使って画像のRGB値の範囲を取得したり、マウスクリックした場所の座標や位置を取得する方法を説明します。OpenCVのインストール方法や使い方について確認しましょう。
テックアカデミーマガジンは受講者数No.1のプログラミングスクール「テックアカデミー」が運営。初心者向けにプロが解説した記事を公開中。現役エンジニアの方はこちらをご覧ください。 ※ アンケートモニター提供元:GMOリサーチ株式会社 調査期間:2021年8月12日~8月16日 調査対象:2020年8月以降にプログラミングスクールを受講した18~80歳の男女1,000名 調査手法:インターネット調査
監修してくれたメンター
清水 源一郎
テックアカデミーでは、Pythonコース、AIコース、データサイエンスコースを担当。
Pythonで画像の座標を取得する方法について、テックアカデミーのメンター(現役エンジニア)が実際のコードを使用して初心者向けに解説します。
OpenCVという画像を扱うためのライブラリを使用します。
目次
そもそもPythonについてよく分からないという方は、Pythonとは何なのか解説した記事を読むとさらに理解が深まります。
今回は、Pythonに関する内容だね!
どういう内容でしょうか?
Pythonで画像の座標を取得する方法について詳しく説明していくね!
お願いします!
OpenCVとは
OpenCVとは、画像処理・画像解析のために開発されたオープンソースのライブラリで、Python、C++など様々な言語で利用できます。
OpenCVを使うことでエッジや輪郭の抽出、物体検出などの画像処理をPythonで簡単に行えます。
OpenCVを利用する前にインストールする必要があります。
例えば、下記のようなコマンドでインストールしてから使ってみてください。
pip install opencv-python
OpenCVでマウスクリックした場所の座標を取得する方法
それでは、OpenCVを使って画像の特定の場所の座標を取得する方法を説明します。
以下の2つの機能を順番に使います。
- OpenCVを使って画像を表示する
- OpenCVで表示した画像のクリックされた座標を取得する
1. OpenCVを使って画像を表示する
最初に、OpenCVで画像をGUI表示する方法を紹介します。
OpenCVは、下記のようにインポートして使います。
処理の際は、imread()によって画像を読み込みます。
import cv2
img = cv2.imread('読み込みたい画像のパス')
読み込んだ画像は、下記のようにimshow()を使うことで、別ウィンドウに表示できます。
指定した名前の別ウィンドウが開き、画像が表示されます。
OpenCVで画像を表示する際は、waitKey()でキー入力を待つようにします。
待ち時間には0を指定することで、入力されるまで無制限で待ち続けることができます。
下記のコードで画像を表示し、何かキーを押すと閉じるという処理が記述できます。
cv2.imshow('ウィンドウ名', img)
cv2.waitKey(待ち時間)
2. OpenCVで表示した画像のクリックされた座標を取得する
次に、別ウィンドウで表示した画像をクリックして、クリックされた位置の座標を取得します。
OpenCVではコールバック関数を使うことで、ホイール操作、ダブルクリックなどimshowのウィンドウ上での動作に対する処理を記述できます。
例えば、マウスを左クリックしたときの座標を表示するなら、以下のようなコールバック関数を書くことができます。
def onMouse(event, x, y, flags, params):
if event == cv2.EVENT_LBUTTONDOWN:
print(x, y)
コールバック関数は呼び出されたときに、引数でコールバックイベントの種類、イベント発生時のx座標、y座標を取得できます。
x, yにはクリックされた位置のx座標, y座標が自動で入ります。
左クリックでは、cv2.EVENT_LBUTTONDOWN
というイベントが発生するため、上記の関数で左クリックされた際に座標を表示できます。
上で定義したコールバック関数を表示する画像のウィンドウに設定するためには、cv2.setMouseCallback()を使います。
第1引数には画像をマウス操作の処理を実行するウィンドウ名、第2引数には実行するコールバック関数を指定します。
cv2.setMouseCallback('ウィンドウ名', コールバック関数)
実際に書いてみよう
以上の内容を踏まえて、マウスをクリックした場所の座標を取得するサンプルコードを書いてみます。
例として下の画像を使いますので、sample.pngという名前で保存してください。
以下のサンプルコードを、画像と同じディレクトリに保存して実行してください。
import cv2
def onMouse(event, x, y, flags, params):
if event == cv2.EVENT_LBUTTONDOWN:
print(x, y)
img = cv2.imread('sample.png')
cv2.imshow('sample', img)
cv2.setMouseCallback('sample', onMouse)
cv2.waitKey(0)
サンプルコードを実行すると保存した画像が別ウィンドウで表示されるので、画像上のどこかをクリックするとクリックした場所の座標が表示されます。
まとめ
今回は、OpenCVでマウスをクリックしたときの座標の取得方法について紹介しました。
OpenCVは画像処理に特化したライブラリですが、独自でGUI操作をするためのメソッドも用意されているため、手作業で画像処理を行うときに今回紹介した手法が応用できると思います。
OpenCVの可能性を感じていただけると幸いです!
内容が分かりやすくて良かったです!
ゆかりちゃんも分からないことがあったら質問してね!
分かりました。ありがとうございます!
Pythonを学習中の方へ
これで解説は終了です、お疲れさまでした。
- つまずかず「効率的に」学びたい
- 副業や転職後の「現場で使える」知識やスキルを身につけたい
プログラミングを学習していて、このように思ったことはありませんか?
テックアカデミーのPythonコースでは、第一線で活躍する「プロのエンジニア」が教えているので、効率的に実践的なスキルを完全オンラインでしっかり習得できます。
合格率10%の選考を通過した、選ばれたエンジニアの手厚いサポートを受けながら、人工知能(AI)や機械学習の基礎を学べます。
まずは一度、無料体験で学習の悩みや今後のキャリアについて話してみて、「現役エンジニアから教わること」を実感してみてください。
時間がない方、深く知ってから体験してみたい方は、今スグ見られる説明動画から先に視聴することをおすすめします!