icon
icon

Pythonでハッシュ値を計算する方法を現役エンジニアが解説【初心者向け】

初心者向けにPythonでハッシュ値を計算する方法について現役エンジニアが解説しています。ハッシュ値とは任意のデータから固定の長さの値を生み出す仕組みのことで、通信の暗号化や文章の改ざん防止に使われています。Pythonでハッシュ値を計算するにはhashlibを使います。

テックアカデミーマガジンは受講者数No.1のプログラミングスクール「テックアカデミー」が運営。初心者向けにプロが解説した記事を公開中。現役エンジニアの方はこちらをご覧ください。 ※ アンケートモニター提供元:GMOリサーチ株式会社 調査期間:2021年8月12日~8月16日  調査対象:2020年8月以降にプログラミングスクールを受講した18~80歳の男女1,000名  調査手法:インターネット調査

Pythonでハッシュ値を計算する方法について、TechAcademyのメンター(現役エンジニア)が実際のコードを使用して、初心者向けに解説します。

 

Pythonについてそもそもよく分からないという方は、Pythonとは何なのか解説した記事を読むとさらに理解が深まります。

 

なお本記事は、TechAcademyのオンラインブートキャンプ、Python講座の内容をもとに紹介しています。

 

田島悠介

今回は、Pythonに関する内容だね!

大石ゆかり

どういう内容でしょうか?

田島悠介

Pythonでハッシュ値を計算する方法について詳しく説明していくね!

大石ゆかり

お願いします!

 

目次

  1. ハッシュとは
  2. ハッシュ値を計算する方法
  3. 実際に書いてみよう
  4. まとめ

 

ハッシュとは

ハッシュとは任意のデータから「固定の長さの値」を生み出す仕組みです。通信の暗号化や文章の改ざん防止など、現代のIT技術の根幹をなす技術として幅広く使用されています。

「固定の長さの値」のことを「ハッシュ値」と呼びます。ハッシュはデータごとにほぼ重複しないハッシュ値を生成できるという重要な特徴があります。もとのデータの長さによらず固定の長さのハッシュ値を生成できるため、データの検索や比較の高速化などにも利用されています。

ハッシュには以下のような種類があります。

  • MD5
  • SHA224
  • SHA256
  • SHA512

種類は主にハッシュ値の長さによるものです。ハッシュ値が長いほど解読がしづらい = 安全性が高いため、時代とともにハッシュ値が長い手法が使われるようになってきています。

日本(CRYPTREC)ではMD5は非推奨となっておりSHA256が推奨されています。アメリカにおいても同様です。
 

[PR] 未経験からWebエンジニアを目指す方法とは

ハッシュ値を計算する方法

Python でハッシュ値を計算するにはhashlibを使用します。例えばsha256でハッシュ値を取得するには以下のように記述します。

hashlib.sha256(データ).hexdigest()

データはバイト型で指定します。hashlibについて、詳しくは公式サイトも参考にしてください。

hashlib — セキュアハッシュおよびメッセージダイジェスト
 

実際に書いてみよう

今回のサンプルプログラムでは、 sha256でハッシュ値を取得する方法を確認します。

import hashlib

m = hashlib.sha256()
m.update(b'Python')
m.hexdigest()

文字列に「b」を付けることでバイト型として扱うことができます。実行結果は以下のとおりです。

'18885f27b5af9012df19e496460f9294d5ab76128824c6f993787004f6d9a7db'

簡単に書くと以下のようになります。

hashlib.sha256(b'Python').hexdigest()

実行結果は以下のとおりです。先程の結果ど同一であることが確認できます。1文字でも変えるとハッシュ値は全く別の値になります。値を変えて試してみましょう。

'18885f27b5af9012df19e496460f9294d5ab76128824c6f993787004f6d9a7db'

 

まとめ

今回の記事ではPythonでハッシュ値を計算する方法を学習しました。
 

監修してくれたメンター

太田和樹(おおたかずき)

ITベンチャー企業のPM兼エンジニア。

普段は主に、Web系アプリケーション開発のプロジェクトマネージャーとプログラミング講師を行っている。守備範囲はフロントエンド、モバイル、サーバサイド、データサイエンティストと幅広い。その幅広い知見を生かして、複数の領域を組み合わせた新しい提案をするのが得意。

開発実績:画像認識技術を活用した駐車場混雑状況把握(実証実験)、音声認識を活用したヘルプデスク支援システム、Pepperを遠隔操作するアプリの開発、大規模基幹系システムの開発・導入マネジメント。

地方在住。仕事のほとんどをリモートオフィスで行う。通勤で消耗する代わりに趣味のDIYや家庭菜園、家族との時間を楽しんでいる。

 

大石ゆかり

内容分かりやすくて良かったです!

田島悠介

ゆかりちゃんも分からないことがあったら質問してね!

大石ゆかり

分かりました。ありがとうございます!

 

TechAcademyでは、初心者でも、Pythonを使った人工知能(AI)や機械学習の基礎を習得できる、オンラインブートキャンプを開催しています。

また、現役エンジニアから学べる無料体験も実施しているので、ぜひ参加してみてください。