Pythonで日本語を含むパスを扱う方法を現役エンジニアが解説【初心者向け】
初心者向けにPythonで日本語を含むパスを扱う方法について現役エンジニアが解説しています。パスとは、ファイルやディレクトリの場所を指す文字列のことです。日本語を含むパスを扱うためのエンコード方法を解説します。また、絶対パスや相対パスについて確認しましょう。
テックアカデミーマガジンは受講者数No.1のプログラミングスクール「テックアカデミー」が運営。初心者向けにプロが解説した記事を公開中。現役エンジニアの方はこちらをご覧ください。 ※ アンケートモニター提供元:GMOリサーチ株式会社 調査期間:2021年8月12日~8月16日 調査対象:2020年8月以降にプログラミングスクールを受講した18~80歳の男女1,000名 調査手法:インターネット調査
Pythonで日本語を含むパスを扱う方法について、TechAcademyのメンター(現役エンジニア)が実際のコードを使用して初心者向けに解説します。
そもそもPythonについてよく分からないという方は、Pythonとは何なのか解説した記事を読むとさらに理解が深まります。
なお本記事は、TechAcademyのオンラインブートキャンプPython講座の内容をもとに紹介しています。
今回は、Pythonに関する内容だね!
どういう内容でしょうか?
Pythonで日本語を含むパスを扱う方法について詳しく説明していくね!
お願いします!
目次
パスを指定する方法
パス(ファイルやディレクトリの場所)を指定するには、絶対パスと相対パスの2通りの方法があります。
絶対パスは、ルートディレクトリを起点にパスを指定する方法です。相対パスは、現在のディレクトリ(カレントディレクリ)を起点にパスを指定する方法です。
例えば、Windowsで C:aaabbbccc というファイルを指定することを想定します。また、カレントディレクリは C:aaa とします。絶対パスはそのまま C:aaabbbccc です。
カレントディレクトリから見ると、ディレクトリbbbの中にファイルcccがあるので、相対パスは bbbccc です。
エンコードとは
エンコードとは、あるデータを別の形式に変換することです。
とくに文字エンコードとは、コンピュータが文字を扱うときに、データ(数値)と文字を対応付ける変換規則です。例えば、ASCIIという文字コードでは、65が大文字A、66が大文字Bに対応しています。
日本語の文字エンコードにはUTF-8、Shift-JISなどがあり、Pythonは標準ではUTF-8を扱います。
日本語を含むパスを指定してみよう
日本語を含むパスも、日本語を含まないパスも、指定方法は一緒です。ただし、ファイルの中身を読み書きする場合、以下のように文字エンコードの指定が必要です。
前提条件
サンプル.txt というファイルがあり、中身は「あいうえお」とします。ファイルの文字エンコードはUTF-8とします。
ソースコード
# 絶対パス with open('C:\Users\user\Documents\src\techacademy\tmp\サンプル.txt', encoding='utf-8') as f: print(f.read()) # 相対パス with open('サンプル.txt', encoding='utf-8') as f: print(f.read())
実行結果
あいうえお あいうえお
まとめ
この記事では絶対パス、相対パスの指定方法と、日本語を含むパスの指定方法を紹介しました。
文字エンコードに齟齬があると、文字化けの原因になります。Pythonの標準文字エンコードはUTF-8のため、プログラムで日本語を扱う場合にはUTF-8に統一しておくと、余計なトラブルを避けられます。
監修してくれたメンター
橋本紘希(はしもとひろき)
システムインテグレータ企業勤務のシステムエンジニア。 開発実績: Javaプログラムを用いた業務用Webアプリケーションや、基幹システム用バッチアプリケーションなどの設計構築試験。 |
内容分かりやすくて良かったです!
ゆかりちゃんも分からないことがあったら質問してね!
分かりました。ありがとうございます!
TechAcademyでは、初心者でもPythonを使った人工知能(AI)や機械学習の基礎を習得できるオンラインブートキャンプPython講座を開催しています。
挫折しない学習方法を知れる説明動画や、現役エンジニアとのビデオ通話とチャットサポート、学習用カリキュラムを体験できる無料体験も実施しているので、ぜひ参加してみてください。