PythonでCSVファイルの文字コードを変換する方法【初心者向け】
初心者向けにPythonでCSVファイルの文字コードを変換する方法について解説しています。文字や文字列はコンピューター上では数値として扱われています。異なった文字コードに変換することをエンコードと言います。
テックアカデミーマガジンは受講者数No.1のプログラミングスクール「テックアカデミー」が運営。初心者向けにプロが解説した記事を公開中。現役エンジニアの方はこちらをご覧ください。 ※ アンケートモニター提供元:GMOリサーチ株式会社 調査期間:2021年8月12日~8月16日 調査対象:2020年8月以降にプログラミングスクールを受講した18~80歳の男女1,000名 調査手法:インターネット調査
PythonでCSVファイルの文字コードを変換する方法について解説します。
そもそもPythonについてよく分からないという方は、Pythonとは何なのか解説した記事を読むとさらに理解が深まります。
なお本記事は、TechAcademyのオンラインブートキャンプPython講座の内容をもとに紹介しています。
今回は、Pythonに関する内容だね!
どういう内容でしょうか?
CSVファイルの文字コードを変換する方法について詳しく説明していくね!
お願いします!
エンコードとは
エンコード(encode)とは、データを一定の規則に従い目的に応じた情報に変換することです。
日本語では、符号化を指します。対義語は復号(デコード、decode)です。
文字コードとは
文字コードとは、文字や記号をコンピューターで扱えるよう、個々に割り当てられた固有の符号です。英数字を表す文字コードにはASCIIがあり、1バイトで1文字を表します。
日本語には仮名、カタカナ、漢字などがあり、1バイトでは表現しきれません。そのため、マルチバイト(複数バイト)の文字コードを用います。Shift_JIS、EUC-JPなどの文字コードがあります。
UTF-8とは、ユニコード定義された文字集合を表現できる方式の一つです。1文字を1~6バイトの可変長で表現し、世界的に普及しています。
Pythonの標準エンコーディングとは
Pythonの標準エンコード方式はUTF-8です。
以下、公式ドキュメントからの抜粋です。
Python の文字列型は文字表現のためのUnicode標準を使っていて、Pythonプログラムは有り得る様々な文字を全て扱えます。
(中略)
UTF-8 is one of the most commonly used encodings, and Python often defaults to using it.
CSVファイルの文字コードを変換する方法(例:UTF-8からShift_JISへの変換)
サンプルコード
import csv with open('utf8.csv', 'w', newline='', encoding='utf8') as f: writer = csv.writer(f) writer.writerow(['氏名','年齢']) writer.writerow(['太郎','10']) writer.writerow(['花子','20']) with open('utf8.csv', encoding='utf8') as f_in: with open('sjis.csv', 'w', encoding='cp932') as f_out: f_out.write(f_in.read())
実行結果
カレントディレクトリに、UTF-8のCSVファイルutf8.csvと、Shift_JISのファイルsjis.csvが作成されました。
解説
- CSVファイルの読み書きを行うため、csvモジュールをインポート
- utf8.csvファイルにCSVデータを書き込み
- エンコードに明示的にutf8と指定
- utf8.csvファイルを読み込みモード、sjis.csvファイルを書き込みモードで開く
- それぞれencodingキーワードで、エンコードを指定
- utf8.csvファイルから読み込んだデータを、sjis.csvファイルに書き込み
監修してくれたメンター
橋本紘希
システムインテグレータ企業勤務のシステムエンジニア。 開発実績: Javaプログラムを用いた業務用Webアプリケーションや、基幹システム用バッチアプリケーションなどの設計構築試験。 |
内容分かりやすくて良かったです!
ゆかりちゃんも分からないことがあったら質問してね!
分かりました。ありがとうございます!
TechAcademyでは、初心者でもPythonを使った人工知能(AI)や機械学習の基礎を習得できるオンラインブートキャンプPython講座を開催しています。
挫折しない学習方法を知れる説明動画や、現役エンジニアとのビデオ通話とチャットサポート、学習用カリキュラムを体験できる無料体験も実施しているので、ぜひ参加してみてください。