icon
icon

PythonでCSVファイルの文字コードを変換する方法【初心者向け】

初心者向けにPythonでCSVファイルの文字コードを変換する方法について解説しています。文字や文字列はコンピューター上では数値として扱われています。異なった文字コードに変換することをエンコードと言います。

テックアカデミーマガジンは受講者数No.1のプログラミングスクール「テックアカデミー」が運営。初心者向けにプロが解説した記事を公開中。現役エンジニアの方はこちらをご覧ください。 ※ アンケートモニター提供元:GMOリサーチ株式会社 調査期間:2021年8月12日~8月16日  調査対象:2020年8月以降にプログラミングスクールを受講した18~80歳の男女1,000名  調査手法:インターネット調査

PythonでCSVファイルの文字コードを変換する方法について解説します。

そもそもPythonについてよく分からないという方は、Pythonとは何なのか解説した記事を読むとさらに理解が深まります。

 

なお本記事は、TechAcademyのオンラインブートキャンプPython講座の内容をもとに紹介しています。

 

田島悠介

今回は、Pythonに関する内容だね!

大石ゆかり

どういう内容でしょうか?

田島悠介

CSVファイルの文字コードを変換する方法について詳しく説明していくね!

大石ゆかり

お願いします!

 

エンコードとは

エンコード(encode)とは、データを一定の規則に従い目的に応じた情報に変換することです。
日本語では、符号化を指します。対義語は復号(デコード、decode)です。

 

文字コードとは

文字コードとは、文字や記号をコンピューターで扱えるよう、個々に割り当てられた固有の符号です。英数字を表す文字コードにはASCIIがあり、1バイトで1文字を表します。

日本語には仮名、カタカナ、漢字などがあり、1バイトでは表現しきれません。そのため、マルチバイト(複数バイト)の文字コードを用います。Shift_JIS、EUC-JPなどの文字コードがあります。

UTF-8とは、ユニコード定義された文字集合を表現できる方式の一つです。1文字を1~6バイトの可変長で表現し、世界的に普及しています。
 

[PR] Pythonで挫折しない学習方法を動画で公開中

Pythonの標準エンコーディングとは

Pythonの標準エンコード方式はUTF-8です。
以下、公式ドキュメントからの抜粋です。

Python の文字列型は文字表現のためのUnicode標準を使っていて、Pythonプログラムは有り得る様々な文字を全て扱えます。
(中略)
UTF-8 is one of the most commonly used encodings, and Python often defaults to using it.
 

CSVファイルの文字コードを変換する方法(例:UTF-8からShift_JISへの変換)

サンプルコード

import csv

with open('utf8.csv', 'w', newline='', encoding='utf8') as f:
  writer = csv.writer(f)
  writer.writerow(['氏名','年齢'])
  writer.writerow(['太郎','10'])
  writer.writerow(['花子','20'])

with open('utf8.csv', encoding='utf8') as f_in:
    with open('sjis.csv', 'w', encoding='cp932') as f_out:
        f_out.write(f_in.read())

 

実行結果

カレントディレクトリに、UTF-8のCSVファイルutf8.csvと、Shift_JISのファイルsjis.csvが作成されました。

 

解説

  • CSVファイルの読み書きを行うため、csvモジュールをインポート
  • utf8.csvファイルにCSVデータを書き込み
  • エンコードに明示的にutf8と指定
  • utf8.csvファイルを読み込みモード、sjis.csvファイルを書き込みモードで開く
  • それぞれencodingキーワードで、エンコードを指定
  • utf8.csvファイルから読み込んだデータを、sjis.csvファイルに書き込み

 

監修してくれたメンター

橋本紘希

システムインテグレータ企業勤務のシステムエンジニア。

開発実績: Javaプログラムを用いた業務用Webアプリケーションや、基幹システム用バッチアプリケーションなどの設計構築試験。

 

大石ゆかり

内容分かりやすくて良かったです!

田島悠介

ゆかりちゃんも分からないことがあったら質問してね!

大石ゆかり

分かりました。ありがとうございます!

 

TechAcademyでは、初心者でもPythonを使った人工知能(AI)や機械学習の基礎を習得できるオンラインブートキャンプPython講座を開催しています。

挫折しない学習方法を知れる説明動画や、現役エンジニアとのビデオ通話とチャットサポート、学習用カリキュラムを体験できる無料体験も実施しているので、ぜひ参加してみてください。