Pythonでcsvファイルを読み書きする方法を現役エンジニアが解説【初心者向け】
初心者向けにPythonでcsvファイルを読み書きする方法について現役エンジニアが解説しています。csvファイルは、データがカンマなどの文字で区切られているものです。Pythonでは標準のcsvモジュールを使って読み書きします。open、reader、writerメソッドを使ってみましょう。
テックアカデミーマガジンは受講者数No.1のプログラミングスクール「テックアカデミー」が運営。初心者向けにプロが解説した記事を公開中。現役エンジニアの方はこちらをご覧ください。 ※ アンケートモニター提供元:GMOリサーチ株式会社 調査期間:2021年8月12日~8月16日 調査対象:2020年8月以降にプログラミングスクールを受講した18~80歳の男女1,000名 調査手法:インターネット調査
Pythonでcsvファイルを読み書きする方法について解説します。
そもそもPythonについてよく分からないという方は、Pythonとは何なのか解説した記事を読むとさらに理解が深まります。
なお本記事は、TechAcademyのオンラインブートキャンプPython講座の内容をもとに紹介しています。
今回は、Pythonに関する内容だね!
どういう内容でしょうか?
Pythonでcsvファイルを読み書きする方法について詳しく説明していくね!
お願いします!
csv.readerの使い方
csvファイルとは、テキストファイルの1種で、ファイルの内部のデータがカンマで区切られて保持されているものです。
5.1,3.5,1.4,0.2,Iris-setosa 4.9,3.0,1.4,0.2,Iris-setosa 4.7,3.2,1.3,0.2,Iris-setosa 4.6,3.1,1.5,0.2,Iris-setosa 5.0,3.6,1.4,0.2,Iris-setosa
今回の記事ではcsvファイルの例として、機械学習で良く使われるIrisを使用します。
以下のサイトの「iris.data」をクリックしてファイルをダウンロードして、ファイル名を「iris.csv」にリネームしておきましょう。
Index of /ml/machine-learning-databases/iris
Pythonの標準ライブラリでcsvファイルの読み込みと書き込みを行えるのがcsvモジュールです。
csvモジュールはファイルの読み込みまたは書き込みを行うファイルオブジェクトと共に使用します。
ファイルの読み書きについては以下の記事も参考にしてください。
csvファイルを読み込むにはcsv.readerを使用します。
csv.readerを使うことで、csvファイルを1行ずつ、list型で取得できます。それぞれの項目の型は文字列となります。
import csv file = open('iris.csv', 'r', encoding = "utf_8") reader = csv.reader(file) for row in reader: ? # csvファイル1行ずつの処理を記述 file.close()
csvファイルの中身を出力する
それでは実際にcsvファイルの中身を出力してみましょう。
file = open('iris.csv', 'r', encoding = "utf_8") reader = csv.reader(file) for row in reader: print(row) file.close()
実行結果は以下のようになります(一部)。
['5.1', '3.5', '1.4', '0.2', 'Iris-setosa'] ['4.9', '3.0', '1.4', '0.2', 'Iris-setosa'] ['4.7', '3.2', '1.3', '0.2', 'Iris-setosa'] ['4.6', '3.1', '1.5', '0.2', 'Iris-setosa'] ['5.0', '3.6', '1.4', '0.2', 'Iris-setosa']
csv.writerの使い方
csvファイルに書き込みを行うにはcsv.writerを使用します。
file = open('iris2.csv', 'w', encoding = "utf_8") writer = csv.writer(file) # csvファイルに書き込む処理を記述 file.close()
csvファイルに文字列を書き込みする
最後に、irisデータをリストに5行分だけ読み込んで、別のcsvファイルに書き込む例をご紹介します。
import csv # 空のリストを作成 iris = [] # 空のリストにcsvファイルを5行読み込み file = open('iris.csv', 'r', encoding = "utf_8") reader = csv.reader(file) for row in reader: iris.append(row) if(len(iris)>=5): break file.close() # リストの内容をcsvファイルに書き込み file = open('iris2.csv', 'w', encoding = "utf_8") writer = csv.writer(file) for row in iris: writer.writerow(row) file.close()
実行結果は以下のようになります。iris2.csvというファイルが作成されているのが分かります。
5.1,3.5,1.4,0.2,Iris-setosa 4.9,3.0,1.4,0.2,Iris-setosa 4.7,3.2,1.3,0.2,Iris-setosa 4.6,3.1,1.5,0.2,Iris-setosa 5.0,3.6,1.4,0.2,Iris-setosa
監修してくれたメンター
太田和樹(おおたかずき)
ITベンチャー企業のPM兼エンジニア 普段は主に、Web系アプリケーション開発のプロジェクトマネージャーとプログラミング講師を行っている。守備範囲はフロントエンド、モバイル、サーバサイド、データサイエンティストと幅広い。その幅広い知見を生かして、複数の領域を組み合わせた新しい提案をするのが得意。 開発実績:画像認識技術を活用した駐車場混雑状況把握(実証実験)、音声認識を活用したヘルプデスク支援システム、Pepperを遠隔操作するアプリの開発、大規模基幹系システムの開発・導入マネジメント。 地方在住。仕事のほとんどをリモートオフィスで行う。通勤で消耗する代わりに趣味のDIYや家庭菜園、家族との時間を楽しんでいる。 |
内容分かりやすくて良かったです!
ゆかりちゃんも分からないことがあったら質問してね!
分かりました。ありがとうございます!
TechAcademyでは、初心者でもPythonを使った人工知能(AI)や機械学習の基礎を習得できるオンラインブートキャンプPython講座を開催しています。
挫折しない学習方法を知れる説明動画や、現役エンジニアとのビデオ通話とチャットサポート、学習用カリキュラムを体験できる無料体験も実施しているので、ぜひ参加してみてください。