icon
icon

PythonでのJSON形式のファイルデータをパースする方法を現役エンジニアが解説【初心者向け】

初心者向けにPythonでのJSON形式のファイルデータをパースする方法について現役エンジニアが解説しています。JSON形式のデータは、JavaScriptのオブジェクト形式になっているデータのことです。Pythonではjson_loadメソッドで解析することができます。

テックアカデミーマガジンは受講者数No.1のプログラミングスクール「テックアカデミー」が運営。初心者向けにプロが解説した記事を公開中。現役エンジニアの方はこちらをご覧ください。 ※ アンケートモニター提供元:GMOリサーチ株式会社 調査期間:2021年8月12日~8月16日  調査対象:2020年8月以降にプログラミングスクールを受講した18~80歳の男女1,000名  調査手法:インターネット調査

監修してくれたメンター

清水 源一郎

企業勤務の研究者として、機械学習やデータサイエンスを活用した製品開発を行っている。
テックアカデミーでは、Pythonコース、AIコース、データサイエンスコースを担当。

PythonでのJSON形式のファイルデータをパースする方法について、テックアカデミーのメンター(現役エンジニア)が実際のコードを使用して初心者向けに解説します。

目次

1時間でできる無料体験!

そもそもPythonについてよく分からないという方は、Pythonとは何なのか解説した記事を読むとさらに理解が深まります。

 

田島悠介

今回は、Pythonに関する内容だね!

大石ゆかり

どういう内容でしょうか?

田島悠介

PythonでのJSON形式のファイルデータをパースする方法について詳しく説明していくね!

大石ゆかり

お願いします!

 

この記事ではPythonで「JSON形式のデータを扱う方法」について学習します。

JSONは他の言語とデータを交換する際に使用されるデータ形式で、Webアプリケーションにおけるデータのやり取りに使用されます。

今回は、PythonでこのJSONデータを読み書きするためのライブラリjsonの使い方を紹介します。

 

JSONデータとは

JSONとは、「JavaScript Object Notation」の略称であり、Webアプリケーションでのデータのやり取り等によく利用されているデータ形式です。

JavaScriptと名が付いている通り、元々はJavaScriptのオブジェクトを記述するデータ構造です。ただ、軽量で人間にとっても読みやすいため、現在はPythonなど他の言語でも利用されています。

JSONデータは下記のように、名前(キー)と値のペアを, で区切り、全体を{}で区切って記述します。

{
“名前1” : “値1”,
“名前2” : “値2”,
}

Pythonにおける辞書に似ているので、辞書のイメージを持っておくと良いでしょう。

ただし、文字列は’’(シングルクォーテーション)ではなく、””(ダブルクォーテーション)で囲うので注意しましょう。

値には、数値や文字列の他に配列や、{}で囲った別のオブジェクトを入れることができます。

 

jsonライブラリの使い方

PythonでJSON形式のデータを扱う際はjsonという標準ライブラリを利用します。

ここでは、jsonライブラリの使い方として、基本的な3つの操作をご紹介します。

  • jsonデータの読み込み
  • jsonデータの書き込み
  • jsonデータの確認と整形

それぞれの操作について以下で解説します。

いずれの場合もjsonライブラリの使用時には、事前に以下のコードでインポートしてから使用しましょう。

import json

JSONデータをPythonの読み込み

まずは、JSONデータの読み込み方法を説明します。

loads関数を使うことで、JSON形式の文字列をpythonの辞書に変換できます。

json.loads(文字列)

また、直接JSONファイルを読み込んでpythonの辞書に変換できます。

この場合はload関数を使用します。

with open(JSONファイルのパス) as f:
    json.load(f.read())

それぞれのサンプルコードを見てみましょう。

まずは、loads関数のサンプルコードです。

s = '{"key1":"value1", "key2":2}'
dict_from_json = json.loads(s)
print(type(dict_from_json))
print(dict_from_json)

出力結果

<class 'dict'>
{'key1': 'value1', 'key2': 2}

{"key1":"value1", "key2":2}というJSONデータを文字列として用意し、loads関数に渡すと、Pythonの辞書に変換されていることがわかります。

次に、load関数のサンプルコードを紹介します。

上記と同じ{"key1":"value1", "key2":2}というJSONデータを記入した、test.jsonというファイルを用意して実行してみてください。

with open('test.json', 'r') as f:
    print(json.load(f))

出力結果

{'key1': 'value1', 'key2': 2}

loads関数の場合と同じようにJSONデータが辞書に変換できていますね。

一度変換してしまえば、後はPythonの辞書として、データの追加や編集が可能です。

辞書[キー]というコードで値にアクセスすることができます。

JSONデータの書き込み

次にPythonのデータをJSONデータに変換する方法を紹介します。

先ほど紹介したload, loads関数と反対に、Pythonの辞書をJSONファイルとして出力するdump関数とPythonの辞書をJSONデータの文字列に変換するdumps関数がそれぞれ存在します。

二つの関数はそれぞれ次のように使用します。

json.dumps(JSONデータにしたい辞書)
with open(出力するJSONファイルのパス, 'w') as f:
    json.dump(JSONデータにしたい辞書, f)

サンプルコードによる利用例も確認してみましょう。

python_dict = {'key1':'value1', 'key2':[1,2,3]}

print(json.dumps(python_dict))

with open('test2.json', 'w') as f:
    json.dump(python_dict, f)

出力結果

{"key1": "value1", "key2": [1, 2, 3]}

Pythonの辞書をJSONデータに変換することができました。 出力されたデータと同じ内容が記載されたtest2.jsonというファイルも出力されていますね。

JSONデータの確認と整形

jsonライブラリのjson.toolを使用すると、コマンドライン(windowsのコマンドプロンプトやMacのターミナル)からもjsonデータを確認できます。

$ python -m json.tool JSONファイルのパス

というコマンドを入力すると、JSONファイルの中身を整形出力して確認できます。

例えば、先ほど作成した、{“key1”: “value1”, “key2”: [1, 2, 3]}というデータが書き込まれたtest2.jsonを扱ってみます。

$ python -m json.tool test2.json

出力結果

{
    "key1": "value1",
    "key2": [
        1,
        2,
        3
    ]
}

上記のようにインデントが整えられたり、名前:値のペアごとに改行されたり、配列の要素ごとに改行されたりして見やすく出力されています。

 

[PR] Pythonで挫折しない学習方法を動画で公開中

実際にJSONデータを操作してみよう

ここまで紹介した内容を使って実際にJSONデータを操作してみましょう。

pythonでJSONファイルを読み込み、内容を編集して、別のJSONファイルとして保存していきます。

今回は次のような、あるサービスの会員情報のデータを扱ってみます。

会員のIDと名前、趣味と登録日が記されたデータになっています。

次のデータをsample.jsonという名前で保存しておいてください。

{
    “ID” : “A001”,
    “Name” : “Taro”,
    “Hobby” : [],
    “Signup_at”:{
        “Year”:2022,
        “Month”:1,
        “day”:1
    }
}

サンプルコード

#①データの読み込み
with open('sample.json', 'r') as f:
    member = json.load(f)

print(member['Signup_at']['Year'])

#②データの編集
member['Hobby'].append('Swimming')
print(member)

member2 = {
    'ID': 'A002', 
    'Name': 'Jiro', 'Hobby': ['Reading books', 'Running'], 
    'Signup_at': {'Year': 2022, 'Month': 6, 'day': 1}
    }
new_data = [member, member2]

#③データの保存
with open('sample2.json', 'w') as f:
    json.dump(new_data, f, indent=4)

出力結果

2022

{'ID': 'A001', 'Name': 'Taro', 'Hobby': ['Swimming'], 'Signup_at': {'Year': 2022, 'Month': 1, 'day': 1}}

まず、2-3行目でsample.jsonのデータを読み込んでいます。

今回のデータの登録日 “Signup_at”に対する値は、さらに”Year”,”Month”, “Day”をキーとする辞書になっています。

そのため、登録日の情報にアクセスしたい場合は、member['Signup_at']['Year']として、"Signup_at"の値の辞書を呼び出した後に更にキー"Year"を指定します。

次にデータの編集を行っています。

まず、TaroさんのHobby(趣味)にSwimming(水泳)を追加しています。

Hobbyの値はリストになっているので、member['Hobby']によってリストにアクセスした後、リストの要素追加のappendメソッドでデータを追加しています。

memberを出力すると、Swimmingが追加されていることが確認できますね。

その後、別の会員のJiroさんのデータを新たに追加しています。

このように、JSONデータはいくつかのオブジェクトの配列となることがあります。

最後にJiroさんの情報を追加した新しいデータをsample2.jsonという名前で保存しています。

sample2.jsonの中身は下記のようになっており、編集や追加した情報が反映されています。

dump関数では、サンプルコードのように、引数indentでインデントの字数を指定することで、見やすく出力できます。

[

    {

        "ID": "A001",

        "Name": "Taro",

        "Hobby": [

            "Swimming"

        ],

        "Signup_at": {

            "Year": 2022,

            "Month": 1,

            "day": 1

        }

    },

    {

        "ID": "A002",

        "Name": "Jiro",

        "Hobby": [

            "Reading books",

            "Running"

        ],

        "Signup_at": {

            "Year": 2022,

            "Month": 6,

            "day": 1

        }

    }

]

 

コラム

コスパとタイパ、両方結果的に良くなる良くなる学び方とは?

「スクールは高いし時間も縛られて効率が悪い」と考える方は多いと思います。
もちろん、時間も費用もかかることは間違いありません。
ただ 結果的に無駄な学びにお金も時間もかける方がリスクが高いという考えもあります。

コスパ・タイパ最適化の参考として、 テックアカデミー卒業生がスクールを選んだ理由 をご紹介します。

  • ・困ったときに、質問や相談できる相手がいるため挫折しなかった
  • ・プロとして必要なスキルのみを深く学べたので無駄がなかった
  • ・副業案件の提供と納品までのサポートがあったので目的を達成できた

安価・短期間で広く浅く学んでも意味がありません。 本当に自分の目的が達成できるか、それが重要です。
自分にどのスキルや学び方が合っているか、どんな学習方法かなど、お気軽に 無料相談 に参加してみませんか?

カウンセラー・現役のプロへ、何でも気軽に無料相談可能。 30分か60分お好きな時間が選べて、かつ3回まで すべて無料で ご利用できます。
無理な勧誘は一切ない ので、お気軽にご参加ください。

今なら相談した方限定の割引・参加特典付き! 無料相談はこちら

まとめ

本記事では、jsonライブラリについて解説しました。

  • JSONデータとは
  • jsonライブラリの使い方
  • JSONデータの操作方法

JSONデータを活用することで、他の言語やアプリケーションとのデータのやり取りが可能になります。

ぜひ使いこなせるように覚えておきましょう。

 

大石ゆかり

内容が分かりやすくて良かったです!

田島悠介

ゆかりちゃんも分からないことがあったら質問してね!

大石ゆかり

分かりました。ありがとうございます!

 

Pythonを学習中の方へ

これで解説は終了です、お疲れさまでした。

  • つまずかず「効率的に」学びたい
  • 副業や転職後の「現場で使える」知識やスキルを身につけたい

プログラミングを学習していて、このように思ったことはありませんか?

テックアカデミーのPythonコースでは、第一線で活躍する「プロのエンジニア」が教えているので、効率的に実践的なスキルを完全オンラインでしっかり習得できます。

合格率10%の選考を通過した、選ばれたエンジニアの手厚いサポートを受けながら、人工知能(AI)や機械学習の基礎を学べます。

まずは一度、無料体験で学習の悩みや今後のキャリアについて話してみて、「現役エンジニアから教わること」を実感してみてください。

時間がない方、深く知ってから体験してみたい方は、今スグ見られる説明動画から先に視聴することをおすすめします!

初心者・未経験でもできる。まずはテックアカデミーに相談しよう

プログラミングを独学で学習していて、このように感じた経験はないでしょうか?

  • ・調べてもほしい情報が見つからない
  • ・独学のスキルが実際の業務で通用するのか不安
  • ・目標への学習プランがわからず、迷子になりそう

テックアカデミーでは、このような 学習に不安を抱えている方へ、マンツーマンで相談できる機会を無料で提供 しています。
30分間、オンラインでどんなことでも質問し放題です。

「受けてよかった」と感じていただけるよう カウンセラーやエンジニア・デザイナー があなたの相談に真摯に向き合います。

「自分に合っているか診断してほしい」
「漠然としているが話を聞いてみたい」

こんなささいな悩みでも大丈夫です。

無理な勧誘は一切ありません ので、まずはお気軽にご参加ください。
※体験用のカリキュラムも無料で配布いたします。(1週間限定)

今なら参加者限定の割引特典付き! 無料相談を予約する