Python

Pythonにおけるbs4のインストール方法と使い方を現役エンジニアが解説【初心者向け】

初心者向けにPythonにおけるbs4のインストール方法と使い方について現役エンジニアが解説しています。bs4(beautifulsoup4)とはHTMLパーサライブラリです。bs4をPythonのpipによりインストールし、Webページをスクレイピングする方法を解説しています。

テックアカデミーマガジンは受講者数No.1のプログラミングスクール「テックアカデミー」が運営。初心者向けにプロが解説した記事を公開中。現役エンジニアの方はこちらをご覧ください。 ※ アンケートモニター提供元：GMOリサーチ株式会社　調査期間：2021年8月12日～8月16日　調査対象：2020年8月以降にプログラミングスクールを受講した18～80歳の男女1,000名　調査手法：インターネット調査

監修してくれたメンター

nakamoto

アジマッチ有限会社代表取締役社長。書籍化歓迎。対応業務：PHP(Laravel)、機械学習、Vue.js、LAMP・AWS、越境EC、CTO、エンジニア採用、CTO、経営者の不安解決コンサルティング。

Pythonにおけるbs4のインストール方法と使い方について、テックアカデミーのメンター（現役エンジニア）が実際のコードを使用して初心者向けに解説します。

Pythonでbs4を利用すると、HTMLファイルやXMLファイルからデータを抽出することができます。

実務でもbs4を利用した自動化処理を行いますので、ぜひ学習してみてください。

bs4とは？

bs4とは、Pythonでよく使用されているサードパーティ製のHTMLパーサライブラリです。

bs4では、インスタンス生成時に使用するパーサライブラリを指定でき、XMLをパースすることが可能です。

パーサとは、プログラムのソースコードやXML文書など、一定の文法に従って記述された複雑な構造のテキスト文書を解析し、プログラムで扱えるようなデータ構造の集合体に変換するプログラムのことを意味します。

パースとは、パーサプログラムで実際に解析変換する処理を意味します。

bs4のインストール

bs4はPyPIで配布されているため、pipでインストールすることが可能です。

pip install beautifulsoup4

[PR] 未経験からWebエンジニアを目指す方法とは

bs4の使い方

基本的な使い方は以下の通りです。

HTML文字列を用意する
パーサを指定してHTML文字列を元にBeautifulSoupオブジェクトを生成する
BeautifulSoupから必要となるデータを抽出する

サンプルコード

from bs4 import BeautifulSoup
html = "<body><h1>python入門</h1><p>pythonの基礎について学習します</p></body>"
soup = BeautifulSoup(html, "html.parser")
print(soup.h1)

実行結果

<h1>python入門</h1>

解説

1行目ではbs4ライブラリをインポートしています。

2行目ではHTML文字列を用意しています。

3行目ではHTML文字列を元にBeautifulSoupオブジェクトを生成しています。

第1引数のHTML_TEXTの部分は取ってきたHTMLをそのまま渡して、第2引数はパーサを指定します。

4行目ではBeautifulSoupオブジェクトからh1のタグを指定してデータを抽出しています。

BeautifulSoupオブジェクトからのデータ抽出方法は大きく分けて3つあります。

Tagオブジェクトを使用
find_allメソッドを使用
selectメソッドを使用したCSSセレクタ

今回は、Tagオブジェクトについて学習しますが、実務上ではfind_allメソッドの使用でほとんど事足ります。

また、HTML文字列の取得はurllibなどでURLを指定して、インターネットから取得する事も可能です。

bs4を利用してスクレイピングしてみよう

ここではYahooのヘッドラインニュースを抽出する例を、サンプルコードと実行結果をもとに解説していきます。

urllibのインストール

今回のサンプルコードではurllibを使用してHTML文字列を取得するので、urllibをインストールします。

urllibはPyPIで配布されているため、pipでインストールすることが可能です。

pip install urllib3

サンプルコード

import urllib.request
from bs4 import BeautifulSoup

url = 'https://techacademy.jp/magazine/'
ua = 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_3) '
'AppleWebKit/537.36 (KHTML, like Gecko) '
'Chrome/55.0.2883.95 Safari/537.36 '

req = urllib.request.Request(url, headers={'User-Agent': ua})
html = urllib.request.urlopen(req)
soup = BeautifulSoup(html, "html.parser")
topicsindex = soup.find('div', attrs={'class': 'moe-banner-title'})topics = topicsindex.find_all('li')
for topic in topics:
  print(topic.find('a').contents[0])

実行結果

<p class="moe-banner-title">
                一度身につけておけば、武器になる
                  </p>
<p class="moe-banner-title">
                  指一本で世の中を変えられる、未来を創れる
                  </p>
<p class="moe-banner-title">
                  パソコン1台で、10億人の人生を変えられるかもしれない
                  </p>

解説

1-2行目では使用するurllib、BeautifulSoupライブラリのインポートしています。

3行目ではHTML抽出先のURLを設定しています。

4-7行目ではユーザーエージェントの設定をしています。

8行目ではurllib.request.Request()でユーザーエージェントを偽装してHTML文字列を取得しています。

https://techacademy.jp/magazine/は、ユーザーエージェント (User agent）によって表示を変えているのでこのような記述になっています。

9行目ではMASTER OF ENGINEERコンテンツにある、class”moe-banner-title”を指定してデータを抽出しています。

10行目では抽出したデータからトピックとなる部分すべてを抽出しています。

11-12行目では10行目で取得したトピックのリストから順番に、<a>タグを条件に記事のタイトル内容を抽出して表示しています。

抽出結果を表示しているprint(topic.find(‘a’).contents[0])についてはres.text を渡してももちろん動作します。

しかし、 res.content を渡したほうが「文字化け」する可能性を減らせておすすめです。

まとめ

bs4は、pipコマンドを利用してインストールしました。

bs4を利用するためには、HTMLの要素を指定する必要がありました。

pipを使ってPythonのモジュールをインストールする方法も参考にしてみてください。

内容が分かりやすくて良かったです！

ゆかりちゃんも分からないことがあったら質問してね！

分かりました。ありがとうございます！

Pythonを学習中の方へ

これで解説は終了です、お疲れさまでした。

つまずかず「効率的に」学びたい
副業や転職後の「現場で使える」知識やスキルを身につけたい

プログラミングを学習していて、このように思ったことはありませんか？

テックアカデミーのPythonコースでは、第一線で活躍する「プロのエンジニア」が教えているので、効率的に実践的なスキルを完全オンラインでしっかり習得できます。

合格率10%の選考を通過した、選ばれたエンジニアの手厚いサポートを受けながら、人工知能（AI）や機械学習の基礎を学べます。

まずは一度、無料体験で学習の悩みや今後のキャリアについて話してみて、「現役エンジニアから教わること」を実感してみてください。

時間がない方、深く知ってから体験してみたい方は、今スグ見られる説明動画から先に視聴することをおすすめします！

Pythonでハッシュ値を計算する方法を現役エンジニアが解説【初心者向け】

Pythonでハッシュ値を計算する方法について、TechAcademyのメンター（現役エンジニア）が実際のコードを使用して、初心者向けに解説します。 &n...

Python

Pythonで連番（連続値、シーケンス）のリストを作成する方法を現役エンジニアが解説【初心者向け】

Pythonで連番（連続値、シーケンス）のリストを作成する方法について解説します。そもそもPythonについてよく分からないという方は、Pythonとは...

Python

Pythonと統計解析を現役エンジニアが解説【初心者向け】

Pythonと統計解析について解説します。そもそもPythonについてよく分からないという方は、Pythonとは何なのか解説した記事を読むとさらに理解が...

Python

Pythonでコマンドを実行する方法を現役エンジニアが解説【初心者向け】

Pythonでコマンドを実行する方法について解説します。そもそもPythonについてよく分からないという方は、Pythonとは何なのか解説した記事を読む...

Python

Pythonでライブラリをimportするためパスを通す方法について現役エンジニアが解説【初心者向け】

Pythonでライブラリをimportするためパスを通す方法について、TechAcademyのメンター（現役エンジニア）が実際のコードを使用して初心者向けに解説...

Python

Pythonのnext関数の使い方を現役エンジニアが解説【初心者向け】

Pythonのnext関数の使い方について、TechAcademyのメンター（現役エンジニア）が実際のコードを使用して、初心者向けに解説します。 &nbs...

Python

あわせてよく読まれている記事

MySQLでWHEREを使ってレコードの抽出条件を指定する方法【初心者向け】

MySQLの初心者向けに、基本的な使い方を解説する記事です。今回は、WHEREを使ったレコードの抽出条件について、テックアカデミーのメンター（現役エンジニア）が実際のコードを使用して初心者向けに解説します。 WHEREを利用すると、条件を指定してレコードを抽出できます。実務でも、イイねの数が1000件以上のデータを抽出する時などに利用するので、ぜひ学習してみてください。目次bs4とは？bs4のインストールbs4の使い方bs4を利用してスクレイピングしてみようまとめPythonを学習中の方へそもそもPHPについてよく分からないという方は、PHPとは何なのか解説した記事を読むとさらに理解が深まります。今回の記事の内容は動画でもご覧いただけます。テキストよりも動画の方が理解しやすいという場合はぜひご覧ください。データ抽出の基本レコードは、以下の基本形式で抽出できます。 select フィールド名 from テーブル名; 特定のレコードのみ抽出 userというテーブルから、username とemail のレコードだけを抽出する方法を解説します。初期状態の表示次のコマンドで初期状態のuserテーブルを抽出します。「*」はすべてを抽出するという意味です。 select * from user; usernameとemailレコードのみ抽出次のコマンドで、usernameとemailレコードのみ抽出できます。 select username,email from user; WHEREを使って抽出条件を指定する WHEREの構文を使えば、条件を指定してレコードを抽出できます。 WHEREの基本構文 select フィールド名 from テーブル名 where フィールド名比較演算子値; idのフィールドから3以上のレコードを抽出する例えば、「idのフィールドから3以上のレコードを抽出する」という条件を指定したいときは次の通りです。コマンド select * from user where id >= 3; 実行結果解説 select * from user where id >= 3;では、idが3以上のレコードが抽出しています。 select * ですべてのレコードを抽出指定しています。 from userでは、userテーブルを抽出指定しています。 where id >= 3では、idの値が3以上のレコードをwhereで抽出指定しています。 3以上といったコマンドは比較演算子を利用します。比較演算子には =, <, >, <=, >= があります。 = ではなく、 = を使えば、当然idが3のレコードが抽出されます。 idが3のレコードのみ抽出するコマンド select * from user where id =

MySQL

jQueryのAjaxでPOST送信してPHPで受け取る方法【初心者向け】現役エンジニアが解説

今回は、jQueryのAjaxでPOST送信してPHPで受け取る方法について、TechAcademyのメンター（現役エンジニア）が実際のコードを使用して初心者向けに解説します。 PHPについてそもそもよく分からないという方は、PHPとは何なのか解説した記事を読むとさらに理解が深まります。田島悠介今回は、PHPに関する内容だね！大石ゆかりどういう内容でしょうか？田島悠介 jQueryのAjaxでPOST送信してPHPで受け取る方法について詳しく説明していくね！大石ゆかりお願いします！目次 Ajaxとは AjaxでPOST送信する jQuery（送信側）の記述方法 PHP（受信側）の記述方法まとめ Ajaxとは AjaxとはHTTPプロトコル通信で、HTMLやPHPファイルからリクエスト送信をHTTPサーバに送信して、レスポンスをブラウザ側で受信する動作を非同期通信で受け取ることができる技術です。 Ajaxを使うとHTMLファイルの中の一部だけ表示更新するなどの操作を行うことができます。例えば、ブラウザ上に表示した一覧表の内容を更新して、データベースに登録した内容をまた一覧表に反映させる時、HTMLファイルの表部分の表示だけ更新する、ということができるようになります。 [PR] 未経験からWebエンジニアを目指す方法とはAjaxでPOST送信する Ajaxを使ってPOST送信するには、jQuery側でPOST送信するデータの定義を記述して、PHP側で受け取り側の記述をします。（POST送信とはブラウザの入力フォームなどの内容をサーバ（PHP）に送る送信方法の一つです。）表示結果 index.htmlのコード <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <script src="https://ajax.googleapis.com/ajax/libs/jquery/3.5.1/jquery.min.js"></script> <title>jQueryのAjaxでPOST送信してPHPで受け取る方法を現役エンジニアが解説</title> </head> <body> <p>IDを入力 : <input type="text" id="main" /><button id="send">送信</button></p> <div id="return"></div> <script src="./main.js"></script> </body> </html> 解説 1行目の<!DOCTYPE html>では、HTML5で作成することを宣言しています。 2行目の<html>では、HTML文書の実装を開始することを意味しています。 3行目の<head>では、head要素の開始を意味しています。 4行目の<meta charset=”UTF-8″>では、UTF-8という文字コードで実装することを意味しています。 5行目の<script src=”https://ajax.googleapis.com/ajax/libs/jquery/3.5.1/jquery.min.js”></script>では、jQueryのコードを読み込んでいます。今回、Googleが用意したCDNを利用しています。 jQueryファウンデーションが用意しているCDNの方が、最新バージョンをいち早く確実に利用することができるメリットがありますが、CDNによってはサーバが一時的に停止していることがあるので、GoogleのCDNを利用するようにしています。 6行目の<title>jQueryのAjaxでPOST送信してPHPで受け取る方法を現役エンジニアが解説</title>では、検索結果やブラウザのタブに表示されるタイトルを指定しています。 7行目の</head>ではhead要素が終了することを意味しています。 8行目の<body>では、body要素が開始することを意味しています。 9行目の<p>IDを入力 : <input type=”text” id=”main” /><button id=”send”>送信</button></p>では、IDを入力するための入力フォームを用意しています。 id=”main”とid=”send”は、それぞれJavaScriptが実装されたmain.jsで利用されるため、要素名を覚えておいていただくと理解しやすいです。 10行目の<div id=”return”></div>も、main.jsで利用される要素です。最終的にこの位置に、main.jsで用意されたHTMLが追加表示されます。 11行目の<script src=”./main.js”></script>では、JavaScriptのコードを用意しているファイルを読み込んでいます。必ず5行目にあるように、jQueryファイルを先に読み込んで、そのあとJavaScriptファイルを読み込んでいただくとスムーズです。 12行目の</body>では、body要素が終了することを意味しています。 13行目の</html>では、HTML文章が終了することを意味しています。 jQuery（送信側）の記述方法 jQuery ではPHPにPOSTするデータの定義と、送信結果を受け取ったあとのアクションを記述します。記述の仕方は$.ajaxで記述する場合と、$.postメソッドを使用して記述する場合の2通りで紹介します。 $.ajaxで記述する方法 $.ajaxを利用して実装するコードを見ていきましょう。サンプルコード（main.js） $(function(){ $("#send").on("click", function(event){ let id = $("#main").val();

PHP

PHPで配列のkeyを取得する方法を現役エンジニアが解説【初心者向け】

今回は、PHPで配列のkeyを取得する方法について、テックアカデミーのメンター（現役エンジニア）が実際のコードを使用して初心者向けに解説します。 PHPで配列のkeyを取得することで、配列で使われているkeyを調べることができます。実務でも配列のkeyを利用した値の操作を行いますので、ぜひ学習してみてください。目次bs4とは？bs4のインストールbs4の使い方bs4を利用してスクレイピングしてみようまとめPythonを学習中の方へそもそもPHPについてよく分からないという方は、PHPとは何なのか解説した記事を読むとさらに理解が深まります。田島悠介今回は、PHPに関する内容だね！大石ゆかりどういう内容でしょうか？田島悠介 PHPで配列のkeyを取得する方法について詳しく説明していくね！大石ゆかりお願いします！この記事では、PHPで配列のkeyを取得する方法について記載しています。まだPHPでの開発に慣れていない方でも理解できる内容です。配列のkeyとvalueについて PHPでは連想配列という配列において、keyとvalueのセットで連想配列にデータを格納します。配列とは、複数の値を入れる箱のようなものです。通常の配列通常の配列においては、添字（インデックス）という数字でデータ(value)の格納場所に番号を振っています。配列サンプルコード <?php $array = ["りんご", "れもん", "もも"]; print_r($array); echo $array[1]; 配列実行結果配列解説 <?phpでは、PHPプログラムを開始しています。 $array = [“りんご”, “れもん”, “もも”];では、$array配列に”りんご”, “れもん”, “もも”を代入しています。 print_r($array);では、$array配列を表示しています。 echo $array[1];では、$array配列の1番目のインデックスで指定した、れもんを表示しています。連想配列連想配列は、添字（インデックス）の代わりにデータ（value）を入れる箱に「key」という任意の名前をつけて管理します。つまり、連想配列ではインデックスではなく、任意の文字列であるkeyを利用してvalueを抽出できます。連想配列サンプルコード <?php $array = ["apple" => "りんご", "lemon" => "れもん", "peach" => "もも"]; print_r($array); echo $array["lemon"]; 連想配列実行結果連想配列解説 <?phpでは、PHPプログラムを開始しています。 $array = [“apple” => “りんご”, “lemon” => “れもん”, “peach” => “もも”];では、$array配列に”apple” => “りんご”, “lemon” => “れもん”, “peach” => “もも”を代入しています。 print_r($array);では、$array配列を表示しています。 echo $array[“lemon”];では、$array配列のkeyであるlemonで指定した、れもんを表示しています。 array_keys関数の使い方 PHPのarray_keys関数は、連想配列の「key」だけを取得する関数です。それでは、array_keys関数の使い方について見ていきましょう。 array_keys関数で「key」だけを抽出する次のように、array_keys関数の引数に連想配列を渡すことで、「key」だけを抽出した配列として返却します。 array_keys($連想配列) array_keys関数で検索するvalueとセットになっているkeyを抽出第1引数に連想配列を渡し、第2引数に連想配列の中のvalueから検索したい値を渡すことで、検索するvalueとセットになっているkeyを抽出し配列にして返却します。第3引数はオプションなので、必須ではありません。第3引数は、boolean型のtrueを渡すことで、第2引数に渡した「検索するvalue」のデータ型まで完全に一致するものを連想配列の中から探します。デフォルトではboolean型のfalseが設定されているので、データ型が完全に一致しなくても検索対象です。 boolean型というのは、trueかfalseの2つの値のどちらかになる型の値です。 array_keys($連想配列, $検索するvalue [, $型チェック = FALSE]) [PR] 未経験からWebエンジニアを目指す方法とはarray_keys関数で「key」だけを抽出する方法を実際に書いてみましょうここでは、連想配列のkeyをすべて抽出する方法について見ていきましょう。サンプルコード <?php $array = ["apple" => "りんご", "lemon" =>

PHP

Pythonにおけるrandomライブラリのsampleについて現役エンジニアが解説【初心者向け】

Pythonにおけるrandomライブラリのsampleについて、TechAcademyのメンター（現役エンジニア）が実際のコードを使用して初心者向けに解説します。そもそもPythonについてよく分からないという方は、Pythonとは何なのか解説した記事を読むとさらに理解が深まります。なお本記事は、TechAcademyのオンラインブートキャンプPython講座の内容をもとに紹介しています。田島悠介今回は、Pythonに関する内容だね！大石ゆかりどういう内容でしょうか？田島悠介 Pythonにおけるrandomライブラリのsampleについて詳しく説明していくね！大石ゆかりお願いします！この記事では、Pythonにおけるrandomライブラリのメソッドsampleの使い方について解説します。目次 randomとは sampleとは sampleの使い方 sampleを利用してリストデータからランダムに複数の要素を取得してみようまとめ randomとは randomというのは、Pythonにおいて疑似乱数を生成したり、ランダムな処理をするのに必要なクラスやメソッドが用意されているモジュールです。実際の処理では、基本的にランダムな小数を生成するrandom関数を用いて様々な処理が実装されているそうです。 [PR] 未経験からWebエンジニアを目指す方法とはsampleとは sampleはrandomモジュールのメソッドで、リストやタプルなどの複数の要素を持つデータから、ランダムでいくつかの要素を抽出するためのメソッドです。 sampleは重複を許さずに複数の要素を抽出するためのメソッドです。他のランダムに要素を抽出する方法として、1つだけ要素を抽出するchoiceメソッド、重複を許して複数の要素を抽出するchoicesメソッドがあります。 sampleの使い方 sampleの使い方は、 random.sample(要素を抽出したい変数, 抽出したい要素数) となります。第1引数の「要素を抽出したい変数」には、リストやタプルなどの複数要素を持つデータ型の変数を指定します。第2引数の「抽出したい要素数」には、第1引数から抽出したい要素の数を整数でしていしますが、要素数よりも多いとエラーが生じてしまうので注意しましょう。また、返り値としては、抽出された要素のリスト型データが返ってきます。特に、ランダムな整数のリストがほしい場合などは、range関数を用いて、 random.sample(range(10000), 10) などのようにすると高速で処理ができます。 sampleを利用してリストデータからランダムに複数の要素を取得してみようそれでは、実際にsampleメソッドを用いてリストデータからランダムに要素を抽出する方法について確認してみましょう。 # randomモジュールのインポート >>> import random # 抽出に使うリストデータを用意 >>> sample_list = ["red", "green", "blue", "yellow"] # sampleメソッドを使って要素を2つランダムに抽出 >>> extracted = random.sample(sample_list, 2) # 表示して確認 >>> extracted ['red', 'green'] # もう一度同じように抽出してみる >>> extracted = random.sample(sample_list, 2) # 表示して抽出される要素が変わることを確認 >>> extracted ['blue', 'yellow'] # 要素数よりも多く抽出しようとするとエラーが出る >>> extracted = random.sample(sample_list, 5) Traceback (most recent call last): File "<stdin>", line 1, in <module> raise ValueError("Sample larger than population or is negative") ValueError: Sample larger than

Python

Node.jsでhttps.getしてJSONパースする方法【初心者向け】

Node.jsでhttpsでgetしてJSONパースする方法を解説します。簡単なプログラムを書きながら説明しているので、ぜひ参考にしてみてください。なお本記事は、TechAcademyのNode.jsオンライン講座の内容をもとに作成しています。田島悠介今回はWeb上で情報を取得する方法について学習してみようか。大石ゆかり田島メンター！具体的には何を使うんですか～？田島悠介ここで利用するのはhttpsモジュールとJSONパースだね。まずはそれぞれの役割について解説しよう。大石ゆかり分かりました。よろしくお願いします！ Node.jsでhttps getとは Node.jsでhttps getするとは、httpsモジュールを使用してgetメソッドを使用してURLで指定した情報を取得することです。モジュールとはnpmで管理されている便利な機能の事です。 npmに関しての記事も参考にしてみてください。 httpsとは、Hyper Text Transfer Protocol Secureの略です。もともとhttpという通信規格でインターネット通信を行っていました。 httpをより安全にしたものがhttpsで、暗号化してデータ通信を行います。 JSONパースとは JSONパースするとは、JSONのデータを解析して使用するという事です。ここでの説明ではデータ量が少ないJSONを使用します。実務では、データ量が多くなると、そのままでは読みづらいため、JSONデータをパースする必要があります。 JSONとは「JavaScript Object Notation 」の略で、JavaScriptのオブジェクトの記法として開発されました。 JSONの簡単な例として次のような記載を行います。 JSONデータ例 {"a":"現役エンジニア","b":"短期集中","c":"効率的学習"} 解説 aの中に現役エンジニアが入っているというような考え方で記載します。田島悠介 httpsモジュールと、JSONパースについての説明だよ。大石ゆかり httpsモジュールで取得したJSONのデータを使うためにパース、解析を行うという形ですね。田島悠介次にそれぞれの基本の書き方と、実際の例を確認してみよう。 [PR] 未経験からWebエンジニアを目指す方法とはNode.jsでhttps.getする方法ソースコード let https = require('https'); const URL = '取得するJSONのURL'; https.get(URL, function (res) { }); 解説 1行目のlet https = require(‘https’);では、httpsモジュールを取得して変数httpsに代入しています。 npm requireについての記事も参考にしてみて下さい。 letで宣言する変数は、ブロックスコープと呼ばれる限られた範囲で使用できます。特徴として、変数名の重複ができないため、不具合が発生しづらいです。変数とは、値を入れる箱のようなものです。 2行目のconst URL = ‘取得するJSONのURL’;では、取得するJSONのURLで指定したURLを定数URLに代入しています。 constは定数と呼ばれ、変更できない決まった変数です。 3行目のhttp.get(URL, function (res) {では、getメソッドを使用しています。 URLのパラメーター部分にはURL以外も指定する事ができます。 function(res)では、実際の処理を記載します。 4行目の});では3行目の処理を終了しています。指定可能なパラメーター hostname port path header 指定可能なパラメーター解説 hostnameはホスト名かIPアドレスです。住所のようなもので通常はlocalhostになります。 portはポート番号です。hostnameに接続した際の入り口の場所ようなもので、通常は80です。 pathはパスです。パスとはURLのようなアドレス等が入ります。また、クエリ文字列と呼ばれる要求値を含むパスである事もあります。クエリ文字を含むパスとは、検索サイトで検索する際に含まれるパスです。例えば、「プログラミング」とgoogleで検索する場合は、次のようなパスになります。「https://www.google.co.jp/search?q=プログラミング」この最後の「プログラミング」部分がクエリ文字になります。headerとは、httpsを使用して通信を行う際のヘッダー情報です。 Node.jsでJSONをパースする方法基本のコード var json = '{"a":"短期集中", "b":"42"}'; JSON.parse(json); 解説 1行目のvar json = ‘{“a”:”短期集中”, “b”:”42″}’;では、JSONデータを変数jsonに代入しています。 varで宣言した変数は自由に関数内で利用できます。 2行目のJSON.parse(json);でjsonに入ったJSONデータをパースしています。 Node.jsでhttpsでgetしてJSONパースを実際にやってみようソースコード const https = require('https'); const req = https.request('https://qiita.com/wakaba130/items/5f54aed913156dc4438f.json', (res) => {

Node.js

PythonでCSVファイルを作成する方法を現役エンジニアが解説【初心者向け】

PythonでCSVファイルを作成する方法について、テックアカデミーのメンター（現役エンジニア）が実際のコードを使用して初心者向けに解説します。 CSVファイルとは、Comma Separated Valueの略です。 Comma Separated Valueというのは、カンマで（Comma）区切った（Separated）値（Value）という意味です。例えば、Excelのデータも、カンマで区切ったデータです。そのため、CSVファイルはExcelで利用できます。つまり、ExcelのデータはCSVファイルとして利用することが可能だということです。注意点としては、Excelファイルにあるデータすべてを、1つのCSVファイルとして利用できないことです。 Excelファイルの1シートずつをCSVファイルに変換します。 CSVファイルは、Excelだけでなく、ACCESSやMySQLなどのデータベースアプリケーション、そしてメモ帳でも使用できます。 PythonでCSVファイルを作成できるということは、様々なアプリケーションで利用可能なCSVファイルを自動処理することができるようになるということです。この記事を機に、現在の実務でもPythonを活用できるように学習していきましょう。目次bs4とは？bs4のインストールbs4の使い方bs4を利用してスクレイピングしてみようまとめPythonを学習中の方へそもそもPythonについてよく分からないという方は、Pythonとは何なのか解説した記事を読むとさらに理解が深まります。田島悠介今回は、Pythonに関する内容だね！大石ゆかりどういう内容でしょうか？田島悠介 PythonでCSVファイルを作成する方法について詳しく説明していくね！大石ゆかりお願いします！ CSVファイルの特徴と作成時の注意点 CSVファイルとは、Comma Separated Valueの略称を指し、データを「, 」（カンマ）で区切ってデータを保存するファイル形式のことです。下記は、実際の具体的なCSVファイルのデータです。青森,apple,120 山形,cherry,50 栃木,strawberry,90 岡山,peach,350 愛媛,orange,100 沖縄,pineapple,200 CSVファイルのデータは、「何県のどの果物が1個あたり何円で売られているのか」といった情報をまとめたものです。 CSVファイルを使えば、簡単に情報を管理できます。 CSVモジュールの使い方 PythonでCSVファイルを扱うには、最初にCSVモジュールをimportする必要があります。 Importのやり方は非常に簡単で、以下のように実施します。 import csv 次に、CSVファイルの読み込み方について見ていきましょう。既存のファイル名を指定し、読み込み用のオープンモードでopenします。 CSVファイルの読み込みにはreader()というメソッドを使用し、リーダーというインスタンスを生成することが可能です。リーダーに対してfor文を使うと、読み込んだCSVファイルの各行を取得できます。また、さらにfor文を使った場合、1行内の各列の要素についても取得できます。以下が実際にCSVファイルを読み込む際のコード例です。コード import csv file = open('fruits.csv', 'r') data = csv.reader(file) for row in data: for col in row: print(col, end=',') print() file.close() 解説 1行目のimport csvでは、CSVファイルを利用するためのライブラリをインポートしています。 2行目のfile = open(‘fruits.csv’, ‘r’)では、fruits.csvという名前のCSVファイルをrという指定で読み込むためにopenメソッドで開いています。その後、開いた内容をfileオブジェクトに代入しています。 fileには次のようなデータが入っています。青森,apple,120 山形,cherry,50 栃木,strawberry,90 岡山,peach,350 愛媛,orange,100 沖縄,pineapple,200 3行目のdata = csv.reader(file)では、2行目で用意したfileオブジェクトの内容を、csv.reader()というメソッドを利用して反復処理してdataオブジェクトに代入しています。 dataオブジェクトには次のような配列データが入っています。 ['青森', 'apple', '120'] ['山形', 'cherry', '50'] ['栃木',

Python

記事を検索

ニュース

インタビュー

テクノロジー

キャリア

お問い合わせ

Pythonにおけるbs4のインストール方法と使い方を現役エンジニアが解説【初心者向け】

監修してくれたメンター

nakamoto

目次

bs4とは？

bs4のインストール

bs4の使い方

サンプルコード

実行結果

解説

bs4を利用してスクレイピングしてみよう

urllibのインストール

サンプルコード

実行結果

解説

まとめ

Pythonを学習中の方へ

関連するキーワード

あわせてよく読まれている記事

MySQLでWHEREを使ってレコードの抽出条件を指定する方法【初心者向け】

jQueryのAjaxでPOST送信してPHPで受け取る方法【初心者向け】現役エンジニアが解説

PHPで配列のkeyを取得する方法を現役エンジニアが解説【初心者向け】

Pythonにおけるrandomライブラリのsampleについて現役エンジニアが解説【初心者向け】

Node.jsでhttps.getしてJSONパースする方法【初心者向け】

PythonでCSVファイルを作成する方法を現役エンジニアが解説【初心者向け】

TechAcademyから
現役エンジニアの方へ
お知らせ

記事を検索

ニュース

インタビュー

テクノロジー

キャリア

お問い合わせ

監修してくれたメンター

nakamoto

目次

bs4とは？

bs4のインストール

bs4の使い方

サンプルコード

実行結果

解説

bs4を利用してスクレイピングしてみよう

urllibのインストール

サンプルコード

実行結果

解説

まとめ

Pythonを学習中の方へ

記事を検索

関連するキーワード

関連する記事

あわせてよく読まれている記事

TechAcademyから 現役エンジニアの方へ お知らせ

TechAcademyから
現役エンジニアの方へ
お知らせ