PHPでMeCabを使う方法を現役エンジニアが解説【初心者向け】
初心者向けにPHPでMeCabを使う方法について現役エンジニアが解説しています。MeCabはオープンソースの日本語形態素解析エンジンで、品詞や活用などテキストを解析可能です。今回はインストール方法、導入確認や使い方を解説します。
テックアカデミーマガジンは受講者数No.1のプログラミングスクール「テックアカデミー」が運営。初心者向けにプロが解説した記事を公開中。現役エンジニアの方はこちらをご覧ください。 ※ アンケートモニター提供元:GMOリサーチ株式会社 調査期間:2021年8月12日~8月16日 調査対象:2020年8月以降にプログラミングスクールを受講した18~80歳の男女1,000名 調査手法:インターネット調査
PHPでMeCabを使う方法について、TechAcademyのメンター(現役エンジニア)が実際のコードを使用して初心者向けに解説します。
そもそもPHPについてよく分からないという方は、PHPとは何なのか解説した記事を読むとさらに理解が深まるでしょう。
なお本記事は、TechAcademyのオンラインブートキャンプPHP/Laravel講座の内容をもとに紹介しています。
今回は、PHPに関する内容だね!
どういう内容でしょうか?
PHPでMeCabを使う方法について詳しく説明していくね!
お願いします!
目次
MeCabとは
MeCabはオープンソースの日本語形態素解析エンジンです。
形態素解析とは、テキストデータから品詞や活用などを解析することをいいます。
MeCabを使うことで、日本語のテキストデータから単語を抽出できます。
[PR] PHPを学んで未経験からWebエンジニアを目指す方法とは
MeCabの導入手順
PHPでMeCabを利用するために「php-mecab」を使用していきましょう。
※php-mecabは2020年9月6日時点でMITライセンスです。
※lamp環境(PHP7)で動作確認をした手順です。
※tmpディレクトリ にインストールをしていきます。
全体の流れとしては
- MeCabのインストール
- 辞書のインストール
- php-mecabのインストール
- 導入確認
という流れで進めていきます。
1.MeCabのインストール
# cd /tmp
# wget "https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7cENtOXlicTFaRUE" -O mecab-0.996.tar.gz
# tar zxf mecab-0.996.tar.gz
# cd mecab-0.996
# ./configure --enable-utf8-only --with-charset=utf8
# make
# make install
2.辞書のインストール
# cd /tmp
# wget "https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7MWVlSDBCSXZMTXM" -O mecab-ipadic-2.7.0-20070801.tar.gz
# tar zxf mecab-ipadic-2.7.0-20070801.tar.gz
# cd mecab-ipadic-2.7.0-20070801
# ./configure --with-charset=utf8
# make
# make install
3.php-mecabのインストール
# cd /tmp
# git clone https://github.com/rsky/php-mecab.git
# cd php-mecab/mecab
# phpize
# ./configure --with-mecab=/usr/local/bin/mecab-config
# make
# make install
# echo 'extension=mecab.so' > /usr/local/etc/php/conf.d/docker-php-ext-mecab.ini
4.導入確認
# mecab -v mecab of 0.996
実際に書いてみよう
「明日は運動会に行く予定です。お弁当が楽しみです。」
という文章をMeCabを使って形態素解析します。
以下のPHPファイルを用意しました。
<?php $text = '明日は運動会に行く予定です。お弁当が楽しみです。'; $MeCab = new MeCabTagger(); $nodes = $MeCab->parseToNode($text); foreach ($nodes as $n) { echo "---------------------------". "n"; echo "[" . $n->getSurface() . "]" . "n"; echo $n->getFeature() . "n"; } ?>
このファイルを実行します。
# php index.php
動作結果
--------------------------- [] BOS/EOS,*,*,*,*,*,*,*,* --------------------------- [明日] 名詞,副詞可能,*,*,*,*,明日,アシタ,アシタ --------------------------- [は] 助詞,係助詞,*,*,*,*,は,ハ,ワ --------------------------- [運動会] 名詞,一般,*,*,*,*,運動会,ウンドウカイ,ウンドーカイ --------------------------- [に] 助詞,格助詞,一般,*,*,*,に,ニ,ニ --------------------------- [行く] 動詞,自立,*,*,五段・カ行促音便,基本形,行く,イク,イク --------------------------- [予定] 名詞,サ変接続,*,*,*,*,予定,ヨテイ,ヨテイ --------------------------- [です] 助動詞,*,*,*,特殊・デス,基本形,です,デス,デス --------------------------- [。] 記号,句点,*,*,*,*,。,。,。 --------------------------- [お] 接頭詞,名詞接続,*,*,*,*,お,オ,オ --------------------------- [弁当] 名詞,一般,*,*,*,*,弁当,ベントウ,ベントー --------------------------- [が] 助詞,格助詞,一般,*,*,*,が,ガ,ガ --------------------------- [楽しみ] 名詞,一般,*,*,*,*,楽しみ,タノシミ,タノシミ --------------------------- [です] 助動詞,*,*,*,特殊・デス,基本形,です,デス,デス --------------------------- [。] 記号,句点,*,*,*,*,。,。,。 --------------------------- [] BOS/EOS,*,*,*,*,*,*,*,*
文章を形態素解析できていることを確認できました。
まとめ
日本語の文章を解析したい時は、MeCabを使うと簡単に形態素解析をできます。
執筆してくれたメンター
土田隼平(つちだしゅんぺい)
フリーのWebエンジニアです。 最近までは求人サービスや画像共有システム、ECサービスの開発・運用をやってました。 趣味はラジオ(特にオールナイトニッポンとJUNK)を聞くことや近所の散歩です。 今の最重要ミッションは「運動不足解消」です。 |
PHPでMeCabを使う方法がよく分かったので良かったです!
ゆかりちゃん、これからも分からないことがあったら質問してね!
分かりました。ありがとうございます!
TechAcademyでは、初心者でもPHPやフレームワークのLaravelを使ってWebアプリケーション開発を習得できるオンラインブートキャンプPHP/Laravel講座を開催しています。
挫折しない学習方法を知れる説明動画や現役エンジニアとのビデオ通話とチャットサポート、学習用カリキュラムを体験できる無料体験も実施しているので、ぜひ参加してみてください。