PHPでMeCabを使う方法を現役エンジニアが解説【初心者向け】

初心者向けにPHPでMeCabを使う方法について現役エンジニアが解説しています。MeCabはオープンソースの日本語形態素解析エンジンで、品詞や活用などテキストを解析可能です。今回はインストール方法、導入確認や使い方を解説します。

TechAcademyマガジンは受講者数No.1のオンラインプログラミングスクールTechAcademy [テックアカデミー]が運営。初心者向けに解説した記事を公開中。現役エンジニアの方はこちらをご覧ください。

PHPでMeCabを使う方法について、TechAcademyのメンター(現役エンジニア)が実際のコードを使用して初心者向けに解説します。

 

そもそもPHPについてよく分からないという方は、PHPとは何なのか解説した記事を読むとさらに理解が深まるでしょう。

 

なお本記事は、TechAcademyのオンラインブートキャンプPHP/Laravel講座の内容をもとに紹介しています。

 

田島悠介

今回は、PHPに関する内容だね!

大石ゆかり

どういう内容でしょうか?

田島悠介

PHPでMeCabを使う方法について詳しく説明していくね!

大石ゆかり

お願いします!

 

目次

 

MeCabとは

MeCabはオープンソースの日本語形態素解析エンジンです。

形態素解析とは、テキストデータから品詞や活用などを解析することをいいます。

MeCabを使うことで、日本語のテキストデータから単語を抽出できます。

 

[PR] PHPのプログラミングで挫折しない学習方法を動画で公開中

MeCabの導入手順

PHPでMeCabを利用するために「php-mecab」を使用していきましょう。

※php-mecabは2020年9月6日時点でMITライセンスです。

※lamp環境(PHP7)で動作確認をした手順です。

※tmpディレクトリ にインストールをしていきます。

全体の流れとしては

  1. MeCabのインストール
  2. 辞書のインストール
  3. php-mecabのインストール
  4. 導入確認

という流れで進めていきます。

1.MeCabのインストール

# cd /tmp
# wget "https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7cENtOXlicTFaRUE" -O mecab-0.996.tar.gz
# tar zxf mecab-0.996.tar.gz
# cd mecab-0.996
# ./configure --enable-utf8-only --with-charset=utf8
# make
# make install

 

2.辞書のインストール

# cd /tmp
# wget "https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7MWVlSDBCSXZMTXM" -O mecab-ipadic-2.7.0-20070801.tar.gz
# tar zxf mecab-ipadic-2.7.0-20070801.tar.gz
# cd mecab-ipadic-2.7.0-20070801
# ./configure --with-charset=utf8
# make
# make install

 

3.php-mecabのインストール

# cd /tmp
# git clone https://github.com/rsky/php-mecab.git
# cd php-mecab/mecab
# phpize
# ./configure --with-mecab=/usr/local/bin/mecab-config
# make
# make install
# echo 'extension=mecab.so' > /usr/local/etc/php/conf.d/docker-php-ext-mecab.ini

 

4.導入確認

# mecab -v
mecab of 0.996

実際に書いてみよう

「明日は運動会に行く予定です。お弁当が楽しみです。」

という文章をMeCabを使って形態素解析します。

以下のPHPファイルを用意しました。

<?php
$text = '明日は運動会に行く予定です。お弁当が楽しみです。';

$MeCab = new \MeCab\Tagger();
$nodes = $MeCab->parseToNode($text);

foreach ($nodes as $n) {
    echo "---------------------------". "\n";
    echo "[" . $n->getSurface() . "]" . "\n";
    echo $n->getFeature() . "\n";
}
?>

このファイルを実行します。

# php index.php

動作結果

---------------------------
[]
BOS/EOS,*,*,*,*,*,*,*,*
---------------------------
[明日]
名詞,副詞可能,*,*,*,*,明日,アシタ,アシタ
---------------------------
[は]
助詞,係助詞,*,*,*,*,は,ハ,ワ
---------------------------
[運動会]
名詞,一般,*,*,*,*,運動会,ウンドウカイ,ウンドーカイ
---------------------------
[に]
助詞,格助詞,一般,*,*,*,に,ニ,ニ
---------------------------
[行く]
動詞,自立,*,*,五段・カ行促音便,基本形,行く,イク,イク
---------------------------
[予定]
名詞,サ変接続,*,*,*,*,予定,ヨテイ,ヨテイ
---------------------------
[です]
助動詞,*,*,*,特殊・デス,基本形,です,デス,デス
---------------------------
[。]
記号,句点,*,*,*,*,。,。,。
---------------------------
[お]
接頭詞,名詞接続,*,*,*,*,お,オ,オ
---------------------------
[弁当]
名詞,一般,*,*,*,*,弁当,ベントウ,ベントー
---------------------------
[が]
助詞,格助詞,一般,*,*,*,が,ガ,ガ
---------------------------
[楽しみ]
名詞,一般,*,*,*,*,楽しみ,タノシミ,タノシミ
---------------------------
[です]
助動詞,*,*,*,特殊・デス,基本形,です,デス,デス
---------------------------
[。]
記号,句点,*,*,*,*,。,。,。
---------------------------
[]
BOS/EOS,*,*,*,*,*,*,*,*

文章を形態素解析できていることを確認できました。

まとめ

日本語の文章を解析したい時は、MeCabを使うと簡単に形態素解析をできます。

執筆してくれたメンター

土田隼平(つちだしゅんぺい)

フリーのWebエンジニアです。

最近までは求人サービスや画像共有システム、ECサービスの開発・運用をやってました。

趣味はラジオ(特にオールナイトニッポンとJUNK)を聞くことや近所の散歩です。

今の最重要ミッションは「運動不足解消」です。

 

大石ゆかり

PHPでMeCabを使う方法がよく分かったので良かったです!

田島悠介

ゆかりちゃん、これからも分からないことがあったら質問してね!

大石ゆかり

分かりました。ありがとうございます!

 

TechAcademyでは、初心者でも最短4週間でPHPやフレームワークのLaravelを使ってWebアプリケーション開発を習得できるオンラインブートキャンプPHP/Laravel講座を開催しています。

挫折しない学習方法を知れる説明動画や現役エンジニアとのビデオ通話とチャットサポート、学習用カリキュラムを体験できる無料体験も実施しているので、ぜひ参加してみてください。