mecab-ipadicでconfigure実行したらmatrix.defが無いというエラー

TL;DR

https://github.com/taku910/mecab/tree/master/mecab-ipadic を取得して ./configure --with-charset="utf-8" と実行したら configure: error: cannot find sources (matrix.def) in . or .. というエラーが出て困ってます。解決策を知っている方ぜひ教えてください。

経緯と詳細な手順

rmecabをインストールしたくて、RMeCab - RとLinuxと…に沿ってまずはMeCabをインストールしました。

MeCab - Wikipediaによると公式サイトはsourceforge.netだったようですが、実際のページはMeCab: Yet Another Part-of-Speech and Morphological Analyzerとgooglecodeにあり、ソースをダウンロードしようと探すとGoogle Project Hostingとあり、githubに移ったようです。

ということでtaku910/mecabからソースを取得してビルドしてみました。確認した環境はOS X 10.10.3です。

mecabのconfigureオプションはMac OS X 版バイナリ のインストール方法の手順に合わせて --with-charset="utf8" をつけました。mecabは無事ビルド、インストール出来ました。

git clone https://github.com/taku910/mecab
cd mecab
./configure --with-charset="utf8"
make
make check
sudo make install

次はmecab-ipadicをビルドしようとしたのですが、configureでエラーになりました。configureのオプションは上記のリンクの「c. 辞書もインストールします」の説明に合わせて --with-charset="utf-8" をつけています。

$ cd ../mecab-ipadic
$ ./configure --with-charset="utf-8"
configure: error: cannot find sources (matrix.def) in . or ..

matrix.defがどういうものか私は全く知らないのですが、mecab-jumandicにも同名のファイルがあったので、それを使ってビルドしてみたら通ることは通りました。

ln -s ../mecab-jumandic/matrix.def
./configure --with-charset="utf-8"
make
sudo make install

ただ、「すもももももももものうち」で試してみると「すもも」「も」の後の「もも」が正しく切り出せていません。

$ mecab
すもももももももものうち
すもも  名詞,一般,*,*,*,*,すもも,スモモ,スモモ
も  助詞,係助詞,*,*,*,*,も,モ,モ
も  助詞,係助詞,*,*,*,*,も,モ,モ
も  助詞,係助詞,*,*,*,*,も,モ,モ
も  助詞,係助詞,*,*,*,*,も,モ,モ
も  助詞,係助詞,*,*,*,*,も,モ,モ
もの  名詞,非自立,一般,*,*,*,もの,モノ,モノ
うち  名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ
EOS

ということで、mecab-ipadicの正しいビルド方法をご存知のかたはぜひ教えてください!

と書いてたら、イシュー立てるべきと気づいたので立てました。mecab-ipadicでconfigure実行したらmatrix.defが無いというエラーが出る · Issue #18 · taku910/mecab ぜひそちらにコメントお願いします!

2015-06-17追記

イシューにコメントを頂きました。 https://github.com/taku910/mecab/issues/18#issuecomment-112474144

IPA辞書は http://taku910.github.io/mecab/#download からtarballをダウンロードするのが推奨とのことです。