形態素解析器
ちょっとメモ。
ChaSen - Wikipedia
MeCab - Wikipedia
茶筅は有名ですよね。授業でも使ってます。で、派生(といっても今はまったく別物らしいですが)でMeCab(メカブ)というのがあるようです。しかも茶筅より速いとか。すごいなぁ。
MeCabのページに、比較がありました。Viterbiアルゴリズム。
Googleが日本語n-gramを作るときにも使ったそうです。
大規模日本語 n-gram データの公開 - Google Japan Blog
またMeCabの開発者さんのブログがおもしろそう。
きまぐれ日記
数日前にお父さんになったようで、おめでとうございます。何故か2007年2月の記事を見てた。
それから茶筅の開発に携わった人(現在Yahoo! Japanにいるらしい)が筑波大学で講演してくれると聞いて非常に期待しているんですが、その講演が自然言語処理の授業と被ってる(時間帯的な意味で)との噂も聞いています。