Jubatus ハッカソンに参加している(とりあえず1日目)
Jubatus ハッカソン with 読売新聞 に参加している。会場はドワンゴさん(歌舞伎座タワー)。きれい。
ハッカソンということで、土日の両日ですが、もう頭も動かないし体調にも影響でそうなので終電間際に帰ってきた。とりあえず今日やったことを、日報的にメモっておこう。
- チームビルディングの時間があったけど、マイペースにやりたいので一人チームで
- Jubatus初めてなので、インストールから始める
- いくつかチュートリアルをやる
- 次にどうしようかということで、せっかく読売新聞さん共催なので、新聞データでなんかやろうと思う
- これまでデータ周辺でどういうことやってきた、やりたいのか簡単に聞いてみる
- 「(物理)記事にある複数の見出しを、Webの記事用に一つにする」というのをやっているらしく、興味深かったが今回のデータではどうしようもない...
分類(classifier)APIのチュートリアルを基に、新聞の見出し(ヘッドライン)と記事ジャンルの組合せを機械学習してみる
mecab を使うためには、Jubatus のインストール(configure時)に
--enable-mecabe
というオプションを指定する必要があるが、Mac OS X(Yosemite)では試行錯誤してもダメだった
いろいろ調べながらやったりしているのもあるけど、時間かかり過ぎである(これしかできていない)。
明日はどうしよう。こういうのはアイデアが重要ですね... 明日また書く。