inohilog

/var/log/inohiro.log

やったことメモ

  • 18日(水)
    • 大学へ行って、ゼミ合宿のチームミーティングに出席
    • gSpan について発表
    • グループゼミに出席
      • 他の分野の研究者と研究をやるのは、思ったよりも時間がかかると思うよ、と先生に言われた
  • 19日(木)
    • 環境はだいぶ揃った
    • 垂直表現でRDFデータをRDBに格納するときに、rdf:type 毎のテーブルに分割せずに、一度すべてを同じテーブルに格納し、水平表現に入れなおすときに分割する方法をコーディング(こっちのほうがシンプルだった)
      • sequel が便利すぎてヤバイ
    • 垂直表現でRDFデータをRDBに格納するときに、マルチスレッドでファイルを読んでテーブルに格納することで高速化ができそうであると考えているが、結局ディスクがネックになるかも
      • マルチスレッドにおけるタスク管理というか、そのへんの知識が乏しいので、書いてみたい(タスクリストの書き換えはロックしないといけない、などなど)
      • しかし、インターンシップ中に利用するデータは、rdf:type がきっちり決まっていて、水平表現で利用できそうなので、垂直表現で格納するときの高速化は、また後ほど考えることにする
    • 実験に用いるデータについてディスカッションしてもらう
      • OLAPでできること・できないこと、SPARQLでできること・できないこと。利用者の立場、提供者(データ配信者)の立場をよく考えて説明をしないとダメだ
      • 多値の取り扱いがやはり問題になる。論文を探してみる
      • とりあえずこれを試してみよう、というデータセットを決めた