近状
- 結局,グループゼミでは論文紹介をやった
- "Fabian M. Suchanek, Serge Abiteboul, Pierre Senellart: PARIS: Probabilistic Alignment of Relations, Instances, and Schema. PVLDB 5(3): 157-168 (2011)"
- Relation (Predicate: SとOを結ぶ),Instance,Class(Schemaレベルの関係)のアライメントを同時にやる手法
- 具体的には,2オントロジ(とデータ)間の rdf:sameAs, rdfs:subClassOf, rdfs:subPropertyOf な関係を見つけ出す
- これまでに多くの手法は,それぞれ別々に注目して行うものが多かった
- また,学習データやパラメタチューニングが必要であった
- Relation, Instance, Class のアライメント情報を相互に利用することで,巨大な実世界のオントロジ(とそれを用いたデータ)に対して高精度の適合率,再現率を示した
- Function, Functionality という概念を使う(彼らが考えたものではない)
- モノ x,y 間の関係 r を考える r(x,y)
- 関係 r(x,y) において,与えられた第一引数(x)について,ただ一つの第二引数(y)が存在するとき,r は function である
- 関係 'wasBornIn'(出生地,人と場所の関係)は function である.なぜなら,ある人の出生地は一意に決まる
- 複数 y が得られる場合は function ではない.しかし,数を数えればそれっぽさがわかる(だいぶ適当...
- 関係 r が function であるとき,r(x,y) がオントロジAで存在し,かつ r(x,y') がオントロジBで存在する時,y と y' は等価である
- 逆関係 r^-1(y,x) も考える
- 各リソースの入次数などをもとに,確率的に等価っぽいリソース,サブクラス,サブプロパティな関係を見つける
- 自分の興味としては,type 情報がない RDF Class を分類する方法が知りたかったが,この研究はそういう感じではない
- 論文は読みやすかったが,Probabilistic な論文はあまり読み慣れていなくて,数式が大変だった(と言っても,そんなに難しくないはずだけど... これくらいで難しいと言っているとアレなのでは
その他
- 先週,初めて接骨院に行った.腰から曲がっているらしいので定期的に行きます :(
- 良い椅子を検討する.枕も変えるかな
- 研究のモチベーションが上がらなくて後回しになってしまって良くない.時間を確保して取り組まないと...
- 何が重要で優先しなければならないか十分考えているつもりだが,最適解じゃない方向に行動していることがあり,なんとかしないと
- 知識が無いことへの恐怖がある(別に最近始まったことではない)
- わりと新しいもの好きなので,れいるずの新機能とか,最近話題の全文検索エンジンとか気になるし,キャッチアップしなきゃと思う
- その一方,もっと本質的な(計算機科学的な)知識ももちろん必要だけど足りているとは到底思えず,勉強しなきゃ・したいと思う...
- 代わりのいない人になりたい(重要)
- 忍耐力というか,めんどくさいと思う閾値を高くしたい