inohilog

/var/log/inohiro

日記

  • 研究室の先輩方が主催する勉強会へ
    • http://qwik.jp/dbreading/17.html
    • イベントなどをよく合同でやる研究室のB4の人が発表していたので負けられないなと思った。次回は発表しよう
    • 企業がやっている研究だと製品とかサービスに直結しているものがあって、やっぱり面白いなと思った(ビジネス寄り?
  • TOEIC対策
    • ほとんどできてないぞ...
  • 以下、勉強会のメモ(ちゃんと論文名など書き足そう...)
* Session7
**
Drive-by Download Attack
fast-flux attack
MDNs

**
ページ解析、危険性検出のための2種類の手法
動的・静的な解析手法

既存の動的解析システムで安全なサイトを除外する
WEKA(機械学習プラットフォーム

**
Heat-seeking honeypot

* Session10
キーワードベースの画像検索エンジンの改善
nDCG(評価指標)

**
少ないテキストデータから動画像のサマライズを行う

**
画像の分類

Margin最大化
共起関係最大化

* Session15
**
集合拡張(Set expansion)
少数のシードから多くの(関連する)エンティティを取得

Google Sets, SEAL

大津のアルゴリズム

**
Webサイトの構造を使ってクラスタリング
アプリケーションが生成したページは類似している
URL

最長記述長
貪欲法

**
構造化データの抽出

名前付きエンティティ識別(Named Entity Recognition; NER)
既存手法は局所的な文脈のみに依存

整数計画法

* Session16
**
DipZoom
CDN

**
OSN(Open Social Network)

Social Cascade

**
Amazon Mechanical Turk
Turkalytics: Human Computation

http://www.google.com/recaptcha
https://www.mturk.com/mturk/welcome

Amazon Mechanical Truk におけるWorkerの状態遷移をモデル化


* Session18
**
ネットワーク構造の時系列構造変化を調べたい

フォロワーリスト、フォロワーそれぞれの登録時刻
フォロワーが少ないと精度が悪い

** 
Social Rating Networks

確率的生成モデル

**
Friendship prediction, Interest targeting

Friendsho-Interest Propergation model
Cold-start problem

* Session20
**
Neighbor Nearest Graph

Cosine similarity, Jaccard similarity

A Neighbor of a neighbor is also likely to be a neighbor

**
large graph

* Session24
**
情報拡散
Twitter上でどのようにハッシュタグが伝搬していくのか

**
twitter firehose

snowball sampling

**
the Web of short urls
powerlaw
Log Normal

累積分布関数
http://ja.wikipedia.org/wiki/%E7%A2%BA%E7%8E%87%E5%88%86%E5%B8%83#.E5.88.86.E5.B8.83.E9.96.A2.E6.95.B0

fb.me > bit.ly

* Session12
**
Semantic Relatedness: 単語間の意味的関係性
時系列に基づいて行った

ESA: Explicit Semantic Analysis
単語を概念ベクトルに変換
単語ごとの意味的関係性は、概念ベクトルのコサインをとる

提案手法では概念ベクトル+時系列データ
単語間の類似度で比較

時系列データを用いることで概念的な意味関係だけではわからなかった、テキスト間の潜在的な意味関係

**
評価極性辞書: 評価表現単語と、その極性の組を登録した辞書
単語そのものの意味だけでなく、文脈を読むことが必要である

**
Word Breaking 分かち書き

*
**
Q&Aサービス
リアルタイムQ&A

IM-an-Expert

**
IBM Timely
http://socialxyz.blogspot.com/2011/04/what-makes-social-business-better-than.html

Social Cordination

**
テキストベースの検索が主流である
テキストの表現力は低い
テキスト+画像の表現力

逆画像検索(TinEye)
http://www.tineye.com/

SURF特徴量
RankSVM