- 以下、勉強会のメモ(ちゃんと論文名など書き足そう...)
* Session7
**
Drive-by Download Attack
fast-flux attack
MDNs
**
ページ解析、危険性検出のための2種類の手法
動的・静的な解析手法
既存の動的解析システムで安全なサイトを除外する
WEKA(機械学習プラットフォーム
**
Heat-seeking honeypot
* Session10
キーワードベースの画像検索エンジンの改善
nDCG(評価指標)
**
少ないテキストデータから動画像のサマライズを行う
**
画像の分類
Margin最大化
共起関係最大化
* Session15
**
集合拡張(Set expansion)
少数のシードから多くの(関連する)エンティティを取得
Google Sets, SEAL
大津のアルゴリズム
**
Webサイトの構造を使ってクラスタリング
アプリケーションが生成したページは類似している
URL
最長記述長
貪欲法
**
構造化データの抽出
名前付きエンティティ識別(Named Entity Recognition; NER)
既存手法は局所的な文脈のみに依存
整数計画法
* Session16
**
DipZoom
CDN
**
OSN(Open Social Network)
Social Cascade
**
Amazon Mechanical Turk
Turkalytics: Human Computation
http://www.google.com/recaptcha
https://www.mturk.com/mturk/welcome
Amazon Mechanical Truk におけるWorkerの状態遷移をモデル化
* Session18
**
ネットワーク構造の時系列構造変化を調べたい
フォロワーリスト、フォロワーそれぞれの登録時刻
フォロワーが少ないと精度が悪い
**
Social Rating Networks
確率的生成モデル
**
Friendship prediction, Interest targeting
Friendsho-Interest Propergation model
Cold-start problem
* Session20
**
Neighbor Nearest Graph
Cosine similarity, Jaccard similarity
A Neighbor of a neighbor is also likely to be a neighbor
**
large graph
* Session24
**
情報拡散
Twitter上でどのようにハッシュタグが伝搬していくのか
**
twitter firehose
snowball sampling
**
the Web of short urls
powerlaw
Log Normal
累積分布関数
http://ja.wikipedia.org/wiki/%E7%A2%BA%E7%8E%87%E5%88%86%E5%B8%83#.E5.88.86.E5.B8.83.E9.96.A2.E6.95.B0
fb.me > bit.ly
* Session12
**
Semantic Relatedness: 単語間の意味的関係性
時系列に基づいて行った
ESA: Explicit Semantic Analysis
単語を概念ベクトルに変換
単語ごとの意味的関係性は、概念ベクトルのコサインをとる
提案手法では概念ベクトル+時系列データ
単語間の類似度で比較
時系列データを用いることで概念的な意味関係だけではわからなかった、テキスト間の潜在的な意味関係
**
評価極性辞書: 評価表現単語と、その極性の組を登録した辞書
単語そのものの意味だけでなく、文脈を読むことが必要である
**
Word Breaking 分かち書き
*
**
Q&Aサービス
リアルタイムQ&A
IM-an-Expert
**
IBM Timely
http://socialxyz.blogspot.com/2011/04/what-makes-social-business-better-than.html
Social Cordination
**
テキストベースの検索が主流である
テキストの表現力は低い
テキスト+画像の表現力
逆画像検索(TinEye)
http://www.tineye.com/
SURF特徴量
RankSVM