inohilog

/var/log/inohiro.log

DBLP Complete search の結果をスクレイピング

  • DBLP Complete search (http://www.dblp.org/search/) の結果をスクレイピング
    • 結果をまとめる(Wikiに貼る)必要があったんだけど,コピペとか面倒で
    • 最初はXMLを対象に始めたが,必要なデータが CDATA で書かれていたから,最終的に正規表現使わないといけないかもと思ってJSON形式を使った
    • "dblp:" が接頭辞のスキーマはどこに定義されているんだろう(XMLも同様)
* Title
** Author, Author, Author, ...
** Conference name

という感じに出てきます.


追記

  • gist の利用には,gisty を使っているんですが,clone ができなくて困ってる
    • GISTY_DIR, GISTY_ACCESS_TOKEN, GISTY_SSL_CA(="/System/Library/OpenSSL/cert.pem"), GISTY_SSL_VERIFY(="none") は設定してる
    • "git config --global github.token ***" も設定するというブログが幾つかあるが,そのTokenはどこで手に入れれば(Githubの自分のプロフィールページにあるらしいが,見当たらない)
$ gisty sync                                                                                                                                        
Cloning into 2692479...
Permission denied (publickey).
fatal: The remote end hung up unexpectedly
Cloning into 1395470...
Permission denied (publickey).
fatal: The remote end hung up unexpectedly
...
---
sync finished.