[OSGeoJapan-discuss] ツィッターからデータを収集するツールのご協力願い
wakasa masao
machio @ mac.com
2011年 3月 14日 (月) 03:16:32 EDT
若狹です。
現在twitterをクロールして有益な情報を蓄積するツールを一人でもりもり作っております。
とりあえず絞り込みとかまだできてないんですが
http://r9.tank.jp/view.php
のようなデータを自動で収集するところまで作りました。
このデータは表示してる情報の他に
・各ツィートにタグ付け(何の情報なのか)
・住所らしきものがあったら抽出
などとってります。
漏れが多々ある状態ではあるのですが。
※RTから始まる文字列は意図してはぶいていたり、指定のテキスト含まれてないと収集しないなど、実は重要な情報が出回ってるとアウトだったりもするので・・。
見た目部分はもうちょっとつくりこみますがそれほど作る気はありません。
一応携帯対応を想定しています。
理想を言えばスマホか携帯のGPSから緯度経度とって近い情報だけピックアップさせたいですが、たぶんそんなに情報ないきもするが・・。
で、以下の部分が原状足りてません
・サーバがない(現サーバは安いサーバのため、cronで収集をがんがんかけるとけられる)
=> PosgreSQLとかほしいけども・・現在MySQL
・GISらしく、住所らしき文字列からジオコーディングしたいんだが、データがない
=> オークニーさんに頼めばいいのかな・・
・ひとりで作ってるのでネタが・・
とりあえず、sinsai.infoと連動しようかとは思ってるのですが、原状のサイトでいっぱいのようなので、リンク程度でたぶん勝手にやってたほうがいいかなとふんでいます。
お忙しいとは思いますが、どなたかご協力していただけないでしょか?
宜しくお願い致します。
------------
wakasa masao
OSGeoJapan-discuss メーリングリストの案内