« Flickr clip 9/12-2 | メイン | Web clip 9/13 »

« 近況でも | Diary | でーきたできたできたー:) »

棚卸ふたたび and アイデアメモ

9/1 9/13
TrekLens 4800+ 4800+ and 1400
TrekNature 1500+ 1400
TE Africa 200
TE Asia 3100+ 1100
TE Central America 90(某H依頼済)
TE Europe 3300 3300 and 1600
TE Middle East 600+ 800
TE North America 2800+ 900
TE Oceania 200
TE South America 400(某H依頼済)
TE Total 16100+ 15700+ (依頼済除く)
Flickr 2400+ 700+

ふむ。まぁ前回は細かく取ってないからなぁ。
9/1-12に消化できたのが NA:2800+(7) TN:1500+(3) Asia:3100+(7) 合計7400+(17エントリ) か...
 
いずれにせよ、TLを早く見ないと...このせいで7/19からのサムネイルが消せてないw
次に、Europeだな。これを見れれば 8/18 まで消せる。
 
ま、もう省力化コーディングを考える時だよなぁってことでw
以下アイデアメモ書き。
 

[クローラー部]
・RSSを読む cronで30分に1度起動
・RSS解析
 - htmlアドレス取得
 - htmlをget html解析して "Date Submitted: 2006-mm-dd hh:mm"  を得る
 - localのdata-file(日付別に生成)にstore (date,time,html-address)
  data-fileは 種別+日付.dat という感じか? (ex. TL_060730.dat , TE_EU_060730.dat )
  RDBにストアするように組むと後処理が楽なんだろうけど....べたべたにtextで書いちゃうほうが楽と判断(というかskillない)
  data-file最終行のdate+timeと比較して新しいものだけを足していく、というlogicで問題ないか実データで要確認
 
 
[評価部]
・cronで1日1回起動(Trek内の時刻はJST+10?[要確認] だとするとJST14時過ぎがある意味キリが良い?)
・一週間前の日付のデータを評価する
・データファイルからhtml-addressを得て、get
 - 404(page was not found) なら捨てる
 - "Date Submitted: ", "Viewed: ", "Favorites: ", "Points: " を取る(ないのもある)
 - score として、viewed*10 / (nowtime - date_submitted)[hoursで取る] とする
  評価としてFavorites(お気に入りに登録している人数)、Points(Critiquesでgoodだと+2など)も絡めるかは検討したいところ。正直重み付けが難しい。
 - resultとしてファイルに書き出す
 
[output部]
・なんとなく分けておいたほうがtimeoutとかの影響を受けないかなぁと cronでJST15時過ぎとかでいいのかな?
・resultを読んで、scoreの高いところから各エリアごとに5枚ないしは10枚を選定
 配列5 or 10用意して、読んで比較でいいや(うわー
・選ばれたhtmlをgetして解析してサムネイルファイルをこちらにcopy
・htmlを作成 trek06mmdd.html とかそんな感じ
・トップhtmlを修正して、新しくできたhtmlへのリンクを追加
 
 
こんな感じで、それぞれの日ごとに、uploadして一週間のview数のランキング上位が
TL:10
TN:10
Africa:5
Asia:10
EU:10
ME:10
NA:10
Oc:5
合計70枚出てくると。(Central&South Americaは旧方式でよろしくだw)
この中からだけ選ぶということなら、dailyに楽勝だなw
 
ま、正直
 
 
こんなんでいい写真選べると思ってんのか( ゜д゜)、ペッ
 
と激しく思うんですけどねwww
 
# あと、2回すべてのhtmlをなめるわけで......(あくまでテキストデータだけではあるけど)
# 特に評価時のぺろ~んがアク禁にならないかとっても心配;_;
 
# あ、最初にRSSで読むときは、RSSにうまった時刻とDate Submittedが同じならhtmlまで読む必要ないのか こりゃ要確認すな
 




Ads by ワード

トラックバック

このエントリーのトラックバックURL:
http://www.nnistar.com/cgi/mt/mt-tb.cgi/1248

スパムがあまりにも多くて頭に来たのでcgi名を変えました。 nni-tb.cgi に変更して送信ください。
ご面倒をおかけして申し訳ありません(表記を変えるとまた自動で取られる可能性があるのでそのままにしています)。
なお、エントリへのリンクがないトラックバックは自動的にスパムとみなされることがあります。

コメントを投稿

総アクセス RSS feed meter for http://www.nnistar.com/