クローリングしたい@動画サイトへの道

こんばんは。
前回までで、登録したURLから自動的にダウンロードするロジックが完成しました。
あとは、URLをどうやってもってくるかです。

ここでまた、仕様をざっと定義しておきます。

  • 利用者はサイトのドメインを登録する
  • 登録されたサイト内に存在する巨大ファイル(zip.mpg.mp3など)のURLをシステムへ登録する

…以上。簡単じゃないか ヽ(゜∀゜)ノ
いやいや、難しいですよ
多分、クローリングになるとおもうのですが、クローリングのロジックが全然思い浮かばない…



自宅の書物を物色。
(どっかにクローリングのロジックが書いてあった気がする…)



ううむ、今思ったんだけど、パラメーターを試行して欲しいな。
page=1とかあったら2,3,4,5を試行してとってくるとか。でも難しいな。


…ううむ、でもwgetには頼りたくないw




調べていくとPHPでクロール用のライブラリ?がある模様。
考えることは一緒なんだなー


スパイダーとクローラーって違う役目なんですね。初めて知った