クローリングしたい@動画サイトへの道
こんばんは。
前回までで、登録したURLから自動的にダウンロードするロジックが完成しました。
あとは、URLをどうやってもってくるかです。
ここでまた、仕様をざっと定義しておきます。
- 利用者はサイトのドメインを登録する
- 登録されたサイト内に存在する巨大ファイル(zip.mpg.mp3など)のURLをシステムへ登録する
…以上。簡単じゃないか ヽ(゜∀゜)ノ
いやいや、難しいですよ
多分、クローリングになるとおもうのですが、クローリングのロジックが全然思い浮かばない…
・
・
・
自宅の書物を物色。
(どっかにクローリングのロジックが書いてあった気がする…)
・
・
・
ううむ、今思ったんだけど、パラメーターを試行して欲しいな。
page=1とかあったら2,3,4,5を試行してとってくるとか。でも難しいな。
…ううむ、でもwgetには頼りたくないw
・
・
・
調べていくとPHPでクロール用のライブラリ?がある模様。
考えることは一緒なんだなー
スパイダーとクローラーって違う役目なんですね。初めて知った