@znz blog

ZnZ の memo のようなもの

Rubyによるクローラー開発技法を読んだ

| Comments

次回の 1月10日 Rubyによるクローラー開発技法 読書会 第3回(兵庫県)LILO & 東海道らぐ・オフラインミーティング(2015/01/10) - LILO | Doorkeeper と重なっていて参加できないということで、Rubyによるクローラー開発技法を読んでしまったので、そのメモです。

メモ

  • p.62 robotex.rb の 4 行目は 3 行目の引数にならずに意味がないのでは。
  • p.67 anemone-skip_links_like.rb で「adminを含むURLは除外」と書いてあるのに /\/r\// になっている。
  • p.69 http://example.comhttp://example.com/ は同じ意味で 301 リダイレクトは発生しないのでは。
  • p.143 「スクリーンショットはページごとに上書きされていって、」とあるが、ここは上書きされないのでは。
  • p.173 Nokogiri#parse などは Nokogiri.parse (インスタンスメソッドではなくクラスメソッド) なのでは。
  • p.215 initialize#{} は不要なのでは。
  • p.239 page.code = 500page.code == 500 の間違い?
  • p.258 base_url への代入が連続しているのが不要
  • p.359 プスクリプト → スクリプト
  • p.420 varidation → validation
  • p.420 gsub の結果は Integer にならないのでは?

Comments