次回の 1月10日 Rubyによるクローラー開発技法 読書会 第3回(兵庫県) は LILO & 東海道らぐ・オフラインミーティング(2015/01/10) - LILO | Doorkeeper と重なっていて参加できないということで、Rubyによるクローラー開発技法を読んでしまったので、そのメモです。
メモ
- p.62
robotex.rb
の 4 行目は 3 行目の引数にならずに意味がないのでは。 - p.67
anemone-skip_links_like.rb
で「adminを含むURLは除外」と書いてあるのに/\/r\//
になっている。 - p.69
http://example.com
とhttp://example.com/
は同じ意味で 301 リダイレクトは発生しないのでは。 - p.143 「スクリーンショットはページごとに上書きされていって、」とあるが、ここは上書きされないのでは。
- p.173
Nokogiri#parse
などはNokogiri.parse
(インスタンスメソッドではなくクラスメソッド) なのでは。 - p.215
initialize
の#{}
は不要なのでは。 - p.239
page.code = 500
はpage.code == 500
の間違い? - p.258
base_url
への代入が連続しているのが不要 - p.359 プスクリプト → スクリプト
- p.420 varidation → validation
- p.420 gsub の結果は Integer にならないのでは?
Disqus Comments