fascinated with tofu

豆腐に魅せられて

Google 先生に聞いても意外とわからなかったウェブスクレイピング実践編1

先ポスト↓からの続きです。

前置きはいいよ!ということで実際にスクレイピングしていきます。

しかしながら HTML の構造は、作り手とコンテンツ次第で千差万別です。(それ故スクレイピングには一通りの正解のようなものがないのだと思います)

よってここからは、やりたいことごとにサンプルコードを実行して結果を見てみたいと思います。

続きを読む

Google 先生に聞いても意外とわからなかったウェブスクレイピング基礎編

去年からチラチラ気になっていたウェブスクレイピングなるものについて、年末年始にまとまって調べることができました。

結論、Nokogiri, Scrapy, Goutte, などなど方法に特化した情報が多いため分からないことだらけでしたが、なんとかコーディング能力のない(プログラムを0から書いた経験無い)自分が勘所をつかむに至った情報だけを整理します。

続きを読む