Octoparseを使ってみたけれど
プログラミングの知識を必要とせず、簡単にWebスクレイピングができる『Octoparse』というものがあります。これを以前調べた栃木県のカフェのデータと比較してみようと思いました。しかし結果は…。
▼GoogleマップAPIで栃木県のカフェを検索
テンプレートを使ってみた
いろいろとできるようなのですが、慣れないと難しいもので、まずはあらかじめ用意されているテンプレートを利用してみました。
Googlemapでキーワードでスクレイピングするものがあり、「栃木県 カフェ」と入力して実行してみました。
時間は結構かかります。丁寧にデータを取得している感じがありました。
そして403件のデータを50分かけて取得しました。そしてエクスポートのボタンを押してみると…。
そうですか…。そうですよね。無料のプランだとテンプレートで抽出したデータのエクスポートはできないようです。(最初に確認しておけばよかった)
これ以降使っていないので、無料でどこまでできる(どんなコースなら良い)のか確認していません。Octoparseを使う場合はあらかじめ小規模なデータ取得を行って確認することをお勧めします。
ついでに、前の記事では1700件ほど取得していたので、どの程度の差異があるのか確認してみたかったですね。
Webスクレイピングなら、ScrapeStormと言うWebスクレイピングツールもお試してください。