
Webサイトデータ収集(データスクレイピング)
こんにちは。
今回は「Webサイトのデータ収集(スクレイピング)」について解説していきます。
スクレイピングは営業リストや、商品リストを作成するのに非常に役立ちます。
Webサイトから情報を収集し、簡単にExcelでリスト化することができます。
例えば、こちらの不動産情報サイト。

顧客リスト作成のために、このサイトから物件名・住所・竣工年月などの情報を取得するとします。
これを手作業でやるとなれば、一苦労です。
さらに物件は定期的に更新されるので、手持ちのリストはすぐに古いものになってしまいます。
これをロボットでリスト化できたら、リストはいつでも最新の状態になり、
営業の効果も上がります。
こちらが実際のリストです。

あるいは、こちらのECサイト。
「商品開発にあたり、市場にある商品情報を集計したい」とご依頼があれば、
商品リストを作成可能です。

ただし、データスクレイピングには注意点もあります。
主要なECサイトやSNSの多くでは、データスクレイピングの使用を禁止している場合が多いです。
(上記はイメージしやすいようAmazonの画像を掲載していますが、Amazonもデータスクレイピングが禁止されています。)
禁止の目的は、SNSであればユーザーの情報保護。
ECサイトであれば、システム負荷の軽減という理由が多いようです。
データスクレイピングを行っても問題ないかどうかはサイトによって異なりますので、まずは気軽にご相談ください。
よろしくお願いいたします。
株式会社ジドウカ 代表取締役 業務/ITコンサルタント ITジャーナリスト
佐藤 優志(さとう ゆうし)
エンジニアやコンサルタントとしての活動を経て、2020年株式会社ジドウカを設立
「業務効率化でDXを推進し、企業の競争力強化をする」
「デザイン思考で職場の心理的安全性を向上させ、日本の職場環境をより快適にする」
というモットーを持つ。