Webサイトデータ収集(データスクレイピング)

こんにちは。

今回は「Webサイトのデータ収集(スクレイピング)」について解説していきます。

スクレイピングは営業リストや、商品リストを作成するのに非常に役立ちます。

Webサイトから情報を収集し、簡単にExcelでリスト化することができます。

例えば、こちらの不動産情報サイト。

不動産情報サイト

顧客リスト作成のために、このサイトから物件名・住所・竣工年月などの情報を取得するとします。

これを手作業でやるとなれば、一苦労です。

さらに物件は定期的に更新されるので、手持ちのリストはすぐに古いものになってしまいます。

これをロボットでリスト化できたら、リストはいつでも最新の状態になり、

営業の効果も上がります。

こちらが実際のリストです。

データスクレイピングの出力結果。プライバシー保護のため一部情報を伏せております。

あるいは、こちらのECサイト。

「商品開発にあたり、市場にある商品情報を集計したい」とご依頼があれば、

商品リストを作成可能です。

ただし、データスクレイピングには注意点もあります。

主要なECサイトやSNSの多くでは、データスクレイピングの使用を禁止している場合が多いです。

(上記はイメージしやすいようAmazonの画像を掲載していますが、Amazonもデータスクレイピングが禁止されています。)

禁止の目的は、SNSであればユーザーの情報保護。

ECサイトであれば、システム負荷の軽減という理由が多いようです。

データスクレイピングを行っても問題ないかどうかはサイトによって異なりますので、まずは気軽にご相談ください。

よろしくお願いいたします。

株式会社ジドウカ 代表取締役 業務/ITコンサルタント ITジャーナリスト

佐藤 優志(さとう ゆうし)

エンジニアやコンサルタントとしての活動を経て、2020年株式会社ジドウカを設立
「業務効率化でDXを推進し、企業の競争力強化をする」
「デザイン思考で職場の心理的安全性を向上させ、日本の職場環境をより快適にする」
というモットーを持つ。

関連ブログ

(スマホは横スクロールできます。)

July 21, 2022

弊社ロボットアシスタントサービスの名称変更のお知らせ

弊社ロボットアシスタントサービスの名称変更のお知らせ

July 13, 2022

デジタイゼーション(アナログのデジタル化)

OCRの独自のノウハウを活用した業務効率化の方法を解説しています。脱FAX、脱印鑑、ペーパーレスを実現したい企業の方、ぜひご覧ください。

July 13, 2022

ロボットによるデータ入力

クリック・テキスト入力を用いたアプリケーション操作、ブラウザ起動、サイトへのアクセス、ログイン、ファイルアップロードなど、人間が行うほぼ全ての作業を自動化可能です!

July 13, 2022

Webサイトデータ収集(データスクレイピング)

データスクレイピングを使えば、Webサイトから情報を収集し短時間でリスト作成することが出来ます。営業のリスト作成の効率化にうってつけです!

June 18, 2022

95%の書類はDXできていない

ドキュメントを業務改善する方法を一挙公開しています! これだけで労働時間をぐっと減らすこともできます。 必読の内容です!

May 9, 2022

自動化のプロが教える時短サービス、時短テク

知ってるか知らないかで差がつくテクニックを一挙公開します!

May 9, 2022

サイトリニューアルにあたって

今回、Webサイトをリニューアルしてみました。 デザインにもこだわっていて、僕は結構気に入ってるんですが、 いかがでしょうか? さて、サイトを刷新するに当たって初めに決めたことが「どのCMSを使うか」でした...

May 9, 2022

タスク管理の魔力 前編

突然ですが、タスク管理やってますか? プロジェクト型の業務はWBSを導入することが多いですが、 実は普段の業務でもタスク管理すると、すごい効果があります。 今回はタスク管理のすごい効果についてご説明します。

May 9, 2022

タスク管理の魔力 後編

後編では、オススメのタスク管理ツールや活用法について、 ご説明しています。

Jidouka

自動化のプロにお任せください。

jidoukaは、仕事のあるべき姿を見直すお手伝いをいたします。
お気軽にお問い合わせください。

問い合わせ

©2022 Jidouka  All Rights Reserved