迷惑をかけずにスクレイピングをする

AIの無断学習巡り摩擦 オープンAIなどとサイト側 知財権侵害の恐れ/サーバー負荷重く

米オープンAIや米メタなどの生成AI(人工知能)開発企業がインターネット上の学習データ収集を競っている。自動プログラムを使ってウェブサイトを巡回し、無断でデータを集めてサイト運営者側との摩擦を生んでいる。専門家は無断学習が知的財産権の侵害につながる可能性を指摘している。

2025年7月12日 日本経済新聞

私も、情報収集や分析のために、クローリング・スクレイピングをしますが、サーバー側に迷惑をかけないように、運用しています。そもそも、短時間に大量のデータを取得するようなことはないので、問題になることはないと思います。

クローリング・スクレイピングは、サーバー側に迷惑をかけない、というのが大前提ですが、そんなことはお構いなしということなのでしょうね。サイト側でボットの巡回を拒否しても、無視されてしまうというケースもあるようです。完全に無法地帯ですね。

目次