DataClaw(DATACLAW币),近日,Claude背后的公司Anthropic公开指责DeepSeek等中国人工智能公司未经授权,使用约2.4万个虚假账户从Claude抓取超过15万条对话记录,并利用这些数据训练自己的模型。
这属于法律灰色地带,被广泛视为不道德的抓取行为。作为回应,一位名为POM的用户采取了截然相反的做法:他公开了自己使用ClaudeOpus4.5的15.5万条个人对话记录——这些记录全部是在使用“ClaudeCode”功能时收集的——并将其作为开源数据集上传到HuggingFace网站。
他还开源了一款名为Dataclaw的工具,让任何人都能轻松地:导出自己的Claude聊天记录、编辑或删除敏感信息、上传并分享到HuggingFace平台。
他的立场是:如果公司要秘密收集数据,那么我们应该自愿、透明地分享高质量的对话,以便开源社区能够利用它们来训练更好的开源模型。话虽如此,像DeepSeek这样的中国人工智能公司的做法确实令人怀疑。