OpenAI：纽约时报雇黑客攻击我 - 新火种

热门关键词

文心一言 AI copy btc 斑马腾迅 aa 1 iPollo sd

首页 > AI资讯 > 行业动态 > OpenAI：纽约时报雇黑客攻击我

OpenAI：纽约时报雇黑客攻击我

新火种 2024-03-04

堂堂AI巨头，怎么就被一家报纸雇黑客攻击了？

《纽约时报》诉OpenAI侵犯版权索赔数十亿美元案最新进展：

在最新提交的法庭文件中，OpenAI声称《纽约时报》花钱找黑客攻击ChatGPT，人为制造侵权结果。

OpenAI：纽约时报雇黑客攻击我

这项诉讼要是输了，那对OpenAI来说可能是毁灭性打击。

数十亿美元罚款都是小事了，按法律界的分析，连ChatGPT都可能被迫全部擦除，重头开始训练。

OpenAI：纽约时报雇黑客攻击我

大家都知道，美国法律要遵循之前判例的原则。

在过去几十年的科技公司vs版权方的案子中，法院可并不总是站在科技公司一边。

这次OpenAI主张《纽约时报》雇佣黑客，还真的非常关键了。

纽约时报如何攻击ChatGPT

去年12月，《纽约时报》起诉OpenAI和他的微软爸爸，称ChatGPT和Copilot都未经许可利用其内容训练。

当时，《纽约时报》展示了足足100个GPT-4一字不落背出真实报道段落的例子。

这样一来，ChatGPT就可以算作报纸的竞争品。

OpenAI：纽约时报雇黑客攻击我

OpenAI这边，辩称这是一个漏洞，并承诺已经在修复。

具体来说，当AI生成与训练数据非常相似的样本时，可能发生“数据回流”（regurgitation of training data），类似于人类听到上句就会条件反射般的接下句，谁也拦不住。

OpenAI：纽约时报雇黑客攻击我

他们认为《纽约时报》利用这一漏洞，使用特殊的提示词要求ChatGPT输出特定文章的开头，并继续要求输出下一句话。

OpenAI预计需要反复尝试上万次才能生成这些整篇的文章，而且还不是按顺序的，而是“分散和无序的引用”。

正常人不可能这么使用ChatGPT，也不会把它当成《纽约时报》的替代品。

OpenAI：纽约时报雇黑客攻击我

OpenAI指责《纽约时报》故意误导法庭，“使用省略号来掩盖”ChatGPT吐出报道片段的顺序，造成了“ChatGPT生成了文章的连续和不间断片段的错误印象”。

并且《纽约时报》从来没有披露过他们生成这些证据的具体提示词，以及是否修改了系统提示词等等细节，就挺心虚的。

至于提示词攻击算不算黑客行为，有网友表示怎么不算，如果认可提示词工程真的算一种工程，那提示词攻击就算攻击。

OpenAI：纽约时报雇黑客攻击我

现在OpenAI主要从两个地方反击：

一是主张这种提示词攻击公然违反了OpenAI的产品使用条款。

OpenAI：纽约时报雇黑客攻击我

二是主张互联网上公开内容是可以被合理使用的。

这就要抱紧谷歌大腿了，20年前谷歌整了个大活，扫描数百万本图书放到搜索引擎上，被一堆出版商和作家协会给告了。

官司反反复复打了10多年，最终谷歌艰难的赢了，被判这些数据是合理使用。

OpenAI：纽约时报雇黑客攻击我

当时裁决认为用户只能看到图书的简短片段，永远无法从受版权保护的书籍中恢复较长的段落。

不光OpenAI，同样面临版权诉讼的Stability AI等AI图像生成公司，都在坚持他们做的事与谷歌当年一样：

都是“学习训练数据中关于作品的信息，但不复制作品本身的创造性表达”。

然鹅还有一个有争议的地方，AIGC产品确实会产生创造性的作品，与接受训练的作品直接竞争。

所以这一批AI公司面临的危机，比谷歌当年面临危机还要大一些。

再不卖数据就晚了

实际上，像《纽约时报》这样和AI闹得不愉快的内容公司是少数。

更多互联网公司都在争先恐后出售自己的数据，反正这些AI公司又不是没钱。

Sora视频，就被找出明显有OpenAI合作伙伴Shutterstock素材的影子。

OpenAI：纽约时报雇黑客攻击我

上周，“美国贴吧”Reddit刚刚跟谷歌签了协议，6千万美元一年，让谷歌可以实时获取论坛数据用于AI训练。

OpenAI这边肯定早就用上了，毕竟山姆奥特曼本人就和Reddit公司关系匪浅，而且早年比GPT-1还早的原型研究，就是在Reddit数据上训练聊天机器人。

现在Tumblr和WordPress也赶紧跟进，把用户数据出售给OpenAI和Midjourney。

OpenAI：纽约时报雇黑客攻击我

虽然他们的用户听到这个消息都挺不高兴的，但是没办法，当初注册账号的时候可是必须同意使用条款，其中把数据归属早就安排明白了。

OpenAI：纽约时报雇黑客攻击我

当然AI公司买过来这些数据也不是直接塞AI嘴里就好使的，学术界现在也研究如何高效利用。

刚刚还有一篇语言模型训练的数据选择综述出炉，提出用于比较和对比不同的数据选择方法的框架，还倡议：

加速数据选择研究，如开发直接评估数据质量的指标，减少对昂贵模型训练的依赖。更好地理解数据分布的特性，以便更精确地选择数据。将计算时间从模型训练转移到数据处理。 OpenAI：纽约时报雇黑客攻击我

随着AI生成的内容在互联网上铺开，后面再训练大模型的都绕不开使用AI生成的数据了，就说多少家大模型“承认”过自己是OpenAI训练的了吧。

同样中文数据也绕不开文心一言，谷歌Gemini都闹过笑话（已修复）。

OpenAI：纽约时报雇黑客攻击我

坐拥大量人类古法手打数据的互联网公司，再不抓紧卖，AI就能自给自足了。

Tags:

纽约时报

相关推荐

OpenAI：纽约时报雇黑客攻击我

2024-03-04

OpenAI要求驳回《纽约时报》提起的诉讼称该报雇人“入侵”ChatGPT

2024-02-28

OpenAI开撕纽约时报：故意引导ChatGPT得出抄袭结论

2024-01-10

纽约时报起诉微软和OpenAI侵权：擅用大模型，损失数十亿美元

2024-01-04

纽约时报送OpenAI、微软上被告：GPT-4输出结果与其作品有大量重复

2024-01-04

免责声明: 本文所包含的观点仅代表作者个人看法，不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。交易和投资涉及高风险，读者在采取与本文内容相关的任何行动之前，请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。

热门文章

问界M9车主体验华为自动充电机器人：有点慢、但很稳

豪掷30亿美元！OpenAI考虑收购人工智能编程工具Windsurf

2025-04-17 18:21

OpenAI发布GPT-4.1全新系列模型！全面超越GPT-4o更聪明、更便宜

2025-04-15 18:27

重磅！OpenAI确定GPT-4退役日期：4月30日

2025-04-15 18:27

腾讯云智能数智人接入deepseek大模型-品玩

2025-04-16 11:30

巴托、萨顿因强化学习获2024年图灵奖；英国放弃对“微软-OpenAI”组合反垄断调查丨全球科技早参

2025-04-17 11:27

全国首例保护AI模型结构判决！抖音诉B612侵害著作权获赔160万

2025-04-18 18:23

清华学霸、OpenAI姚顺雨：AI下半场开战，评估将比训练重要

2025-04-18 14:41

美国下手全面封锁！NVIDIA、AMD、Intel的AI芯片非许可禁止卖到中国

2025-04-17 18:22

和英伟达脱钩何小鹏：小鹏自研图灵AI芯片提前上车

2025-04-15 18:30