Claude团队:用400万条对话分析AI对经济的长期影响
基于400万条Claude真实对话数据,Anthropic重磅发布全新报告!
在今天,哪些职业用AI最多?他们都用AI干什么?
这些有关AI在各经济领域应用情况的问题,报告用实实在在的统计数据全回答了。

这一次,他们不仅推出The Anthropic Economic Index(用来理解AI对经济影响的指数),还公开了第一篇论文,里面包含大量观察结论:
目前AI使用场景最多的是软件和写作;AI应用也呈现出“二八定律”,约4%的职业在75%的任务中高度使用AI;是否使用AI与经济水平高度相关,中高收入最为普遍,最高和最低都要低得多;当前AI更多承担辅助功能,不过自动执行任务已经渐趋成熟(43%);……
与此同时,Anthropic宣布开源上述用于分析的数据集,以方便其他研究人员进一步得出发现。
报告一经发布,迅速引起热议。

看完上述消息,网友们终于舒了一口气!

还是先来看第一篇公开论文的具体内容。
概括而言,通过对Claude平台400万+匿名对话数据的分析,Anthropic构建起了衡量AI在经济活动中使用模式的框架,以此揭示AI在不同任务、职业中的应用情况,并最终探讨了其对经济的影响。

展开来说,如下图框架所示,研究团队使用Clio工具(Anthropic开发的自动化分析工具)对大量对话进行分析,目标是将对话映射到职业类别上。
由于美国劳工部O*NET数据库包含近20,000个独特的任务陈述,导致直接分类难度较大,因此研究人员构建了一个分层的任务树结构。
也就是说,先由Claude筛选出职业相关对话,接着借助树状搜索,让Claude依据对话内容从任务层次结构顶层向下遍历选择,最终完成对话与具体O*NET任务的映射。

而根据上述映射和分析,研究发现了AI在不同职业类别中的使用差异。
首先,由于软件开发、数据分析等工作高度适配AI技术,因此计算机和数学相关职业的AI使用率最高,占所有查询的37.2%,整体TOP 6如下:

与之相反,偏传统的农林牧渔行业与AI最远。

进一步分析不同职业的AI使用深度,可以看出,约36%的职业在四分之一任务中会使用AI,而仅有约4%的职业会在四分之三任务中使用。
换句话说,少部分人大量使用AI,大多数人采取“适量”姿态,整体上AI还只是一种选择而非必需品。

其次,收入情况也和AI使用率息息相关。
数据显示,AI在中高收入的工作中(如程序员)使用最为普遍;低收入(如服务员)和非常高收入(如麻醉师)的工作中AI使用率则又要低得多,呈现中间多、两边少的形态。

接下来,研究观察了人们更喜欢与AI协作,还是让AI自动化执行任务。
结果发现人机协作仍占据主位,约占57%;不过以智能体为代表的自动化执行也不容小觑,目前已经占比43%。
这也意味着,“2025属于Agents(智能体)”这句话的含金量还在上升。

BTW,Anthropic这次还透露了Claude 3.5 Sonnet和Claude 3 Opus模型之间的任务使用模式的比较分析。
显而易见,最新模型Sonnet 3.5被更多用于编码和技术任务,而Opus更多用于创意写作和教育内容开发。

以上为论文主要发现。另外值得一提的是,官方还特意强调了分析所存在的局限性。

不过接下来,Anthropic将继续推进这一研究。对此,他们同步公开了上述分析所使用的数据集,并邀请经济学家、政策专家和研究人员开展合作。
而且还顺势搞了波招聘,为公司社会影响团队招研究科学家和研究工程师。

除了讨论报告本身,保留节目是,网友们纷纷借此开启了催更模式。

更有网友犀利辣评,Anthropic将发布除新模型之外的一切。(doge)

回顾Anthropic更新Claude模型的频率,不难发现新模型可能要等到今年上半年。
(表格由AI整理,内容经过验证)

更具体的说法,来自创始人Dario Amodei在今年一月底的一次访谈,他透露Anthropic正在开发一些新的大模型,有望在未来3-6个月内发布。
嗯,保守估算一下,也就是今年5~8月份了。
另外他当时还剧透了,新模型会采取不同于其他公司的策略,让推理能力与模型的其他能力更加协调统一。
正在开发的还有一个“虚拟协作者”(Virtual Collaborator)。
这是一个可以在计算机上执行各种任务(如写代码、测试、交流、撰写文档等)的AI系统,用户可以与它进行长时间的任务导向交互。
至于图像和视频生成则不是Anthropic的研发重点,未来如果确有必要的话,也会选择“拿来主义”,与专业的图像生成公司合作。
那就狠狠期待一波了~
- 免责声明
- 本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。
热门文章
