首页 > AI资讯 > 行业应用 > 新京报贝壳财经发布中国AI大模型测评报告宣布成立AI研究院—新京报

新京报贝壳财经发布中国AI大模型测评报告宣布成立AI研究院—新京报

新火种    2024-11-29

9款大模型助手在文本生成、事实核查与价值观判断、媒体信息检索、翻译四个维度的功能均处于“及格线”以上,而长文本和“大海捞针”(在长文本中寻找关键点)能力仍不理想。

贝壳财经联合北京智源研究院、中国经济传媒协会共同发布了行业首份《中国AI大模型测评报告——公众及传媒行业大模型使用与满足研究》

这个夏季,新京报贝壳财经年会如约而至。

7月3日,第五届新京报贝壳财经年会“‘通’往未来 向新有AI”主题论坛在北京正大中心举行。新京报社党委书记、社长汤一原,北京智源人工智能研究院院长王仲远,面壁智能联合创始人、首席科学家、清华大学计算机系长聘副教授刘知远等人出席并发言。

会上,贝壳财经联合北京智源研究院、中国经济传媒协会共同发布了行业首份《中国AI大模型测评报告——公众及传媒行业大模型使用与满足研究》(以下称报告),并由汤一原宣布新京报成立人工智能研究院。

报告包含针对公众及传媒行业的调查问卷,同时从文本生成、事实核查与价值观判断、媒体信息检索等五个维度综合测评了9款大模型助手的传媒方向能力,并最终形成排名。

大模型发展远没到尽头,多模态、端侧等关键词被多次提及

“2023年之后,以大模型进入产业落地为标志,有可能推动人工智能向通用人工智能方向演进。”王仲远在主旨演讲中表示,在过去七八十年人工智能发展的历程中,可以看到每一次人工智能新浪潮的产生,都是以模型参数量、训练样本量和算力跃升带来的人工智能重大发展。

面向未来,大模型技术持续迭代演进。王仲远介绍,除了文本数据之外,视频、图像、音频可能是文本数据的十倍百倍,意味着大模型的发展远没到尽头。“视觉和多模态大模型亟待突破。”

对于大模型未来发展,刘知远则提出三大主战场。具体而言,人工智能科学化将为能力涌现等关键机制建立科学理论,科学解释人工智能形成的原理;计算系统智能化指大模型与底层芯片、操作系统、数据管理、编程开发、网络通信深度融合;领域应用广谱化指将大模型应用于高精尖制造、科学发现等高度专业化场景中。

如何发展AGI(通用人工智能)?中国人工智能学会心智计算专委会副主任委员、武汉大学教授蔡恒进在特别分享环节表示,要真正做到AGI,可能需要对大模型进行分层,每一层都由模块构成,而且模块之间满足一定的因果规律,不同模块之间也可以对齐。他还认为,AGI一定要有持续学习、举一反三的能力。

当前,北京在推动人工智能技术方面也走在全国的前列,先后设立多个人工智能产业园区和创新基地,吸引大量国内外顶尖AI企业和研究机构入驻。数据显示,北京人工智能相关企业数量约2200家,全国40%人工智能企业聚集于此。2023年,人工智能领域融资总额约223亿元,约占全国四分之一。

在圆桌讨论环节,中关村创业大街总经理聂丽霞,北京亦庄智能城市研究院集团有限公司党委副书记、总经理颜敏,北京大学人工智能研究院王选计算机研究所研究员、博士生导师赵东岩,百度智能云政务业务部副总经理梅岭,以“AI在北京”为题展开讨论,并针对人工智能在北京发展的政策、产学研优势,及未来趋势等问题提出各自的见解。

其中,对于如何更好利用AI技术服务于社会、经济以及文化发展,颜敏提到:“第一是踏踏实实找到高质量的数据;第二是踏踏实实挖掘真正的需求并且标准化;第三是踏踏实实把应用做好。”

作为大模型企业代表,商汤科技数字文娱事业部副总裁李星治也持有相似观点。他在特别分享环节谈及了大模型挖掘端侧应用的意义,并认为“端侧大有可为”。

“将模型能力移植到端侧应用,几B的模型代替上百B的,将产生更快速度等意义。”李星治说。以商汤日日新大模型为例,其功能移植到秒画APP(AI内容创作社区平台)后,生成一张512K图片仅需2秒。

如何发展端侧应用?李星治建议:兼顾更多国内主流互联网应用,上下兼容更多手机机型,对模型生产厂商来说,则是在算力平台的兼容性上向下兼容。

报告:大模型“长文本”和“捞针”能力仍不理想

活动过程中,北京智源人工智能研究院智能评测产品负责人郑靖舒,中国经济传媒协会驻会副会长、经济参考报原总编辑杜跃进,新京报贝壳财经资深记者罗亦丹共同发布了《中国AI大模型测评报告——公众及传媒行业大模型使用与满足研究》。

根据报告,在总体得分上,通义千问、腾讯元宝、讯飞星火夺得前三名,其中通义千问在事实核查与价值观判断、长文本能力上均排名榜首,而讯飞星火在翻译能力上排名第一,且综合能力最强。

总体来看,9款大模型助手在文本生成、事实核查与价值观判断、媒体信息检索、翻译四个维度的功能均处于“及格线”以上,而长文本和“大海捞针”(在长文本中寻找关键点)能力仍不理想。

报告还显示,超七成传媒行业受访者在工作中使用过大模型,但仍停留在提供、梳理相关资料,查找、翻译外文资料等较为初级的工作内容。58.4%的公众受访者使用过大模型,其中,使用大模型来辅助文案生成、日程安排、邮件生成等职场技能的占比最高,超过六成。

在人工智能浪潮中,新京报社作为媒体行业的一员,始终走在前沿。媒体不仅是信息的传播者,更是时代的见证者和记录者。近年来,新京报社在人工智能领域进行了大量报道,《AI时代 百模大战》《问答2023 AI十人谈》等专题均向公众传递了最新的AI动态和技术前沿。

同时,新京报社也积极探索人工智能技术在媒体行业的应用。2023年7月和2024年1月,新京报先后上线两款以记者形象作为蓝本的AI数字人——“AI小贝”和“AI小慧”,并推出《贝壳财经早报》以及《新闻8点见》数字人新闻栏目。此外,在短视频即时生成、直播间的互动交流中也开始应用AI技术。如,《动新闻》目前正在探索的AI资讯生成产品、AI媒体资源库等,以及即将投入使用的ESG垂直行业模型。

正如汤一原在致辞中表示:“(人工智能)这些技术的进步,不仅推动了百业千行的智能化转型,更逐渐成为经济高质量发展的强大增量。”

新京报宣布成立的人工智能研究院,除了日常以新闻消息、深度专题、高端访谈和监督报道持续关注国内外人工智能领域技术进程、产品模式、人事变动和商业经验外,还将联合国内外顶级智库、一线专家组成“AI30人论坛”针对人工智能领域基础理论、核心技术和行业应用展开研讨,传递行业大事与大势。同时,还将整合内部网资源持续推出产品测评、行业指数和研学课程等研究型产品。

该论坛是贝壳财经年会主题论坛之一,本届年会以“中国经济向新而行”为主题。贝壳财经年会自2020年起已经连续举办四届,每届年会都围绕经济领域的重大热点主题,邀请众多政府领导、国内外顶尖专家学者、行业领袖等为中国经济发展建言献策。从2020年到2023年,四届年会累计邀请了近300位国内外大咖,举办了49场主题论坛,微博话题阅读量10亿+,直播全平台观看量过亿,短视频播放量累计2.47亿+,图文报道阅读量累计2.08亿+。

贝壳财经是新京报旗下独立财经品牌,于2020年8月正式推出,目前贝壳财经已经形成全媒体、立体式、多元化、多平台共享分发的传播格局,拥有图文、视频、音频、数据等多类产品,全网矩阵覆盖1.8亿人次。

新京报贝壳财经记者 韦英姿 罗亦丹 白金蕾 陈维城 孙文轩

编辑 王进雨

校对 杨许丽

相关推荐
免责声明
本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。