媒体拥抱AI的新京报探索:数字人主播、AI研究院与大模型测评
来源:一点资讯财经
(图源:新京报官网)
“大家好,我是AI小贝,每天清晨为您带来最新财经新闻,纵览财经热点。”2023年7月,新京报贝壳财经上线了一款以记者形象为蓝本的AI数字人——AI小贝,播报《贝壳财经早报》。
这是新京报探索人工智能技术在媒体行业应用的一次尝试。之后,该报又在2024年1月上线了另一款AI数字人——AI小慧,并推出《新闻8点见》等数字人新闻栏目,获得了不错的传播效果。
从ChatGPT(一款生成式大语言模型)到Sora(一款生成式视频模型),人工智能大模型展现出了令人震惊的创造力。同时,大模型冲击和重塑传媒行业的各种可能性被广泛讨论。
在这股人工智能浪潮中,新京报作为媒体行业的一员,早早开启了拥抱AI的探索,并且还在一步步向纵深推进。
01新京报AI研究院7月3日,在2024贝壳财经年会“‘通’往未来 向新有AI”主题论坛上,新京报社党委书记、社长汤一原,中国经济传媒协会驻会副会长、经济参考报原总编辑杜跃进,北京智源人工智能研究院院长王仲远联合宣布成立新京报AI研究院。
近年来,新京报近年在人工智能领域进行了大量报道,《AI时代 百模大战》《问答2023 AI十人谈》等专题向公众传递了最新的AI动态和技术前沿。
同时,新京报社也积极探索人工智能技术在媒体行业的应用。除了AI小贝和AI小慧之外,新京报在短视频即时生成、直播间的互动交流中也开始应用AI技术。如《动新闻》正在探索的AI资讯生成产品、AI媒体资源库等,以及即将投入使用的ESG垂直行业模型。
据介绍,新京报AI研究院成立后,除了跟踪日常新闻消息、深度专题、高端访谈和监督报道持续关注国内外人工智能领域技术进程等之外,还将联合国内外顶级科研机构、高校、一线业内人士组成智库,针对人工智能领域基础理论、核心技术和行业应用展开研讨,传递行业大事与大势。同时,还将整合资源持续推出产品测评、行业指数和研学课程等研究型产品。“通过这一平台更加深度地参与到人工智能的建设中去,也为我国人工智能产业的发展贡献更多的智慧和力量。”汤一原总结道。新京报成立人工智能研究院,探索AI研究智库的新模式,背后有深刻的技术和现实背景。当前以人工智能为代表的媒介技术不断发展,为传媒业注入新时代变量。2023年初,ChatGPT横空出世,迅速爆红。
如今经过一年多的发展,大模型不断为政务、传媒、医疗、教育等领域注入新技术变量,但同时也带来深度伪造、数据安全、威胁就业等隐忧。作为媒体,成立AI研究院,有助于更好地推动AI与媒体的融合。
新京报创刊于2003年11月11日。据其官网介绍,创刊20多年来,新京报已经发展成为兼具新闻采编、社会调查、舆情分析、政务服务、金融信息、智库研究、教育培训、品牌推广、公益文创、活动会展等功能,集“报、刊、网、端、微、屏”传播于一体、媒体融合转型下的现代综合性主流传媒机构。贝壳财经是新京报旗下独立财经品牌,于2020年8月正式推出,目前贝壳财经已经形成全媒体、立体式、多元化、多平台共享分发的传播格局,拥有图文、视频、音频、数据等多类产品,全网矩阵覆盖1.8亿人次。
02大模型测评报告
7月3日,新京报贝壳财经发布行业首份《中国AI大模型测评报告——公众及传媒行业大模型使用与满足研究》(下称:报告)。
该报告经北京大学、清华大学、浙江大学、中国传媒大学等高校教授的学术指导,与北京智源研究院、中国经济传媒协会联合发布。报告包含针对公众及传媒行业的调查问卷,新京报人工智能研究院还研发了针对大模型助手传媒能力的测评体系,本次测评共综合考察了9款大模型助手的文本生成能力、事实核查与价值观判断能力、媒体信息检索能力、翻译能力以及长文本总结能力。在总体得分上,讯飞星火、通义千问、腾讯元宝夺得前三名,主要是这三个模型在此次评测的五大维度上均没有明显短板,其中,通义千问在事实核查与价值观判断能力、长文本能力上均排名榜首,讯飞星火则在翻译能力上排名第一,且综合能力最强。横向对比大模型五个维度的平均得分水平,翻译能力得分6.42,排名第一。事实核查与价值观判断能力以及媒体信息检索能力得分6.3,并列第二。第四是文本生成能力,得分6.08,最后是长文本能力,得分4.65。
(图源:新京报网)
由此可见,媒体从业者对于使用大模型进行翻译工作较为满意,而通过大模型联网总结热点事件也较为准确,大模型的价值观未见明显问题。与新闻写作相关的文本生成则处于“可用”状态。
总体来看,上述四项维度的功能均处于“及格线”以上,根据测评人员的反馈,大模型生成的新闻稿虽然可用但相比人类仍稍逊一筹,相比之下,大模型的翻译能力、检索总结新闻能力以及其价值观判断已经得到了部分测评人员的认可。此外,对于大模型从长文本中“大海捞针”找关键点的能力,大部分大模型仍然无法胜任。特别是给出1-999个顺序排列的数字,寻找其中两个顺序颠倒的数字这一测试,9款大模型除了通义千问给出了2个答案(一对一错)外,其余8款大模型“全军覆没”,说明大模型仍有缺陷之处。
一点传媒研究院综合新京报网、贝壳财经APP
- 免责声明
- 本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。