首页 > AI资讯 > 最新资讯 > 肖仰华:大模型不能停留在“炼金术”而要成为科学

肖仰华:大模型不能停留在“炼金术”而要成为科学

新火种    2023-11-09

《科创板日报》11月8日讯(记者 朱凌)“大模型唯有走向千行百业,与实体经济深度融合,才能创造价值。也只有真正创造价值,大模型才能真正地可持续发展。”11月7日,在财联社“上海之巅 论道AI”大模型闭门会上,复旦大学教授、上海市数据科学重点实验室主任肖仰华发表演讲时如是说。

▍通用大模型为何能“出道”?

在大模型“出道”前,肖仰华长期从事知识图谱研究。他在演讲中直言,“知识图谱最怕开放性问题,它只能解决已设定知识内的问题,凡超出范围和边界就无法应对。”

与只能胜任封闭任务的传统小模型或知识工程相比,通用大模型到底提供了什么新能力?

肖仰华认为,大模型具备开放世界的理解能力。与传统模型相比,通用大模型在开放理解、举一反三、跨学科认知等方面的能力格外突出。

针对通用大模型的开放理解能力,肖仰华举了一个非常形象的例子:一个病人在向问答模型询问如何使用某种药物时,往往会提到自己的年龄,性别等信息。传统模型基于规则或关键字匹配,如将说明书中提到的“成年人”作为关键词,但这样就无法匹配上病人所提供的信息。而通用大模型可以精准地理解到,18岁等同于成年人,将二者匹配到一起,告知病人正确的药品使用说明。

同时,对于通用大模型强大的举一反三能力,肖仰华表示,假设传统模型能解决A任务,也能解决B任务,但它解决不了A+B的任务。通用大模型则不然,在一些复杂任务和组合任务中,它拥有泛化问题的能力。“只要给它有关新任务的合理指令、少许示例,它就能产生期望输出,无需高成本标注数据。”

肖仰华还称,通用大模型拥有对复杂系统的认知能力。“它可以模仿人类专家做评估,节省极大的人力成本;可以迅速搜集想要的数据做成图表,一键式完成数据分析;甚至可以诊断疾病,虽然专业领域上还有待提高。”

▍机遇与挑战

“大模型对toB市场意义非常重大,它是一次智能引擎的升级。”肖仰华认为,现在很多行业真正解决不了的是跨系统、跨边界、跨层级、跨模块的问题,而大模型的跨学科认知能力使把这些问题可以交给大模型成为可能。

肖仰华表示,从传统的小模型、知识工程为大模型的过程中,一定要重视、合理定位大模型对千行百业带来的机会。

谈及大模型面向企业服务的机会时,肖仰华称要重视以下三个方面:

一是大模型需要与现有企业流程无缝融合,需要与现有工具或接口的有效衔接;

二是大模型需要与员工、专家有效协同;

三是大模型需要领域知识注入,以解决“幻觉”问题。但是,企业的决策是复杂的,绝非简单的聊天场景所能胜任。“企业做决策需要非常丰富的专业知识,复杂的决策逻辑,宏观的研判能力、综合任务的拆解、严密精细的规划、复杂约束的取舍和未知事务的预见等等,而通用大模型在这些方面的应用还有待挖掘。”

同时,肖仰华还提到了通用大模型的问题——“幻觉”现象以及缺乏领域“忠实度”:

“大模型会一本正经地胡编乱造一些虚假事实,这种虚假的“真实”产生的后果是极其严重的,譬如金融领域的投资、医疗方面的数据,一个小数点之差就有可能酿成大错。

“而且,该问题难以解决。因为通用大模型本质上是统计模型,其自身无法从根本上解决这一问题,增大模型规模和训练量只能一定程度上缓解该问题。

“此外,通用大模型对于领域给定的数据缺乏忠实度,往往自己利用它基础模型学到的能力去发挥和创造,未按给定内容回答。”

在通用大模型已经内卷成“红海”的今天,肖仰华认为,大模型到底带来了哪些新的场景、新的应用值得深刻反思。

事实上,场景大模型以及行业和领域的大模型依旧是一片蓝海。“从通用往行业、往场景、往专业去深耕,是大模型与千行百业的深度融合之路。”

针对场景化的大模型,肖仰华称,如财务、客服、HR等场景的大模型往往只需要大模型的通识能力加上少量的岗位培训,即可胜任。“这实际上可能是变现最快的一种大模型,值得关注。”

再者如物流行业的表单大模型等专业大模型,肖仰华亦认为很有潜力。“许多公司有这方面的需求,可以发展专业大模型,开辟出有竞争力、有优势的大模型赛道。”

▍大模型不能停留在“炼金术” 而要成为科学

事实上,大模型要想往千行百业成为一个行业专家,仍然要付出巨大的代价,“我们要把大模型从通识走向专识,再让它能够学会工具,再能够去实践和反馈、优化,最终才能养成一个行业的专家。”

对于目前国内大模型研究,肖仰华做了一个形象比喻:“像古代研究炼金术,把数据往炼丹炉(GPU服务器)那里一丢,然后祈祷能够炼出模型,但对何种数据产生何种训练效果等训练细节并不清楚。”

肖仰华认为,标签化的语料很关键,“研究在什么标签的语料喂养下的大模型能够形成什么样的能力,能够帮助我们理解大模型背后的炼制机制。国内有很多企业注意到了这点,但真正去做的,少之又少。”

此外,肖仰华表示,要意识到大模型的发展是一个循序渐进的过程,加强对大模型的评测能够帮助掌握模型的发展水平。“要合理定位、正确认识大模型,积极开辟新赛道,重视大模型的成本和价值,促进大模型与千行百业的深度融合。”

在演讲的最后,肖仰华称,大模型不能停留在“炼金术”,而是要成为一个科学,才能持续发展。而大模型要想真正成为一个科学,最关键的仍在于借鉴人脑的功能分区理论研究大模型的功能集约方法,借鉴人类的认知发展理论研究大模型的炼制原则,借鉴人类的情商与智商评测理论研究大模型的评测方法,所以对人类智能本身的理解对大模型的研究具有积极意义。“非常期待在大家的共同努力下,尽快让大模型从现在的'炼金术'阶段成为一个严肃的科学。”

相关推荐
免责声明
本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。