大模型的未来趋势与挑战
截至2023年10月,大模型技术已经步入了快速发展的阶段。在中国,超过10种大模型已完成备案。其中,百度的文心大模型升级至4.0版本后,在理解、生成、逻辑和记忆等四项核心能力上均实现了显著的提升。与此同时,OpenAI的ChatGPT也经历了一次重大升级,除了多模态视觉能力、DALL·E 3以及语音合成API的开放。最引人注目的升级是,为每个用户提供了一种名为GPTS的工具,使用户能够构建专属的GPT模型。
微软公司创始人比尔·盖茨公开表示,自1980年首次看到图形用户界面以来,以GPT为代表的大模型是他所见过的最具革命性的技术进步。对于大模型未来的产业发展趋势和面临的挑战究竟如何,我们可以从三个方面进行探讨。
其一,人类种群知识库从外化、索引化到智能化的三部曲。
我们在《崛起的超级智能》一书中提出,生物的竞争本质上是种群知识库的竞争。在过去的几亿年里,恐龙因为灭绝导致种群知识库消失为0,鲨鱼一直保持在海洋中游荡,种群知识库没有发生大的变化,熊猫因为趋于灭绝从而种群知识库不断萎缩。
只有人类在近200万年里,在知识和智慧上不断扩展和加速,在最近数百年里随着蒸汽机、工业革命、核能的出现,人类种群知识库出现了巨大的增长。特别是互联网诞生后,第一次将人类的种群知识库外化成一个庞大的网络知识库,通过万维网的发明进一步促使人类种群知识库急剧扩容。表现在科技领域就是21世纪大量新科技新概念不断涌现。
面对海量的互联网公共知识,如何索引就成了人类必须解决的重要课题。20世纪90年代,搜索引擎出现了蓬勃发展,其中优秀和典型的代表分别是谷歌和百度,它们成长背后的推动力也是人类种群知识库发展的必然要求。
互联网知识库被索引之后,如何智能化也就成为了一个重要议题。在过去的近30年里,以谷歌、百度为代表的搜索引擎公司加大了智能化的步伐,人工智能的兴起也与此有密切的关系。
2022年OpenAI的ChatGPT成功引发了大模型的兴起,标志着互联网这个外化的人类种群知识库完成了从索引化到智能化的转变。但不能忘记的是,OpenAI ChatGPT的成功离不开谷歌提出的Transformer注意力机制模型,也离不开微软通过Bing搜索引擎提供的海量数据和巨大资金支持。
从搜索引擎的发展看,通过激烈的竞争,搜索引擎最终形成了若干个巨头公司为人类提供互联网海量数据的索引服务,同样我们认为作为搜索引擎的升级版,人类社会也不需要很多大模型提供同质的服务。我们判断包括搜索引擎、大数据、社交网络等领域拥有优质大数据、人工智能技术积累和广泛应用场景的公司中,在未来的竞争中会脱颖而出一家或若干家为人类提供集中统一的智能服务。
其二,行业垂直大模型建设思路:继续提升通用大模型智能水平。
应该指出,当前人类社会对大模型充满了热情,特别在中国,很多人希望大模型能够与金融、法律、工业、农业、电力、建筑等等行业领域结合,从而实现快速发展。
其实大模型的成功并不仅仅是参数量大,而是用大规模预训练+微调的方式,对海量的跨领域知识进行学习时涌现出来新的能力,而且这些新的能力往往与创新有关,如翻译、创作文章、创作图像等,然而这种创新能力并不稳定,会出现“幻觉”和胡编乱造的情况。同时由于神经网络本身的特点,其可解释性问题也一直没有解决,因此对于需要精密控制或精确结果的产业领域,大模型并不是可靠的工具和技术。
还有一个误区是,认为用大模型的训练方法加上行业产业的大数据就可以形成高质量的行业大模型。这个观点并不符合大模型涌现出创新能力的规律,过于单一领域的知识反而会降低大模型涌现出新能力的水平。因此应继续提高ChatGPT、文心一言、LLama等等通用大模型的智能水平,通过通用大模型平台与其他可靠性高的人工智能技术协同工作,并与各个行业结合,这种路径要比建设专门的行业大模型更为稳健和有效。
其三,值得期待的大模型未来。
大模型的不断发展和与其他技术产品结合的过程将是持续探索和尝试的过程。无论如何,大模型的出现的确是一个革命性的突破,有很多科学家认同ChatGPT等大模型已经可以突破图灵测试,未来在智能和意识的基础原理上也将带来更多突破性的启发。
在产业应用上,大模型与其他不同类型的人工智能技术、网络技术、大数据技术结合,与不同的办公、学习、生产、生活结合会持续产生出具有非凡想象力的应用。例如微软办公Office接入GPT-4,由AI驱动的 Microsoft 365 Copilot ,打破了传统办公软件办公的方式,能自动生成文档、电子邮件、PPT。百度的文心行业大模型的数量已经达到了 11 个,覆盖能源电力、金融、航天、传媒、影视、汽车、城市管理等多个领域,OpenAI计划再推出GPT商店。这将类似于苹果的App Store,让开发者可以在商店中上架他们的自定义GPT,供其他用户购买和使用。
虽然大模型有着令人惊叹的智能表现,但我们还需要耐心等待大模型的持续发育和成长,如果从以ChatGPT3.5为代表的大模型大规模向人类提供服务算起,毕竟它还是一个从出生来到全人类面前还不到1年的婴儿。- 免责声明
- 本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。