周鸿祎:很多企业百亿级大模型就能满足需求,千亿级是成本浪费
周鸿祎
“人工智能的发展要‘以人为本’,大模型不能引发大规模裁员,而是要帮助企业员工提升能力和效率,成为易用的工具。”
6月26日,在世界互联网大会数字文明尼山对话主论坛上,三六零(601360.SH,下称“360”)创始人周鸿祎再次谈到他对大模型的看法,首次提到现有公有大模型存在四方面不足之处:
他表示,第一,公有大模型虽然是通才,但它缺乏行业深度,“我们之前认为GPT什么都会,但如果你是一个行业专家,你会发现GPT在安全、金融这些垂直领域,知识深度是不够的。很多公司自己训大模型都发现了这个特点,想让它能力很均衡,就会牺牲深度。”周鸿祎表示。
他认为,未来垂直大模型是重要的发展方向,通用模型和各领域专有的知识数据结合,让大模型从“万事通”变成政府通、行业通和企业通,这才是真正的价值,“最新资料表明,GPT4也是由8个垂直模型组成的,从侧面印证了这个观点。”
第二,公有大模型容易造成企业内部数据泄露。一方面,公有大模型不是本地部署,它与外部进行信息交流时必然存在数据泄露的风险;另一方面,公有大模型也无法实现组织内部权限的分级管理。因此,政府、企业使用公有大模型必然存在安全风险。
第三,对企业来讲,公有大模型无法保障内容真正可信。周鸿祎表示,大模型存在“幻觉”,也就是常说的一本正经地“胡说八道”,经常出现张冠李戴的问题,需要通过企业的内部搜索、内部知识库进行矫正。
第四,公有大模型无法实现成本可控。他举例称,许多企业其实只需要大模型写代码的能力,百亿级垂直大模型就能满足需求,如果使用千亿级大模型就是成本的浪费。在控制成本方面,垂直大模型将会有很大优势。在用公开数据训练的“通识”大模型基础上,训练专有大模型,就能做到“事半功倍”,为企业降本增效。
以下为演讲全文:
大家好,感谢主办方的邀请,很高兴参加尼山对话。今天我们讨论的主题聚焦“构建安全可信的人工智能”、“人工智能赋能百行千业”,最近360自研的认知大模型智脑也在相关方向有探索,借今天的机会,我想分享一些实践中得到的经验和思考。
这次GPT大模型的诞生代表着通用人工智能、强人工智能的到来,是真正的智能涌现。大模型能够真正地理解人类所有的语言,能够很自然地做出各种交流和推理,这意味着人工智能第一次完整地理解了我们人类世界的知识,并且已经从感知进化到了认知,不仅能够理解文字、语言,还能做出分析、规划。未来,传统算法将被代替,大模型在自动驾驶、机器人控制、蛋白质分析等很多重要领域都会大显身手。
目前产学研各界已经形成了共识,GPT大模型将会带来一场新的工业革命。我们都知道,数字时代最重要的是大数据,但大数据就像“石油”,难以直接使用。GPT的出现就像发电厂,把大数据从“石油”加工成了“电”,赋能百行千业。如今数字化已上升为中国的国家战略,其中产业数字化是重要的发展机遇,我认为产业数字化的终极目标就是智能化,而GPT大模型将会成为产业数字化重要的赋能者。
在这场工业革命中,大模型真正的机会在企业市场,作为生产力工具提升企业生产率。ChatGPT虽然是靠聊天功能“破圈”的,但这只是它的一种“亲民伪装”,实际上大模型绝对不是一个娱乐工具,而是工业革命级的生产力工具。如果大家留意就会发现,即使是个人消费者,最终还是会用大模型满足刚需,应用在办公场景里,成为提高办公效率的工具,比如公文写作等等。因此我认为,企业级市场才是大模型未来发展真正出彩的地方。
但是,当我们带着通用大模型真正走进政府、城市、行业、企业时就会发现,公有大模型无法直接使用。因为公有大模型存在以下四点不足:
第一,公有大模型虽然是通才,但它缺乏行业深度。我们之前认为GPT什么都会,但如果你是一个行业专家,你会发现GPT在安全、金融这些垂直领域,知识深度是不够的。很多公司自己训大模型都发现了这个特点,想让它能力很均衡,就会牺牲深度。所以未来垂直大模型是重要的发展方向,通用模型和各领域专有的知识数据结合,让大模型从“万事通”变成政府通、行业通和企业通,这才是真正的价值。最新资料表明,GPT4也是由8个垂直模型组成的,从侧面印证了这个观点。
第二,公有大模型容易造成企业内部数据泄露。一方面,公有大模型不是本地部署,它与外部进行信息交流时必然存在数据泄露的风险;另一方面,公有大模型也无法实现组织内部权限的分级管理。因此,政府、企业使用公有大模型必然存在安全风险。
第三,对企业来讲,公有大模型无法保障内容真正可信。这主要包含两个问题:一个是企业在日常生产经营过程中,知识库是实时产生的,并且不断变化。它不像公有大模型的通用知识,是一成不变的“百科全书”。因此,企业使用公有大模型无法满足时效性的需求。另一个是大模型自身的“幻觉”问题,也就是我们常说的一本正经地“胡说八道”。公有大模型经常出现张冠李戴的问题,需要通过企业的内部搜索、内部知识库进行矫正。这些都需要专有大模型才能实现。
第四,也是很多企业级用户关注的,公有大模型无法实现成本可控。举个例子,很多企业其实只需要大模型写代码的能力,这时候公有大模型写诗、写论文的能力就是多余的。也就是说,很多企业只需要百亿级垂直大模型就满足需求,如果使用千亿级大模型就是成本的浪费。这个成本不只是大模型的采购成本,还包括训练成本、部署成本、微调成本。在控制成本方面,垂直大模型将会有很大优势。因此,在一个用公开数据训练的“通识”大模型基础上,训练专有大模型,就能做到“事半功倍”,为企业降本增效。
大模型想要成为企业级的智能化赋能工具,必须要行业化、专有化,从万事通变成城市通、行业通、企业通。而企业落地大模型则需要分步来实现。我认为目前的当务之急叫做“小切口大纵深”,先把大模型最擅长、最成熟的能力用好。刚开始可以从办公场景入手。因为大模型不是万能的,最擅长最成熟的能力肯定是自然语言处理。而且办公场景能做到松耦合,与现有的业务系统无缝融合。具体来说,一些细分场景包括信息分析、知识管理、内容创作和智能客服等,让员工上手尝试,慢慢发掘大模型的能力,对大模型逐渐熟悉,之后再将大模型与业务进行深度融合。这样大模型的发展才能可控易用。
企业级场景要打造 “安全可信、可控易用”的专有大模型,我们在实践过程中也总结了一些心得,需要坚持五个原则,包括:安全原则,企业级应用必须是安全的大模型;可信原则,大模型要解决准确性、实时性的短板问题;可控原则,坚持把大模型定位在辅助工具上,确保人始终在业务决策的回路上;易用原则,这里面“数字人”、“数字员工”有很大的想象空间;最后是普惠原则,要让每个人都能用起来。时间关系,这里我想重点分享一下易用原则。
人工智能的发展要“以人为本”,大模型不能引发大规模裁员,而是要帮助企业员工提升能力和效率,成为易用的工具,让每个普通员工都能真正用起来。因此我认为,未来面向企业,数字员工会成为非常重要的一个概念。相比和机器进行复杂的交互,与“人”对话更符合我们的日常习惯,数字员工将大大降低大模型的使用门槛。未来也不只企业老板能拥有数字员工做助理,每个企业员工都能有若干数字助手,比如法务助理、财务助理、市场助理,来协助创作、策划、分析、总结等日常工作。
最后我想说,人工智能大模型这场工业革命已经到来,未来大模型在各个城市、各个行业、各个企业里将得到充分应用,市场的机会也才刚刚开始。360也将发挥过往在人工智能领域积累的经验和优势,帮助各地构建“安全可信、可控易用”的大模型,为产业数字化转型到智能化升级,贡献自己的一份力量。
谢谢大家!
- 免责声明
- 本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。