智谱AICEO张鹏:中国大模型,从拥挤走向分层
中国大模型已进入第二场角逐中。整个生态走向分化,而智谱AI仍然希望做提供基座大模型的人。
智谱AI是目前市场受关注最高的大模型创业公司之一。它2023年截至目前的总计融资额达25亿元人民币,投后估值超过140亿元。消息显示,他们还在进行新一轮融资。
该项目由清华大学计算机系科研成果转化而来,是很早开始发力做大模型的公司之一。智谱AI CEO张鹏之前所在的知识工程实验室,有既做科研又做工程落地项目的传统。
智谱AI则脱胎于此前尝试的业务:科技情报系统。正是做这套系统期间,他们找准大模型赛道,于2020年开始投入。
这家公司的气质偏学院派和技术理想主义,张鹏对内有一句名言:“我们现在不管融多少、挣多少钱,都是我们通向AGI这条路上的盘缠。”
该公司的最新投资方集纳了一众巨头和知名财务投资机构,包括社保基金中关村自主创新基金(君联资本为基金管理人)、美团、蚂蚁、阿里、腾讯、小米、金山、顺为、Boss直聘、好未来、红杉、高瓴等机构及包括君联资本在内的部分老股东跟投。据了解,按照国家知识成果转化的相关规定,清华大学也在该项目占一部分股份。
2023年10月,智谱AI CEO张鹏在与腾讯新闻《潜望》作者对话时谈到,大模型相比上一代人工智能公司来说,给了我们一个机会:“它的能力是横向的,通用性的,泛化能力很强。”因此,这让新一代人工智能公司有机会做成“技术平台化公司”,而不是像之前那样,成为“顶天立地”式的垂直公司。
现在,中国大模型赛道正在从拥挤到分层。张鹏认为,大部分技术进步大抵如此:新技术产生,大家一拥而上;当技术发展到一定程度,自然而然地会沉淀,会分层——有些人解决底层的问题,有些人解决中间的问题,有些人解决上层的问题——这是自然而然形成的。“变成相对稳固而不是混乱的生态,大家互相促进。”
以下为对话节选。
01 久违的大佬牌局:这是我们通往AGI的盘缠腾讯新闻《潜望》:你跟我讲了一句话,我印象很深。你说,融资的钱是你们通往AGI道路上的“盘缠”。
张鹏:是我们内部开玩笑说的一句话。
腾讯新闻《潜望》:你们融了25亿人民币,现在“盘缠”够吗?
张鹏:25亿是累加起来。当然不够啊。算力涨这么厉害,怎么可能够?
腾讯新闻《潜望》:你们的股东有很多,既包括战略股东——美团、阿里、腾讯;又包括财务投资方——红杉、高瓴等。在互联网时代,这些人很难坐在一张牌桌的同一边。怎么把他们笼络进来?
张鹏:我们没有特别笼络,也没有挑。
我们一直秉持两件事:第一,认清自己的目标,做自己。第二,开放,我们跟谁都可以谈。如果大家认可我们做的事、我们的目标和理念,就可以合作。
大厂们大部分也有大模型的布局,但他们仍愿意出来投。一是因为,他们体量足够大,也很开放。二是我们愿意接受——我们认为这个生态未来会足够大,容得下。这个阶段开始考虑这些有点早。
腾讯新闻《潜望》:他们的态度会有一方说我要进;另一方说,他在,我就不愿意?
张鹏:还好。大家对我们团队比较包容。我们聊的更多是技术和对未来的想法,以及怎么去做的规划。
大家能坐到一起聊,也是因为不管是财投还是战投,打心底有一个愿望——我们赶上这样一个时代,希望为未来添点砖、加点瓦、加把劲。聊着聊着,大家就找到了共同点,然后一起看怎么把共同点放大。其他方面,business to business去聊好了。
腾讯新闻《潜望》:预计整体要花多少钱?
张鹏:我们计划是50到100亿。但很难预估。人最擅长的是做线性外推预测。但是线性外推你能考虑的因素有多少?它又不像大模型,你说你能把所有东西都整合到一起来做预测。我们没这个能力。
02 第二场角逐:其他人在分层,我们为什么留下来做基础大模型腾讯新闻《潜望》:中国大模型已进入第二场,你同意这个定义吗?
张鹏:我同意。
腾讯新闻《潜望》:一部分人认为,在第二场角逐中竞争的维度变了,上半年在追赶技术,现在很多人说他们要做应用、抢客户,怎么看这个变化?
张鹏:我不觉得大家“卷的事情”变了。本质是,原来大家卷或者关注的问题,基本达成了共识,没有太多分歧。
大家之前的分歧包括,是不是都要去做通用模型、模型是不是越大越好、是不是开源会影响到商业等。所有这些问题存在于初期的混沌阶段,是大家认知不一致时的反应。
现在大家逐渐达成共识,认为以上这些问题虽然重要,还是需要有人持续做,只是不一定每个人都去做同样的事——这样才会进入到第二阶段。觉得不想做这个事的人,他该干嘛?也因为第一阶段卷完,大家觉得基座模型能力已经OK,我们把它当作“锤子”去砸砸“钉子”看,因此进入第二阶段。
并不代表第一阶段的问题没了,它会沿着轨道继续前进,甚至加速前进。
腾讯新闻《潜望》:你们呢?要继续解决没有解决的问题吗?
张鹏:我们从来没变过,坚持去做通用基座模型。
通用智能水平的提升,是我们坚持的一个目标。除非我们某一天做不动这件事了,或者看不到它的目标了。现在远不到那个阶段。
进入第二阶段,衡量这件事的标准,就需要加上一些实用性指标——比如通用智能能力的标准、在实际应用场景中的效果、服务过多少客户等等。并不是大调头。
腾讯新闻《潜望》:其他人太急了吗?
张鹏:所有技术进步规律一样:新技术产生,大家会一拥而上搞技术。当技术发展到一定程度,自然而然地会沉淀,会分层。
有些人解决底层的问题,有些人解决中间的问题,有些人解决上层的问题。是自然而然形成的。解决这些中上层问题,尤其是接近用户真正现实需求的人,会把解决问题碰到的困难下沉到底下,做底层的人去解决——变成相对稳固而不是混乱的生态,大家互相促进。
腾讯新闻《潜望》:为什么你们持续做基座大模型?
张鹏:我们坚持做这件事情和最初的期许有关系,我们的slogan叫“让机器像人一样思考”,就是AGI。你很难想象把它放到特定垂直场景实现,这个事情(上一代AI公司)证明过不可行了。比如用AI人脸识别、下国际象棋、下围棋,so what?
03 中国最像OpenAI的公司?腾讯新闻《潜望》:你们是中国最像OpenAI的公司之一?
张鹏:这是大家给我们贴的标签。我们更愿意说,我们是有跟OpenAI同样目标的公司。
腾讯新闻《潜望》:你怎么看OpenAI的一些现状?比如ChatGPT用户量下滑。
张鹏:前段时间有文章预测OpenAI今年营收大概12亿到13亿美金,50%以上来自API。这些API用户哪儿来的?是从原来ChatGPT的网页端应用转过去的。
为什么会这样?跟生成式AI从第一阶段到第二阶段的转变有关。大量的用户在使用过ChatGPT这种轻量级的应用后,体验到了大模型的能力,会产生更多想法。他们也会由此想要尝试做上层应用。大家从看热闹、试试看的心态,转变成投入其中去做一些事情。
相比之下,如果我们去观察ChatGPT用户还在大幅上升阶段的时候,他们的API收入就很少,大概几千万美金。
腾讯新闻《潜望》:我们上次聊是今年的四五月,当时团队才两百人,现在四百多。目前团队是怎样的构成?
张鹏:目前跟研发相关的大概占百分之六七十。研发人员里包含数据、产品、解决方案等等,这些也跟技术产品相关,还有一小部分是职能部门。最近我们在市场方面投入了一些资源,市场人员后续会增加多一些。销售几十个人,百分之十几的样子。但整体上,我们还是保持研发人员占大比例。
腾讯新闻《潜望》:怎么思考商业模式?
张鹏:我们很早就想得比较清楚。因为确实是B端的付费意愿比C端好很多,所以从一开始,我们就推出了商业化落地方案,主要面向B端。
腾讯新闻《潜望》:预计多久可以盈亏平衡?
张鹏:早期做过一些预测,后来发现变化太快,包括算力大幅度涨价、竞争加剧。你很难做到精确预测。早期我们预估可能在2026年、2027年左右。现在需要调整。
腾讯新闻《潜望》:中国to B环境惨烈,一个赛道有N家公司做,会出现从卖技术、卖产品,变成卖本地化、定制化服务——这是大家不愿意看到的,又走回上一代AI公司的老路。
张鹏:上一代AI公司给我们的教训是,当你把自己投入到垂直化,“顶天立地”做这样一件事情,成本和收益很难平衡。
大模型给了我们一个机会——它的能力是横向的,通用性的,泛化能力很强。因此,大家有希望做成上一代AI公司没有做成的“技术平台化公司”。这也是为什么我们会坚持做通用基座模型。
通用基座和平台是一个概念。我们提供一个通用底座,跟大家采用合作的方式去构建生态。我们希望合作伙伴能在基座之上做更多事情,创造更大的用户价值。他们有自己的生存之道,知道怎么服务客户、降低成本、获取更大利润空间。我们希望可以与合作伙伴一起发展。
腾讯新闻《潜望》:短期算力问题怎么解决?
张鹏:这是个大问题,幸好我们动得比较早一点,初步做了一些准备工作。
腾讯新闻《潜望》:长期会是个问题吗?
张鹏:我们倒不担心长期。最怕的是什么呢?围三阙一。
就是说,我不把你彻底封死,因为兔子急了还要咬人呢。如果把你所有的生路都堵死,你自然而然地就会想起来反抗,你就要搏命。围三阙一意思就是我让你很难受,但是又给你留一条生路,你又死不掉。这时候,你是最难的时候。
04 做CEO的快乐与烦恼:商业环境的残酷超出我想象腾讯新闻《潜望》:从实验室到创业环境,觉得自己有什么变化吗?
张鹏:挺大的。学校比较单纯、简单,做的是科研、工程、转化,还没那么大压力。
走出来做企业要考虑更多,围绕的不再是兴趣和崇高的研究目标。做商业,你可以有宏大的愿景和目标,但也要考虑脚下。你得追求商业利益,否则没法继续往前发展。
腾讯新闻《潜望》:做CEO,喜欢的部分是哪些?讨厌的是哪些?
张鹏:喜欢跟各种各样的人聊。人的思考,是在跟人交流过程中产生的。
今天早上听了一位院士的报告,他提到所谓以意识为基础的智能,指的是具有一定基本智能的智能体,在交流过程中产生的一种事物,这是意识。
我们现在研究的问题,归结到最后是哲学思考。认知是什么?认知的下一步是什么?有一种说法,认为认知的下一步是意识。
跟人交流,要慢慢把自己的想法整理得更清晰,必须要表达出来给大家听。当你说出来,对方给你反馈——听到的人或者眼睛一亮,或者皱皱眉头,或者看着你半天不说话,这是正反馈和负反馈。正反馈会告诉你“这样挺好”,负反馈告诉你“这样不对”,这是不断在磨合、调整你大脑的模型。只有不断地用、输出、反馈、输出、反馈,不断地接受输入,才最有效。
腾讯新闻《潜望》:讨厌的呢?
张鹏:睡觉时间变少。最近每天只睡5小时不到。
腾讯新闻《潜望》:走出实验室,商业世界极大超出你预期的是什么?
张鹏:商业环境里的残酷,超出我的想象。
我的导师做知识图谱、知识工程相关的研究。以前一大波企业做知识图谱,现在很少有人提起。这件事技术还在演进,没那么完美,很多问题等待解决,但市场已经卷得太厉害,只能用价格战。这就是一个饮鸩止渴、恶性循环的情况了。
腾讯新闻《潜望》:大模型会不会同样迈入这样的困境中?
张鹏:大模型有一些不一样的地方,在于全民先洗了一波脑。洗脑把想象空间拓到足够大。风险是,预期太高。我们始终认为,怎么样尽快把技术水平提升上去是关键;而不是停在原地,去想更多商业化的事情。
05 中美AI发展的最大差异:硅谷生态的磨合,不像国内损耗这么大腾讯新闻《潜望》:对明年有什么预期?
张鹏:最核心的是,要把技术先做上去,对标GPT-4不是靠喊的,要靠做。
腾讯新闻《潜望》:预计什么时候能对标达到GPT-4的水平?
张鹏:可能到年底,初步达成一定的效果,不像现在这样差距这么大。
我们的技术升级目前瞄向了GPT-4V。我们最新发布的ChatGLM3具备了多模态理解能力、代码增强模块以及网络搜索增强能力,性能也大幅提升。但会继续向前走。
腾讯新闻《潜望》:预计基座大模型能活下来几家?包括大公司。
张鹏:我很干脆地举了一只手——5个——不负责任的猜测嘛。
第一,这个事做起来太耗钱,从资源的角度,也不太可能撑得起特别多。第二,从需求程度看,也不是每个大厂或创业企业都会选择这件事。
腾讯新闻《潜望》:创业公司会有几家?
张鹏:至少会有两家。
腾讯新闻《潜望》:从去年到今年,中美AI发展有什么特别大不同吗?
张鹏:8月初去了一趟美国参加学术会议,作报告也有同台竞技的大模型专家,包括OpenAI的研究人员。有可能是OpenAI较早地占据了市场,美国很快就进入了各就各位的状态。
美国大模型的生态磨合,不像是中国大模型发展那么剧烈,损耗那么大。大家很快速就走入了——做模型的去做模型,做应用的去做应用的阶段,其中有很多细分方向。不会说大家卷成一锅乱粥。
第一个感受就是他们特别快速地就决定了模型做不做,如果要做应用,做什么应用,想得比较清楚。
第二个感受是,脑洞挺大的,特别活跃,想法天马行空。
腾讯新闻《潜望》:国内摩擦体现在哪?
张鹏:太挤了。有一种说法是,国内如果有一个人发现一件事可以做,大家就全都去做,很少有人去思考,有没有第二件、第三件、第四件可以去做。
但这种说法是不成立的,更像是一种潜意识里的自我PUA。投资人在说,老百姓在说,创业者在说,大家都在说,说着说着自己就相信了。实际情况不一定如此,我们也可以去做创新的事情。
我的另一个感受是,美国创业者格局不一样,美国人国内的一个体育联赛冠军,他取名字叫World Champion;开一个什么公司,或者做什么事情,就Universal什么。所有人认为全世界是我的,他们确实是比较自信。
腾讯新闻《潜望》:面对拥挤的赛道,智谱AI显著性优势是什么?
张鹏:本质问题是我们对这件事情的认知和目标的设定。你心有多大,舞台就有多大。
本文作者:张小珺,来源:腾讯科技 ,原文标题:《智谱AI CEO张鹏:中国大模型,从拥挤走向分层》
- 免责声明
- 本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。