国内首个向量数据库标准发布!支持千亿级规模腾讯云:推进大模型产业应用
对于国产AI大模型而言,向量数据到底有何战略意义?
“未来的AGI时代,大模型是提供算力和调度的智能平台。向量数据库,就是智能化数据调度平台的中枢,这是我们对它的战略定位,对它的预期较高。”11月15日,腾讯云数据库副总经理兼向量数据库负责人罗云在接受时代周报记者采访时表示。
11月15日,国内首个向量数据库标准揭开面纱。在腾讯云向量数据库技术及产业峰会上,腾讯云宣布全面升级向量数据库多项核心性能,最高支持千亿级向量规模和500万QPS峰值能力,并与信通院一起联合50多家企业共同发布了国内首个向量数据库标准,推进向量数据库及大模型相关产业走向大规模应用。
今年以来AI大模型如火如荼,众多行业相关人士都曾坚定表示“大模型将改变千行百业”。时至今日,围绕大模型的讨论已进入“产业落地层面”。
据时代周报记者此前从投资侧了解,向量数据库被视为AI大模型继算力后的下一关键要素,也是多模态大模型向智能体进化的关键一环,对于推动大模型在垂直行业的落地具有重要作用。
向量数据库虽然是下一个风口,但腾讯并非追逐风口,而是早有布局。今年7月,腾讯云正式发布了AI原生(AI Native)向量数据库Tencent Cloud VectorDB。该数据库是国内首个从接入层、计算层、到存储层提供全生命周期AI化的向量数据库。
解决大模型应用难点
在本次峰会上,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生表示:“向量数据库不仅是支撑大模型的重要基础设施,也正在成为企业以数据驱动打造未来竞争力的重要一环。”
今年7月腾讯云发布向量数据库后,经过了多次迭代。据腾讯云方面介绍,在优化版的IVF索引支持下,已从最初的十亿向量规模扩展到了现在的千亿规模。同时,不断优化索引的压缩算法,让相同的内存可以存储5-10倍的数据。在智能化升级方面,腾讯云向量数据库集成Embedding功能,让用户无需关注向量生成过程,就可以实现快速处理数据,实现用自然语言和数据对话,助力企业加速拥抱AGI生态。
今年8月,深圳投控资本投资总监杨帆曾对时代周报记者表示,从行业脉络上看,下一个热点是多模态大模型,再下一个是向量数据库。杨帆认为,每一家有核心能力的大模型公司都应该有自己的向量数据库,如果没有向量数据库,大模型就是空中楼阁。将来要update大模型系统、数据库时,如何保障客户数据安全性、私密性就会是个问题。
“只有具备了预训练多模态大模型和向量数据库等能力,才有可能做智能体。这里面任何一项不具备,都演化不到智能体。”杨帆表示。
据时代周报记者了解,向量数据库是一种非结构性数据库,具有速度快、存储大、可随时扩容三大特性,而之前的数据库都是结构化数据库。
关于向量数据库的搭建和迭代,对腾讯未来与企业合作和数据安全性保障上的意义,罗云对时代周报记者解释道:“现在业内推进大模型应用的难点是,企业有许多数据非常注重保密性,无法随意调用。现在我们可以通过向量数据库把用户的私域数据变成向量存储起来,只在一次交互的过程中携带部分数据给大模型进行推理。好处是向量数据库可以部署在客户的CRM上或者私人机房里,大模型只能在交互的过程中拿到客户数据,可以提高用户隐私数据安全方面的保障。”
加速产业落地
本次峰会上,国内首个向量数据库技术标准《向量数据库技术要求》正式发布。
据了解,这份由腾讯云联和信通院等超50家企业联合编制的标准,将为向量数据库技术和产业的有序发展提供专业规范。为推动大模型产业更快创新发展,腾讯云还与硬件厂商、大模型厂商、行业代表等联合成立了“AGI技术生态联盟”。
为了加速向量数据库在企业的大规模应用,腾讯云还推出了国内首个端到端的向量数据库解决方案,通过文本智能化分割、选择向量化模型、帮助客户建立索引,再经智能化排序实现端到端的数据接入体验。将端到端召回率提高30%,缩短数据接入AI的时间。
腾讯云副总裁陈平表示:“腾讯云积极参与向量数据库相关标准制定,并通过搭建AGI技术生态联盟,与上下游伙伴一道,加强产业合作,打造更多的行业解决方案,加速大模型落地。”
目前腾讯云向量数据库已经累积服务了腾讯内部40多个业务,日请求量达1600亿次,服务了包括博世、销售易、搜狐、好未来、链家等在内的超过1000家外部客户。例如,在SaaS领域,腾讯帮助企业客户快速构建私域知识库、智能客服系统;在电商行业,使用向量数据库来提升推荐、搜索、广告业务的推荐效果;在出行行业,使用向量数据库来加速自动驾驶模型训练,此外,在教育行业以及文创等行业也有广泛应用。
对于未来大模型在产业上的应用落地趋势,此前商汤研究院的田丰院长对时代周报记者分析道,参照Garnter技术成熟度曲线,AI大模型已经从“创新启动期”进入“期望膨胀期”,在天使投资进入后,将在“多模态基础模型”(例:GPT-4)、“领域大模型工具软件”(例:Runway)、“垂直行业大模型解决方案”(例:BloombergGPT)三个方面,快速试错,并在下一个阶段校准产业价值型产品、淘汰非刚需性技术。
关于向量数据库未来对大模型行业的影响,罗云表示:“未来大模型提供计算能力,而向量数据库把人类世界所有的数据流转调用起来,作为枢纽搭建数据平台,通过数据平台加上计算平台,走向未来的AGI时代。”
(文章来源:时代周报)
- 免责声明
- 本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。