OpenAI最新大模型曝光：剑指多模态，GPT

首页 > AI资讯 > 行业动态 > OpenAI最新大模型曝光：剑指多模态，GPT

OpenAI最新大模型曝光：剑指多模态，GPT

新火种 2023-09-21

克雷西发自凹非寺量子位 | 公众号 QbitAI大模型之争，又卷起来了。据The information爆料称，OpenAI即将推出多模态模型GPT-vision。如果消息为真，这将是OpenAI在GPT-4之后推出的最大更新。另一边，谷歌的多模态模型进展也在最近传出，为的就是能和OpenAI抗衡。

目前为止，OpenAI还没有对爆料中的传闻做出回应，但此前发布过多模态模型测试。CEO奥特曼在回应有关GPT-5的传闻时，也暗示过GPT-4“正在增强”。究竟谁能更胜一筹，还得让子弹再飞一会儿。不能让Google抢了先我们先回到OpenAI，被爆料的多模态模型将搭载什么样的功能呢？首先是图像内容识别，比如根据手绘草图生成网页代码、输出可视化图表的文本分析等。

另一方面则是图像生成，通过简单的文本生成绘画、logo或表情包。虽然OpenAI没有对这次的爆料做出回应，但做多模态模型这件事本身只是个时间问题。3月份，OpenAI在发布GPT-4时，就曾推出了一个多模态GPT的预览版本。当时，OpenAI把DEMO提供给了研究帮助视障群体的机构Be My Eyes。除了这家机构之外，就再也没有人见过OpenAI的多模态模型是什么样子了。

在此之后，这个多模态模型更是杳无音讯。唯一和图像有点关系的，就是GPT-4的升级版代码解释器（后改名为高级数据分析）可以处理一些图片任务。但这是通过调用Python库实现的，而且也达不到AI中图像识别的程度，和多模态模型更是不沾边了。

有说法称GPT-vision迟迟没有推出的原因可能是对安全的担忧，担心被用于破解验证码和人脸识别系统。直到这次Google多模态模型Gemini的消息传出。

安全问题有没有解决不得而知，但也许OpenAI是真的急了，不能任由谷歌超越，才有了模型发布的传闻。另据爆料，OpenAI还在准备从头开始开发一个名为Gobi的多模态模型，不过训练还未开始。那么，谷歌这边的情况又是怎样的呢？Gemini来势汹汹来势汹汹的Gemini，让网友直言其或将成为游戏规则的改变者。

甚至有媒体夸张一些地说将有机会取代GPT-4。

Gemini主要由谷歌DeepMind团队开发。谷歌CEO皮查伊介绍，Gemini集成了多种技术，支持同时输出文本和图像，还可以使用工具和API。据悉，Gemini吸取了很多来自AlphaGo的经验教训，包括强化学习和树搜索技术。而且，凭借着拥有YouTube这一得天独厚的优势，海量的训练数据可以说是唾手可得。

实际上，Google也一直把OpenAI视为竞争对手。为了和ChatGPT较量，Google此前已经在Bard中加入过图像识别功能，但并未改变ChatGPT的地位。但这次推出的Gemini，OpenAI也感到害怕了。尽管竞争激烈，有一点倒是让谷歌和OpenAI不谋而合。那就是，把模型的能力变成真金白银。谷歌计划的Gemini提供方式是通过其Google Cloud Vertex AI云服务平台进行，预期价格为每个用户每月30美元。这一做法预计将成为谷歌新的收入来源，尤其是针对企业客户。而OpenAI这边，也已经开始通过金融服务等各种应用程序将GPT-4变为现金。此次多模态的角逐究竟鹿死谁手，我们拭目以待。参考链接：[1]https://www.theinformation.com/articles/openai-hustles-to-beat-google-to-launch-multimodal-llm[2]https://www.bigtechwire.com/2023/09/18/openai-is-ready-to-take-on-googles-gemini-with-gpt-vision/

Tags:

GPT 模型最新

免责声明: 本文所包含的观点仅代表作者个人看法，不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。交易和投资涉及高风险，读者在采取与本文内容相关的任何行动之前，请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。

OpenAI最新大模型曝光：剑指多模态，GPT

华知大模型5.0发布

三个大模型组队挑战o1，实测360多模型协作干掉提示词工程

浩鲸科技鲸智BI大模型发布，从算法炫技到价值落地

腾讯元器推出智能体新应用，支持公众号主打造专属大模型数字分身

大模型赋能智能座舱！NVIDIA深度适配通义千问大模型

热门文章

微信的AI搜索野心与腾讯的“双模型”押注

钉钉AI企业搜索面向所有用户免费开放

谷歌AI大牛吴永辉加盟字节跳动负责AI基础研究探索工作

eBay宣布与OpenAI合作将人工智能引入其电子商务平台

中国初创公司DeepSeek挑战全球人工智能巨头OpenAI

任意舞蹈任意学！宇树机器人又进化了：传Meta将采购

吃掉全球77％晶圆！NVIDIAAIGPU恐怖如斯：中国被严重打压

百度有史以来最强大模型！李彦宏：文心大模型4.5系列将开源

谷歌豪华阵容打造AI科学家，用测试时间计算加速科学发现