马斯克发布Grok2测试版逻辑能力更强新增文生图功能

首页 > AI资讯 > 最新资讯 > 马斯克发布Grok2测试版逻辑能力更强新增文生图功能

马斯克发布Grok2测试版逻辑能力更强新增文生图功能

科创板日报 2024-11-16

《科创板日报》8月14日讯（编辑宋子乔）北京时间8月14日下午，马斯克旗下xAI公司的第二代AI大模型Grok 2测试版本正式发布，包括Grok 2和Grok 2 mini两个版本，实测支持中文提问和中文回答，目前仅X Premium及Premium+用户可体验，非X订阅用户可以在LMSYS大模型竞技场（Auto Arena of LLMs，专为大模型设计的评估平台）中，免费体验Grok 2的早期版本模型sus-column-r。

马斯克在去年4月注册了xAI公司，今年5月，xAI官宣获得60亿美元的B轮融资，这轮融资使该公司的估值达到约240亿美元。xAI在今年先后推出了Grok 1和升级版Grok 1.5。

马斯克盛赞：“Grok是火箭速度”。

评测显示，Grok 2测试版的逻辑推理能力有较大提升，该模型还具备文生图能力，信息显示其使用Black Forest Labs 的FLUX.1模型生成图像。

Grok 2测试版不仅准确解答了“9.8和9.11哪个大”，还能数清草莓（strawberry）里有多少个“r”，这些可谓人类测试大模型的经典难题。

X平台的用户已经上传了许多由Grok 2测试版模型生成的照片。

在GPQA、MMLU、MMLU-Pro、MATH、MathVista等多项测评中，Grok 2的得分都超过了GPT-4 Turbo、Claude 3 Opus、Gemini Pro 1.5等主流模型。另据知名度较高的研究机构Large Model Systems Organization（简称LMSYS）最新发布的评测数据，Grok 2早期版本（代号sus-column-r）已经杀入LMSYS推出的大模型竞技场Chatbot Arena排行榜前三，与GPT-4o并列。

Grok 2早期版本sus-column-r的Elo得分情况

Grok 2测试版本的发布，标志着该模型距离正式商用又迈出一步。

xAI计划在本月稍晚时候，推出Grok 2正式版本的企业API。xAI表示将强化安全功能，包括强制性的多因素身份验证（如Yubikey、Apple TouchID或TOTP），并提供了详尽的流量统计数据和高级计费分析服务，支持数据导出。

另外，马斯克此前透露后者将在今年年底左右发布更新版本的大模型Grok 3。

今年4月，马斯克在接受挪威主权基金负责人Nicolai Tangen采访时表示，Grok 2需要大约2万张H100来进行训练。Grok 3所需的算力资源只多不少，马斯克在上个月称，xAI公司一直在训练Grok 3，该模型将使用10万块英伟达H100芯片进行训练，其水平将与尚未发布的OpenAI GPT-5相匹敌，甚至超越GPT-5。

Tags:

GPT 逻辑能力

免责声明: 本文所包含的观点仅代表作者个人看法，不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。交易和投资涉及高风险，读者在采取与本文内容相关的任何行动之前，请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。

马斯克发布Grok2测试版逻辑能力更强新增文生图功能

深信服专家：以AI对抗AI提升开源软件防护能力

AI心理推断能力或与人类相当

赛意信息“基于善谋GPT的PCB行业大模型及应用”入选2024年人工智能先锋案例集

AI教育大爆发前夜，智谱华章携手豆神教育的背后逻辑

专家谈电商新商业环境：AI加速数字供应链发展，用户逻辑取代流量逻辑

热门文章