元象首个多模态大模型XVERSE-V开源，刷新权威大模型榜单，支持任意宽高比输入

首页 > AI资讯 > 最新资讯 > 元象首个多模态大模型XVERSE-V开源，刷新权威大模型榜单，支持任意宽高比输入

元象首个多模态大模型XVERSE-V开源，刷新权威大模型榜单，支持任意宽高比输入

新火种 2024-04-29

元象首个多模态大模型 XVERSE-V 开源，刷新权威大模型榜单，支持任意宽高比输入

人类获取的信息83%来自视觉，图文多模态大模型能感知更丰富和精确的真实世界信息，构建更全面的认知智能，从而向AGI（通用人工智能）迈出更大步伐。

元象今日发布多模态大模型 XVERSE-V ，支持任意宽高比图像输入，在主流评测中效果领先。该模型全开源，无条件免费商用，持续推动海量中小企业、研究者和开发者的研发和应用创新。

XVERSE-V 性能优异，在多项权威多模态评测中超过零一万物Yi-VL-34B、面壁智能OmniLMM-12B及深度求索DeepSeek-VL-7B等开源模型，在综合能力测评MMBench中超过了谷歌GeminiProVision、阿里Qwen-VL-Plus和Claude-3V Sonnet等知名闭源模型。

元象首个多模态大模型 XVERSE-V 开源，刷新权威大模型榜单，支持任意宽高比输入

图. 多模态大模型综合评测

1融合整体和局部的高清图像表示
传统的多模态模型的图像表示只有整体，XVERSE-V 创新性地采用了融合整体和局部的策略，支持输入任意宽高比的图像。兼顾全局的概览信息和局部的细节信息，能够识别和分析图像中的细微特征，看的更清楚，理解的更准确。
注：Concate* 表示按列进行拼接
这样的处理方式使模型可以应用于广泛的领域，包括全景图识别、卫星图像、古文物扫描分析等。
示例- 高清全景图识别、图片细节文字识别
免费下载大模型
Hugging Face：https://huggingface.co/xverse/XVERSE-V-13B
ModelScope魔搭：https://modelscope.cn/models/xverse/XVERSE-V-13B
Github：https://github.com/xverse-ai/XVERSE-V-13B
问询发送：opensource@xverse.cn
商业合作
微信添加：lixing_lixing
元象持续打造国内开源标杆，在国内最早开源最大参数65B 、全球最早开源最长上下文256K 以及国际前沿的MoE模型，并在SuperCLUE测评全国领跑。此次推出MoE模型，填补国产开源空白，更将其推向了国际领先水平。
商业应用上，元象大模型是广东最早获得国家备案的模型之一，可向全社会提供服务。元象大模型去年起已和多个腾讯产品，包括QQ音乐、虎牙直播、全民K歌、腾讯云等，进行深度合作与应用探索，为文化、娱乐、旅游、金融领域打造创新领先的用户体验。
2多方向实际应用表现突出
模型不仅在基础能力上表现出色，在实际的应用场景中也有着出色的表现。具备不同场景下的理解能力，能够处理信息图、文献、现实场景、数理题目、科学文献、代码转化等不同需求。
图表理解
不论是复杂图文结合的信息图理解，还是单一图表的分析与计算，模型都能够自如应对。
视障真实场景
在真实视障场景测试集VizWiz中，XVERSE-V 表现出色，超过了InternVL-Chat-V1.5、DeepSeek-VL-7B 等几乎所有主流的开源多模态大模型。该测试集包含了来自真实视障用户提出的超过31,000个视觉问答，能准确反映用户的真实需求与琐碎细小的问题，帮助视障人群克服他们日常真实的视觉挑战。
VizWiz测试示例
看图内容创作
XVERSE-V 具备多模态能力的同时保持强大的文本生成能力，能够很好胜任理解图像后创造性文本生成的任务。

教育解题
模型具备了广泛的知识储备和逻辑推理能力，能够识别图像解答不同学科的问题。
百科解答
模型储备了历史、文化、科技、安全等各类主题的知识。
代码撰写
自动驾驶
情感理解与识别
元象公司介绍
一元复始，万象更新。元象 XVERSE 于 2021 年初在深圳成立，是国内领先的 AI 与 3D 技术服务公司，致力于打造 AI 驱动的 3D 内容生产与消费一站式平台，愿景为“定义你的世界”。
元象创始人姚星是前腾讯副总裁和腾讯 AI Lab 创始人、国家科技部新一代人工智能战略咨询委员会成员。元象累计融资金额超过 2 亿美元，投资机构包括腾讯、高榕资本、五源资本、高瓴创投、红杉中国、淡马锡和CPE源峰等。
元象获国家“专精特新”、“高新技术企业”认证，团队目前有75%为研发人员（60%为硕博学历）。公司积极推动前沿技术自主研发，在3D领域，自研行业引领性的“端云协同” 3D 互动技术，开创零门槛（轻）、一站式（快）、高品质（美）全新 3D 体验；在AI领域，公司最早开源国内最大参数大模型（650亿）、世界最长上下文长度（256K）在内的一系列高性能大模型，免费可商用，将国产开源提升至国际一流水平，积极推动大模型国产可替代和行业应用发展。
元象已经为多家龙头企业提供一站式技术与服务，包括：澳门大三巴、南京大报恩寺、央视、腾讯音乐TMELAND、华为、一汽大众、阿迪达斯、中国平安、中科院深圳先进院等。
公司注册名：深圳元象信息科技有限公司
官网：www.XVERSE.cn
官微：元象 XVERSE
Logo下载
链接:https://pan.baidu.com/s/1fB-zoITVJZ7Znv5IVe-fZg
提取码:rav0

Tags:
模型权威

相关推荐

NVIDIA深度适配通义千问大模型，推出舱驾融合大模型解决方案
2024-09-20

NVIDIA深度适配通义千问大模型推出舱驾融合大模型解决方案
2024-09-20

哈啰亮相2024云栖大会：展示AI整体布局及大模型案例
2024-09-20

在线可玩！智谱开源图生视频模型，网友直呼Amazing！
2024-09-20

奥特曼：o1仅仅是“推理模型的GPT-2”；黄仁勋：我给你加速50倍
2024-09-20

免责声明

本文所包含的观点仅代表作者个人看法，不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。交易和投资涉及高风险，读者在采取与本文内容相关的任何行动之前，请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。

热门文章

我国首个林草行业大模型研发成功

小K播早报|2025中国互联网企业家座谈会召开“天工”夺得全球首个人形机器人半马冠军
2025-04-21 13:22

前高通高管任小米芯片平台部负责人；2024年我国再生资源回收总量超4亿吨
2025-04-19 11:21

杭州：争夺机器人第一城
2025-04-24 11:27

美国对华芯片管制将适得其反？专家：华为等中国厂商将受益！
2025-04-23 11:21

蒙曼谈人工智能冲击：守住人类对于生活的感受
2025-04-21 11:28

信银理财董文赜：拥抱变革向新求质——共赴银行理财高质量发展新征程
2025-04-24 13:24

成立香港仔机器人，国华（00370）按下人工智能转型加速键
2025-04-24 11:27

分析师：美国禁售AI芯片适得其反给中国送上巨大胜利
2025-04-22 18:27

浩物股份：公司暂未本地部署接入DeepSeek大模型
2025-04-21 11:27