元乘象Chatimg3.0来了，赶超GPT-4V，还给出产业升级新打法

首页 > AI资讯 > 最新资讯 > 元乘象Chatimg3.0来了，赶超GPT-4V，还给出产业升级新打法

元乘象Chatimg3.0来了，赶超GPT-4V，还给出产业升级新打法

新火种 2023-11-01

最近，AI 领域都在思考一件事：多模态大模型落地产业，好的打法应该是什么？通用人工智能时代正在到来，AI 大模型技术已成为数字经济下基础设施建设的重要支撑，也成为产业智能化转型的核心「引擎」，AI 大模型 + 产业应用迎来了前所未有的发展机遇。在 10 月 28 日举办的 CNCC 2023「超智融合 AI 大模型应用落地发展论坛」上，智子引擎发布了「元乘象 Chatimg3.0」，展示了多模态通用生成模型「元乘象 Chatimg3.0」的最新进展与落地探索。Chatimg3.0 核心技术的升级迭代元乘象 Chatimg3.0 是一个超精细识别、少幻觉的多模态大模型，同时支持多图理解、物体定位、OCR 等功能。Chatimg3.0 给硬件设备装上了大脑，可实现更自然更流畅的人机交流，为 AI 多模态大模型赋能产业应用打下了坚实的基础。与 Chatimg2.0 相比，Chatimg3.0 主要进行了两方面的升级，包括第一阶段的预训练（描述、检测、OCR 等多任务训练）以及第二阶段的指令微调（高质量的人工精筛指令集）。为更好的评估多模态大模型的能力，智子引擎构建了一个全新的多模态对话测试集，从描述、推理、检测、问答、业务五个方面对模型能力进行评测，而且在问答和业务两个方面的能力上赶超 GPT-4V，展现出了国产大模型优秀的发展潜力。

以下是 Chatimg3.0 对比 GPT-4V 在测试中的具体表现：描述：

左：Chatimg3.0，右：GPT-4V。推理：

左：Chatimg3.0，右：GPT-4V。

检测：

左：Chatimg3.0，右：GPT-4V。问答：

左：Chatimg3.0，右：GPT-4V。

左：Chatimg3.0，右：GPT-4V。重点领域探索应用目前，智子引擎已经将「元乘象 Chatimg3.0」应用于全域防控和无人机巡检等领域，通过与无人机、电子探头等前端感知设备的融合，升级传统巡检和安防，实现了 AI 缺陷识别、异常检测、行为分析、重点监控、自主巡查、风险预测等功能，推动了 AI 工程化革新进程。

作为国内首个多模态大模型研发团队，智子引擎不仅在人才和技术上拥有先天的优势，多个知名投资机构和 IT 行业龙头的天使投资，也让这家公司「如虎添翼」。在软通动力、华软科技等知名企业的协同助力下，融合「元乘象 Chatimg3.0」研发的「智子・天穹」和「智子・天巡」系统一经面世便得到了行业的关注，产品被快速应用于城市治理、智慧电力、管道巡检、园区管理、农业、金融等多行业应用场景，并逐步开始试点部署。

未来，为了加速大模型产业应用落地，促进数字经济可持续发展，智子引擎将继续加强模型训练和能力升级，汇聚行业顶尖人才和优势资源，为大模型助力产业升级不遗余力。核心模型「元乘象 Chatimg」未来还会在 AI agents、具身智能等方向持续发力，并将收获更多行业关注。

Tags:

深度学习打法

免责声明: 本文所包含的观点仅代表作者个人看法，不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。交易和投资涉及高风险，读者在采取与本文内容相关的任何行动之前，请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。

元乘象Chatimg3.0来了，赶超GPT-4V，还给出产业升级新打法

亿嘉和申请深度学习专利，能够适用于多种类型的旋钮状态识别

纬德信息新注册《基于深度学习的人脸检测与识别系统V1.9》项目的软件著作权

机器学习实现了脑机语言翻译，距离“意念交流”还有多远？

AI十人谈⑤｜黄铁军：人工智能或与工业革命、电力革命相提并论

年化收入突破16亿美元OpenAI继续疯狂变现

热门文章

全球首次！人形机器人将与人类一起跑“半马”

政协委员甄子丹：人工智能对电影行业既是冲击也是鼓励

全国人大代表刘庆峰：发展AI新岗位，试点“AI失业保障专项保险”

工学博士娄勤俭：我对人工智能有偏爱

我国首个林草行业大模型研发成功

平稳开局！今年一季度我国货物贸易进出口10.3万亿元，增长1.3%

前高通高管任小米芯片平台部负责人；2024年我国再生资源回收总量超4亿吨

人工智能概念股午后拉升，科创人工智能相关ETF涨近4%

撬动千亿资本杭州加快建设人工智能产业高地