腾讯与福佑卡车联手!打造首个数字货运大模型,OCR识别准确率提升超20%
作者 | 程茜
编辑 | 心缘
智东西10月25日报道,本周一,腾讯与福佑卡车宣布将联合打造行业首个数字货运大模型。
目前,腾讯与福佑卡车从智能化OCR物流证件识别方向切入,目前已形成了端到端的OCR智能识别大模型能力,并针对物流证件识别、各类回单识别等场景实现了智能识别与自动处理,基于大模型OCR准确率相比福佑卡车传统模型提升20%以上。
下一步,腾讯与福佑卡车将在智能客服外呼、智能分析、智能分单系统等场景逐步展开合作。
福佑卡车技术合伙人陈冠岭告诉智东西,从福佑卡车内部来讲,现在的阶段智能客服是优先智能数据分析,因为传统的智能客服需要维护数据库、标准答案,但其实由于公司业务变化很快,维护成本很高,他们希望能看大模型能不能做到端到端的智能客服的解决方案,降低维护成本。他希望明年Q1、Q2具体的东西能跑起来,真实检验一下智能客服的效果。
他补充说,相比于智能客服,大模型应用于智能分析领域的挑战会更大。原因在于这一领域对数据的要求更高。因此,福佑卡车要根据具体方案才能决定内部上线产品节奏,他们希望下半年看到一些场景应用。
一、OCR准确率总体提升超20%,复杂三方打卡图识别率达95%
福佑卡车通过全链路数字化推动其业务降本增效已经有一定成果,货运准时率达到95.2%,货运服务事故率降至0.02%,车辆空驶率由行业平均值45%下降到6.6%,车辆空置率由行业平均值40%下降到24.8%,司机收入提高33%。
基于大模型技术,福佑卡车联合腾讯将实现物流货运行业的数字化智能化创新,从而实现运营效率和客户体验的全面提升。货运领域应用AI的门槛将会被降低,数字货运将进一步提升为智能货运。
腾讯智慧交流积累了物流行业解决方案的经验,今年6月,腾讯云发布行业大模型解决方案,通过腾讯云TI平台提供MaaS一站式服务;福佑卡车作为货运场景方,积累了大量的行业数据,深切知道行业痛点是什么。
因此,福佑卡车和腾讯将智能化OCR物流证件识别作为切入点,进一步延续到货运领域的关键岗位上,可能打造智能助手提升工作的效率,最后探索对整个行业进行赋能,实现上下游拓展。
第一阶段,福佑卡车和腾讯的智能化OCR物流证件识别已经落地,基于大模型OCR准确率相比传统模型提升20%以上。其中,图片信息匹配综合识别准确率达到95%以上、图片字段识别准确率达到99%,图片字段识别召回率为98%。
主要提升在于工程化提效,福佑卡车新增需要识别的证件图片时,只需要小样本量的训练机就可以达到传统OCR数千样本量以上的训练效果。
准确率也有所提升,物流货运行业特有的复杂三方打卡图片识别,准确率从90%提升到了95%以上。
自动化程度提升,省略了人工验证环节,基于智能化检测验证,能进一步降低人工成本。
下一步,腾讯和福佑卡车将在智能客服外呼、智能分析、智能分单系统方面进行深入合作和拓展。
二、基于高质量垂直语料,打造OCR、智能客服大模型
AI进入大模型时代,泛化性、通用性、实用性大大增强。
物流行业中企业积累了大量的场景化数据,依托于腾讯行业大模型方案在技术、平台、应用层面的构建能满足福佑卡车这类行业用户的场景化诉求。
传统OCR模型往往基于小模型做,识别过程包括检测、识别文字内容,智能结构化提取,然后通过小模型做堆积,每个环节都有一定折损,会导致OCR效果不佳。
并且其不具备阅读理解和推理能力,模型的复用性也不强。
腾讯OCR大模型可以做到端对端识别,整个模型的效果会比传统OCR模型有提升,即使企业不做精调,也能达到更好效果,还能实现单模型多任务处理,具备一定的阅读理解和推理能力。
这一大模型基于原生大模型,不经过训练可以直接支持常规下游任务,Zero–shot学习泛化字段召回率可达93%以上;企业落地时通过Prompt设计,可以不经过训练支持复杂的下游任务,Few-shot泛化字段召回率可达到95%以上;腾讯OCR大模型通过多模态技术,通过小样本精调解决传统OCR难题,比传统模型召回率提高3%-20%。
为了企业实现更低成本的落地,腾讯OCR大模型功能设计采用数据分组、字段描述子、标注检查、Badcase智能分析等。
并且,腾讯内部在TI-OCR上进行日常标注和建模,平均一个季度完成70000次标注任务,完成超100次模型训练任务。
OCR大模型精调能使其基于特定场景感知文字信息,核心的提升点在于训练样本更少、训练时长更高,对于复杂的场景和训练,迭代一个模型的时长在小时、分钟级。
对于物流行业的智能客服,其痛点在于对话效果不够智能、人工坐席服务效率不高、传统知识库整理及运营依赖人工,投入大、效率低。
因此,底层基于物流行业客服大模型,加上福佑卡车内部数据进行精调,智能客服的能力升级。
大模型在泛化性、理解性方面的能力提升,能解决复杂问题,并且基于知识库文档快速学习,知识点快速提炼,掌握知识的时间从月级升级到分钟级。
腾讯客服大模型能实现低成本训练和推理,将百亿大模型训练成本从64卡降低到8卡,千亿大模型从从128卡降到了32卡。并且,智能客服还能通过搜索引擎获取网络知识,提高回答的多样性和相关性。
大模型能建立实时更新的大模型向量数据库,将阅读理解的长度从2k提升到8k,上下文挖掘观点的能力也有大幅提升。
除了知识问答外,智能客服还需要完成任务型办理,如查订单、状态获取等,基于客服大模型就可以通过API调用完成任务构建。
结语:生成式AI席卷货运物流全链路变革
陈冠岭谈道,目前我国公路货运行业市场规模达到了5万亿元,但数字货运渗透率只有15%,市场规模为7000亿元。物流货运具有体系完善、环节众多、数据复杂、场景丰富等特性,一直以来都是前沿技术落地应用的重要领域。
大模型技术正在席卷各行各业,同样将为货运物流全链路运营效率、服务体验和业务创新带来巨大变革。
- 免责声明
- 本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。