昆仑万维：天工通用大模型推理能力超过GPT-3.5和LLaMA2

首页 > AI资讯 > 最新资讯 > 昆仑万维：天工通用大模型推理能力超过GPT-3.5和LLaMA2

昆仑万维：天工通用大模型推理能力超过GPT-3.5和LLaMA2

新火种 2023-09-22

　　9月16日，昆仑万维发布消息称，在权威推理榜单Benchmark GSM8K 测试中，昆仑万维自研的通用基座大模型天工大模型以80%的正确率脱颖而出，大幅领先GPT-3.5（57.1%）和LLaMA2-70B（56.8%），“标志着天工大模型的推理能力达到全球领先，接近GPT-4”。

　　消息提到，天工大模型不仅在推理性能上有着强大的竞争力，在MMLU、C-EVAL、HumanEval等三项数据集测试中也同样表现出色。在MMLU数据集测试中，天工大模型以65%准确率超越了LLaMA-65B的63.4%；在C-EVAL数据集测试中，天工大模型以65%准确率超越了GPT3.5的54.4%。在HumanEval数据集测试中，天工大模型以37.2%的准确率超过了PaLM-540B（26.2%）、LLaMA-65B（23.7%）、LLaMa2 -70B（30.5%）。

（文章来源：北京商报）

Tags:

TensorFlow 模型能力

免责声明: 本文所包含的观点仅代表作者个人看法，不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。交易和投资涉及高风险，读者在采取与本文内容相关的任何行动之前，请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。

昆仑万维：天工通用大模型推理能力超过GPT-3.5和LLaMA2

科大讯飞与中国绿发携手发布泰山大模型

华知大模型5.0发布

三个大模型组队挑战o1，实测360多模型协作干掉提示词工程

浩鲸科技鲸智BI大模型发布，从算法炫技到价值落地

腾讯元器推出智能体新应用，支持公众号主打造专属大模型数字分身

热门文章

100亿！中关村科学城科技成长三期基金发布

2025商业新愿景｜面壁智能CEO李大海：端侧模型将加速变得“无处不在”

上海专家完成国内首例达芬奇手术机器人辅助自体组织乳房再造手术

科创板晚报|优刻得、永信至诚发布严重异动公告富创精密收到行政监管措施决定书

机器人“赛道”新年加速“跑”我国智能机器人产业企业数量超45万家

港股早报｜两部门鼓励外资在华开展股权投资美团将为全职及稳定兼职骑手缴纳社保

【焦点复盘】指数全天放量分化，端侧AI、AI医疗齐头并进，DeepSeek概念分化加剧

当“AI网络”重新改写自动驾驶游戏规则

LEAP2025收获250亿美元投资创历届新高明年在港举办LEAPEast