GPT-4写代码不如ChatGPT，误用率高达62%！加州大学两位华人开源代码可靠性基准RobustAPI - 新火种

热门关键词

文心一言 AI copy btc 斑马腾迅 aa 1 iPollo sd

首页 > AI资讯 > 最新资讯 > GPT-4写代码不如ChatGPT，误用率高达62%！加州大学两位华人开源代码可靠性基准RobustAPI

GPT-4写代码不如ChatGPT，误用率高达62%！加州大学两位华人开源代码可靠性基准RobustAPI

新火种 2023-11-14

声明:本文来自于

【新智元导读】代码能否跑起来的不是判断可靠性的标准，用语言模型写代码还需要考虑生产环境下的预期外输入。

大型语言模型（LLM）在理解自然语言和生成程序代码方面展现出了非凡的性能，程序员们也开始在编码过程中使用Copilot工具辅助编程，或是要求LLM生成解决方案。

经过几版迭代后，目前LLM生成的代码已经很少有语法错误了，也更贴合用户输入的文本、符合预期语义，但针对LLM代码生成的可靠性和鲁棒性仍然缺乏彻底的研究。

代码的可执行并不等同于可靠，软件的开发环境、部署环境都存在很大的不确定性。

Tags:

代码基准

相关推荐

“最强开源模型”被打假，CEO下场致歉，英伟达科学家：现有测试基准已经不靠谱了

2024-09-14

上交大推出“可进化游戏引擎”！大模型加持代码自动成长，虚拟世界演化无需预设

2024-09-04

全华人团队推出多模态大模型新基准，GPT-4o准确率仅为65.5%

2024-06-17

通义灵码首批通过信通院代码大模型评估

2024-06-11

百川新模型冲顶中文测试基准！首款AI助手“百小应”同时发布，“最懂搜索”

2024-05-24

免责声明: 本文所包含的观点仅代表作者个人看法，不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。交易和投资涉及高风险，读者在采取与本文内容相关的任何行动之前，请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。

热门文章

用AI解读动物情绪：准确率达88%！

100亿！中关村科学城科技成长三期基金发布

2025-02-18 13:25

科创板晚报|优刻得、永信至诚发布严重异动公告富创精密收到行政监管措施决定书

2025-02-18 13:25

机器人“赛道”新年加速“跑”我国智能机器人产业企业数量超45万家

2025-02-17 20:23

港股早报｜两部门鼓励外资在华开展股权投资美团将为全职及稳定兼职骑手缴纳社保

2025-02-20 13:23

【焦点复盘】指数全天放量分化，端侧AI、AI医疗齐头并进，DeepSeek概念分化加剧

2025-02-21 13:23

当“AI网络”重新改写自动驾驶游戏规则

2025-02-21 09:52

LEAP2025收获250亿美元投资创历届新高明年在港举办LEAPEast

2025-02-18 13:24

智元机器人联合北大，推出通用机器人操作框架

2025-02-21 11:29

生成式人工智能用户约2.5亿人这个“2.5亿”意味着什么？

2025-02-19 13:23