GPT-4写代码不如ChatGPT,误用率高达62%!加州大学两位华人开源代码可靠性基准RobustAPI
声明:本文来自于【新智元导读】代码能否跑起来的不是判断可靠性的标准,用语言模型写代码还需要考虑生产环境下的预期外输入。大型语言模型(LLM)在理解自然语言和生成程序代码方面展现出了非凡的性能,程序员们也开始在编码过程中使用Copilot工具辅助编程,或是要求LLM生成解决方案。经过几版迭代后,目前L
声明:本文来自于【新智元导读】代码能否跑起来的不是判断可靠性的标准,用语言模型写代码还需要考虑生产环境下的预期外输入。大型语言模型(LLM)在理解自然语言和生成程序代码方面展现出了非凡的性能,程序员们也开始在编码过程中使用Copilot工具辅助编程,或是要求LLM生成解决方案。经过几版迭代后,目前L
4月11日,蚂蚁集团自研的智能研发平台CodeFuse推出“图生代码”新功能,支持开发人员用产品设计图一键生成代码,大幅提升前端页面的开发效率。
12月1日,昆仑万维正式发布「天工SkyAgents」平台,助力大模型走入千家万户。「天工SkyAgents」是国内领先的AI Agents开发平台,基于昆仑万维「天工大模型」打造,具备从感知到决策,从决策到执行的自主学习和独立思考能力。用户可以通过自然语言构建自己的单个或多个“私人助理”。并且将不
今天上午,著名 AI 科学家 Andrej Karpathy 在 X 上分享的一篇文章引起了广泛关注和讨论。这篇文章的核心论点是「认知负荷很重要」,即在写代码时,应该考虑之后阅读者和维护者能否更轻松地理解这些代码。Karpathy 认为「这可能是最真实,但最少被实践的观点。」毕竟相当多开发者都乐于在
风风火火的Linux之父,Linus Torvalds,他又跃入公众的视线。“打开方式”依旧是熟悉的配方——骂人。我们先来看下Linus怒怼的名场面:而这一次的“受害者”,是来自谷歌的一位程序员,Steven Rostedt。而且他并非是随随便便的一位开发者,用网友的话来说“也算是大佬了”。
上云、代码重构一起来。对于节奏越来越快的学术研究领域而言,arXiv 是非常重要的论文预印版平台。和维基百科一样,它是个非营利性机构。当地时间本周四,康奈尔大学科技校区(Cornell Tech)宣布了 arXiv 获得巨额捐款的好消息。作为一个非营利数据库,arXiv 是所有人均可以免费访问的,长
复刻OpenAI o1推理大模型,开源界传来最新进展:LLaMA版o1项目刚刚发布,来自上海AI Lab团队。简介中明确:使用了蒙特卡洛树搜索,Self-Play强化学习,PPO,以及AlphaGo Zero的双重策略范式(先验策略+价值评估)。
当今深度学习以及大模型的飞速发展,带来了对创新技术的不断追求。在这一进程中,代码数据增强技术显现出其不可忽视的价值。最近,由蒙纳士大学、新加坡管理大学、华为诺亚方舟实验室、北京航空航天大学以及澳大利亚国立大学联合进行的对近 5 年的 89 篇相关研究调查,
PyTorch 2.0正式发布。PyTorch 2.0正式版终于来了!去年12月,PyTorch基金会在PyTorch Conference 2022上发布了PyTorch 2.0的第一个预览版本。跟先前1.0版本相比,2.0有了颠覆式的变化。
近年来,数字化转型已成为各行各业提高运营效率和生产力的重要手段。而对于高校来说,转型已成为建设高质量教育体系的重要策略。但相较于迈出较早一步的企业群体,本身缺乏技术基因和运营成本的学校在数字化的转型上还较为滞后。 如何改变这一现状?AI与低代码的融合将成为数字化转型的两大助力。