首页 > 大模型

大模型

  • 最新调查:AI大模型的两大难题,要靠“绿色计算”来解决?

    原文来源:学术头条由无界 AI生成当前,人工智能(AI)已广泛应用于众多领域,包括计算机视觉、自然语言处理、时间序列分析和语音合成等。在深度学习时代,尤其是随着大型语言模型(LLMs)的出现,大多数研究人员的注意力都集中在追求新的最先进(SOTA)结果上,使得模型规模和计算复杂性不断增加。

  • 周鸿祎:要把大模型从“原子弹”变为“茶叶蛋”

    11月20日,2024年世界互联网大会乌镇峰会在浙江乌镇开幕,阿里巴巴CEO吴泳铭、360创始人周鸿祎、小米董事长雷军、蚂蚁董事长井贤栋等互联网“大佬”齐聚乌镇。从1994年中国实现全功能接入国际互联网至今,中国互联网已走过30年历程,下一个30年的方向又在何处?  AI创造价值远超互联网  “过去

  • 英伟达推出定制版大模型ChipNeMo,专攻芯片设计

    由无界 AI生成半导体芯片虽然体积微小,但其设计之难度在全世界都是极具挑战性的。昨天苹果的半小时发布会上,全新的M3系列就此亮相,虽然难免又被人说挤牙膏,但事实一再表明,即使是挤牙膏也不是人人都会的。对半导体芯片的设计与制造之难,可能比航空母舰更甚,虽然直观上看二者的体量完全不在一个水平线

  • OpenAI安全系统负责人长文梳理:大模型的对抗攻击与防御

    LLM 能力强大,倘若别有用心之人用其来干坏事,可能会造成难以预料的严重后果。虽然大多数商用和开源 LLM 都存在一定的内置安全机制,但却并不一定能防御形式各异的对抗攻击。近日,OpenAI 安全系统(Safety Systems)团队负责人 Lilian Weng 发布了一篇博客文章《Advers

  • 通义千问开源超百亿参数模型大模型,周靖人:持续拥抱开源开放

    9月25日,阿里云开源通义千问140亿参数模型Qwen-14B及其对话模型Qwen-14B-Chat,免费可商用。阿里云此前开源了70亿参数模型Qwen-7B等,一个多月下载量破100万,成为开源社区的口碑之作。记者了解到,Qwen拥有出色的工具调用能力,能让开发者更快地构建基于Qwen的Agent

  • 中年网易,苦战游戏AI

    原文来源:硅基研究室由无界 AI生成游戏行业正在经历一个冰火两重天的时刻。一面是各类裁员、收缩信息不断,另一面则是生成式AI所带来的「奇点时刻」。事实上,AI在游戏行业并不是一个新鲜事物。在游戏发展的早期,早在上一个世纪,雅达利的《Pong》就已加入了电脑控制的对手挑战玩家,虽然依旧按照游