清华校友回国创业,获李开复、徐小平超千万元种子轮投资
作者 | 琰琰编辑 | 陈大鑫实习论文刷新Image世界记录;博士毕业收割常春藤大学教职offer;入职几个月晋升为“校长青年教授”,成为首位获此殊荣的华人学者。这位出道即巅峰的华人学者,便是现新加坡国立大学青年教授尤洋。近日,尤洋在北京中关村创办了一家高性能计算公司“潞晨科技”,作为高性能计算和人
作者 | 琰琰编辑 | 陈大鑫实习论文刷新Image世界记录;博士毕业收割常春藤大学教职offer;入职几个月晋升为“校长青年教授”,成为首位获此殊荣的华人学者。这位出道即巅峰的华人学者,便是现新加坡国立大学青年教授尤洋。近日,尤洋在北京中关村创办了一家高性能计算公司“潞晨科技”,作为高性能计算和人
编译 |琰琰大规模深度神经网络训练仍是一项艰巨的挑战,因为动辄百亿、千亿参数量的语言模型,需要更多的 GPU 内存和时间周期。这篇文章从如何多GPU训练大模型的角度,回顾了现有的并行训练范式,以及主流的模型架构和内存优化设计方法。本文作者Lilian Weng现为OpenAI应用人工智能研究负责人,
要搞大模型AI助手,像ChatGPT一样对齐微调已经是行业标准做法,通常分为SFT+RLHF两步走。来自艾伦研究所的新研究却发现,这两步都不是必要的???新论文指出,预训练完成刚出炉的基础模型已经掌握了遵循指令的能力,只需要提示工程就能引导出来,引起开发社区强烈关注。因为RLHF的成本非常高训练还不
一只黑吗喽引爆全世界,在座的都是天命人。国内首款顶级3A大作《黑神话:悟空》一上线,就创下诸多纪录,不仅快速成为多平台销量榜首,Steam更是蝉联三周冠军,销量已超26亿元,在线玩家总人数也是屡次破纪录。一句话总结就是:太火了太火了,简直烧得慌~背后的开发团队也开始受到广大关注,结果被曝出团队规模目
大模型【新智元导读】GPT-4V风头正盛,LLaVA-1.5就来踢馆了!它不仅在11个基准测试上都实现了SOTA,而且13B模型的训练,只用8个A100就可以在1天内完成。9月底,OpenAI宣布ChatGPT多模态能力解禁。多模态GPT-4V的神奇能力让众人惊呼:这就是GPT-4.5吧?这才没过多
《黑神话·悟空》背后的技术供应商,亮相数博会华为云展区!还带来了最新的动作捕捉黑科技,无需佩戴任何装备,只用摄像头就能给人的动作建模。此外,还有更多展商带来了智能挖掘机、中医大模型等一系列AI黑科技,可谓是叫人大饱眼福。下面就跟随新火种的脚步一起看看这届数博会上都展出了什么样的新技术~AI黑科技亮相
西风 鱼羊 发自 凹非寺量子位 | 公众号 QbitAI马斯克的xAI,首项公开研究成果来了!共同一作之一,正是xAI创始成员、丘成桐弟子杨格(Greg Yang)。此前,杨格就曾公开表示,自己在xAI的研究方向是“Math for AI”和“AI for Math”。其中一项重点就是延续他此前的研
北大校友打造的1000个智能体「我的世界」,火爆AI圈!随便一条推文,都能引来几十万网友围观:在这里,有着真正意义上的虚拟社会,包括文化、经济、宗教……每个智能体在GPT-4加持下,都是社会中独立自主的个体。比如这位名叫Olivia的农民,受探险故事启发,曾中途决定撂下锄头去闯荡江湖…它们以宝石(g
在当今快速发展的世界中,科技创新和科技成果转化已经成为推动国家和地方经济高质量发展的关键驱动力。科技的不断进步不仅改变了人们的生活方式,还指明了未来的发展方向。 今年7月,习近平总书记在四川考察时指出,以科技创新开辟发展新领域新赛道、塑造发展新动能新优势,是大势所趋,也是高质量发展的迫切要求,必须