校友 - 新火种

首页 > 校友

校友

北大校友“炼丹”分享：OpenAI如何训练千亿级模型？

编译 |琰琰大规模深度神经网络训练仍是一项艰巨的挑战，因为动辄百亿、千亿参数量的语言模型，需要更多的 GPU 内存和时间周期。这篇文章从如何多GPU训练大模型的角度，回顾了现有的并行训练范式，以及主流的模型架构和内存优化设计方法。本文作者Lilian Weng现为OpenAI应用人工智能研究负责人，
2023-11-01 08:38
扒一扒o3-mini背后团队：3位华人核心成员，北大清华南开校友在列

比o1 mini性能更强，价格更低，性价比新王o3-mini再次引爆AI圈热议。在官方截图中，中等o3-mini的性能和o1 mini差不多，价格却只有后者的一半，整体延迟也和GPT-4o相当。最主要的，这表明了OpenAI可以在降低成本的同时提高性能。
2024-12-25 09:25
大模型免微调解锁对话能力，RLHF没必要了！一作上交大校友：节省大量成本和时间

要搞大模型AI助手，像ChatGPT一样对齐微调已经是行业标准做法，通常分为SFT+RLHF两步走。来自艾伦研究所的新研究却发现，这两步都不是必要的？？？新论文指出，预训练完成刚出炉的基础模型已经掌握了遵循指令的能力，只需要提示工程就能引导出来，引起开发社区强烈关注。因为RLHF的成本非常高训练还不
2023-12-07 09:06
转手绢、扭秧歌，春晚机器人由上海大学校友打造

本文图均为上海大学微信公众号图机器人扭着“小腰”翩翩起舞，还能娴熟地转手绢。在中央广播电视总台《2025年春节联欢晚会》上，一群穿着花棉袄的机器人一出场就把晚会气氛拉到最嗨。这群炫酷“显眼包”名为H1，年仅一岁半。此次春晚表演，H1团队以独特的“机械骨骼”形象示人，刻意营造与真人舞者的“反差萌”
2025-02-27 11:32
黑神话悟空背后140人：华科校友带队，核心团队平均合作超10年

一只黑吗喽引爆全世界，在座的都是天命人。国内首款顶级3A大作《黑神话：悟空》一上线，就创下诸多纪录，不仅快速成为多平台销量榜首，Steam更是蝉联三周冠军，销量已超26亿元，在线玩家总人数也是屡次破纪录。一句话总结就是：太火了太火了，简直烧得慌~背后的开发团队也开始受到广大关注，结果被曝出团队规模目
2024-08-28 09:04
正面硬刚GPT-4V！浙大校友开源多模态大模型，130亿参数一天训完

大模型【新智元导读】GPT-4V风头正盛，LLaVA-1.5就来踢馆了！它不仅在11个基准测试上都实现了SOTA，而且13B模型的训练，只用8个A100就可以在1天内完成。9月底，OpenAI宣布ChatGPT多模态能力解禁。多模态GPT-4V的神奇能力让众人惊呼：这就是GPT-4.5吧？这才没过多
2023-10-10 14:48
《黑神话》动捕供应商展示新算法：华科校友创办，华为云合作，亮相数博会

《黑神话·悟空》背后的技术供应商，亮相数博会华为云展区！还带来了最新的动作捕捉黑科技，无需佩戴任何装备，只用摄像头就能给人的动作建模。此外，还有更多展商带来了智能挖掘机、中医大模型等一系列AI黑科技，可谓是叫人大饱眼福。下面就跟随新火种的脚步一起看看这届数博会上都展出了什么样的新技术~AI黑科技亮相
2024-09-04 09:06
马斯克xAI首项研究成果发布！创始成员杨格&姚班校友共同一作

西风鱼羊发自凹非寺量子位 | 公众号 QbitAI马斯克的xAI，首项公开研究成果来了！共同一作之一，正是xAI创始成员、丘成桐弟子杨格（Greg Yang）。此前，杨格就曾公开表示，自己在xAI的研究方向是“Math for AI”和“AI for Math”。其中一项重点就是延续他此前的研
2023-10-24 12:52
1000个Agent圈地模拟人类社会，北大校友创业AI版「我的世界」

北大校友打造的1000个智能体「我的世界」，火爆AI圈！随便一条推文，都能引来几十万网友围观：在这里，有着真正意义上的虚拟社会，包括文化、经济、宗教……每个智能体在GPT-4加持下，都是社会中独立自主的个体。比如这位名叫Olivia的农民，受探险故事启发，曾中途决定撂下锄头去闯荡江湖…它们以宝石（g
2024-09-17 09:02
专访四川大学全球校友创业家联合会会长吕蔺强：四川大学校友上市公司高质量发展大会将着力推动科技创新和科技成果转化

在当今快速发展的世界中，科技创新和科技成果转化已经成为推动国家和地方经济高质量发展的关键驱动力。科技的不断进步不仅改变了人们的生活方式，还指明了未来的发展方向。　　今年7月，习近平总书记在四川考察时指出，以科技创新开辟发展新领域新赛道、塑造发展新动能新优势，是大势所趋，也是高质量发展的迫切要求，必须
2023-10-28 08:35