北大北邮的门,机器人开
搜集了328×204条数据,只为让机器人把开门这一件事做到极致。这是来自北大董豪团队和北邮何召锋团队的新研究。做到了开箱即用,不需要在现实世界重新微调,就能操控房门、车门等各种能想到的门。无论是普通的圆形的门把手;还是需要钥匙才能打开的储物柜;甚至是开保险柜,对它来说都不在话下。目前项目主页和论文都
搜集了328×204条数据,只为让机器人把开门这一件事做到极致。这是来自北大董豪团队和北邮何召锋团队的新研究。做到了开箱即用,不需要在现实世界重新微调,就能操控房门、车门等各种能想到的门。无论是普通的圆形的门把手;还是需要钥匙才能打开的储物柜;甚至是开保险柜,对它来说都不在话下。目前项目主页和论文都
北京大学董豪团队具身导航最新成果来了:无需额外建图和训练,只需说出导航指令,如:我们就能控制机器人灵活移动。在此,机器人靠的是主动与大模型构成的“专家团队”沟通完成指令分析、视觉感知、完成估计和决策测试等一系列视觉语言导航关键任务。目前项目主页和论文都已上线,代码即将推出:机器人如何根据人类指令导航
化学反应是药物设计和有机化学研究的基础。研究界越来越需要一种能够有效捕获化学反应基本规则的大规模深度学习框架。近日,来自北京大学和望石智慧的研究团队提出了一种新方法来弥合基于反应的分子预训练和生成任务之间的差距。
作者丨青暮编辑丨岑峰元宇宙被认为是互联网的自然迭代阶段,是人类社会在发明语言、文本、数学、图像之后,信息爆炸逼迫我们将数据不断抽象为高维数据的当下,将交流媒介彻底具象化的另一极革命。有句话说得好,“文化即元宇宙”。元宇宙的世界源于现实,又别于现实、超越现实,我们可以轻易在其中跨越物理距离面对面交流,
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfen
上周,北京智源人工智能研究院(BAAI)、北京大学和香港中文大学的研究团队开源了 SegVol 医学通用分割模型。与过去一些很棒的 Medical SAM 工作不同,
从一大堆图片中精准找图,有新招了!论文已经中了ECCV 2024。北京大学袁粒课题组,联合南洋理工大学实验室,清华自动化所提出了一种新的通用检索任务:通用风格检索(Style-Diversified Retrieval)。一句话,这种检索任务要求模型面对风格多样的查询条件时,依然能精准找图。
机器之心专栏机器之心编辑部北京大学与腾讯等机构的研究者们提出了多模态对齐框架 ——LanguageBind。该框架在视频、音频、文本、深度图和热图像等五种不同模态的下游任务中取得了卓越的性能,刷榜多项评估榜单,这标志着多模态学习领域向着「大一统」理念迈进了重要一步。在现代社会,信息传递和交流不再局限
1月4日消息,北京大学官网消息,近日,“北大-智元机器人联合实验室”正式成立。智元联合创始人彭志辉、北京大学科技开发部部长姚卫浩,计算机学院院长胡振江,前沿计算研究中心执行主任邓小铁等嘉宾出席。
世界模型是当前的热点话题。我这里分享的题目是 “图形计算到世界模型”,作为抛砖引玉,试图挖掘和展示图形计算和世界模型两者之间可能建立的紧密内在联系。GAMES 这个平台上的报告,主要是为了交流,鼓励大胆提出想法,引发讨论,而不是单纯的宣读一些既有成果。所以,我为此做了一些调研和思考,期待通过这个报告