让大模型操纵无人机,北航团队提出具身智能新架构
进入多模态时代,大模型也会操纵无人机了!只要视觉模块捕捉到启动条件,大模型这个“大脑”就会生成动作指令,接着无人机便能迅速准确地执行。北京航空航天大学智能无人机团队周尧明教授团队等研究人员,提出了一种基于多模态大模型的具身智能体架构。目前,这种架构已被应用于无人机的操控。那么这种新的智能体表现如何,
进入多模态时代,大模型也会操纵无人机了!只要视觉模块捕捉到启动条件,大模型这个“大脑”就会生成动作指令,接着无人机便能迅速准确地执行。北京航空航天大学智能无人机团队周尧明教授团队等研究人员,提出了一种基于多模态大模型的具身智能体架构。目前,这种架构已被应用于无人机的操控。那么这种新的智能体表现如何,
字节大模型团队,终于曝光!这不是,字节刚刚启动大模型校招计划,招揽人才嘛——计划取名Top Seed,薪资TOP级别、算力数据管够,但仅面向应届博士生;前沿课题覆盖大模型、图像&视频生成、机器学习算法和系统以及音频生成和理解等方向。另外还有一帮顶尖的技术导师团带队……等等,这不就是字节豆包大模型的背
极限量化,把每个参数占用空间压缩到1.1bit!IEEE Spectrum专栏,一种名为BiLLM的训练后量化(PTQ)方法火了。通俗来讲,随着LLM参数规模越来越大,模型计算的内存和资源也面临着更大的挑战。如何把模型变得小巧经济实惠,能塞进手机等设备中?BiLLM解决的正是这样的一个问题。它使用1bit来近似网络中的大多数参数,使用2bit来表示一些对性能最有影响权重
GPT-4o,比上一代更容易被越狱攻击了?来自北航和南洋理工的研究人员,通过上万次的API查询,对GPT-4o各种模态的安全性进行了详细测试。结果发现,GPT-4o新引入的语音模态带来了新的攻击面,而且多模态整体安全性不敌GPT-4V。具体来说,研究人员针对4个常用的基准测试,对GPT-4o支持的三种模态(文本、图像、音频)进行了测试
这是北航 PHM 实验室在健康管理大模型领域的成功尝试,研究团队提出了基于大语言模型的轴承故障诊断框架,提升预训练大模型对振动数据的解析与泛化能力
《科创板日报》9月6日讯(记者 李明明) 近日,矿区无人驾驶领跑者踏歌智行完成4亿元C2轮融资,这是今年矿区无人驾驶赛道的最大一笔融资。该轮融资由合肥产投、国家能源集团旗下国能低碳基金联合领投,黄山新时代文旅基金、鲁信创投、清石资管集团、北京北航资产经营有限公司、合肥鑫城等跟投,这是今年矿区无人驾驶