首页 > 来头

来头

  • 挑战Transformer的Mamba是什么来头?作者博士论文理清SSM进化路径

    对 SSM 感兴趣的研究者不妨读一下这篇博士论文。在大模型领域,Transformer 凭一己之力撑起了整个江山。但随着模型规模的扩展和需要处理的序列不断变长,Transformer 的局限性也逐渐凸显,比如其自注意力机制的计算量会随着上下文长度的增加呈平方级增长。

  • 推理效率提升超200%,易用性对齐vLLM,这款国产加速框架啥来头?

    2022 年 10 月,ChatGPT 的问世引爆了以大语言模型为代表的的 AI 浪潮,全球科技企业纷纷加入大语言模型的军备竞赛,大语言模型的数量、参数规模及计算需求呈指数级提升。大语言模型(Large Language Model,简称 LLM 大模型)指使用大量文本数据训练的深度学习模型,可以生

  • 多位知名专家加入,融资超20亿元,这家成立4个月的创业公司是什么来头?

    自动驾驶圈的人才,依然快速流动。今日,自动驾驶初创企业云骥智行宣布,前百度副总裁、Apollo平台研发总经理王京傲加入并出任联合创始人兼CTO,他将专注前沿技术创新和研发团队管理。这不是第一位技术大牛加入云骥智行,前恒大汽车自动驾驶总监周泽斌、前小鹏汽车感知负责人曹光植也加入了云骥智行。资料显示,云

  • 这家芯片公司新增多个股东百度腾讯智谱AI都投了!什么来头?

    训练大模型太费算力,于是大模型公司纷纷下场投资芯片公司。   记者今日从天眼查APP获悉,上海无问芯穹智能科技有限公司(以下简称“无问芯穹”)发生工商信息变更,新增多名股东。值得注意的是,其新增的股东包括百度旗下的北京百度网讯科技有限公司、腾讯完全持股的广西腾讯创业投资有限公司、