大模型版5年高考3年模拟来了!含6141道数学题
大模型的“5年高考3年模拟”数学题来了,还是加强强强版!微软、加州大学洛杉矶分校(UCLA)、华盛顿大学(UW)联合打造全新多模态数学推理基准数据集。名为“MathVista”。
大模型的“5年高考3年模拟”数学题来了,还是加强强强版!微软、加州大学洛杉矶分校(UCLA)、华盛顿大学(UW)联合打造全新多模态数学推理基准数据集。名为“MathVista”。
关注o1必备的GitHub库,它来了!上线3天狂揽1.5k星,一跃登上GitHub趋势榜!这个库专注于收集与o1相关的推理技术论文、博客和项目等资源,供大家研究讨论,并在持续更新中。网友们对它给予高度评价:科技大V说它是“拆解草莓的逆向工程”。也有网友直接提出表扬:“研究o1,看它就够了!”真有这么
7B开源模型,数学能力超过了千亿规模的GPT-4!它的表现可谓是突破了开源模型的极限,连阿里通义的研究员也感叹缩放定律是不是失效了。无需借助任何外部工具,它就能在竞赛水平的MATH数据集上达到51.7%的准确率。
大模型的“5年高考3年模拟”数学题来了,还是加强强强版!微软、加州大学洛杉矶分校(UCLA)、华盛顿大学(UW)联合打造全新多模态数学推理基准数据集。名为“MathVista”。涵盖各种题型共6141个问题,来源于28个现有的多模态数据集和3个新标注的数据集。这下想要知道一个大模型数学水平怎么样,直
根据初始用户输入,它能设置游戏模拟环境,并在环境中生成角色动作。来自谷歌,北卡罗来纳大学教堂山分校新研究,他们尝试的第一款游戏叫做Unbounded,灵感来自《模拟人生》。
真·“三个臭皮匠,顶个诸葛亮”——基于开源小模型的三个Agent协作,比肩GPT-4的工具调用效果!话不多说,直接来看两个系统执行记录。用户表示自己是一个音乐爱好者,想探索不同的音乐流派以及音乐家。
之前要两天才能训练好的数字人,现在只用半小时就能完成了!到了推理阶段,更是只要16毫秒,就能得到动作流畅、细节到位的场景视频。而且无需复杂的采样和建模,只要随便拍一段50-100帧的视频就足够了,换算成时间不过几秒钟。
用大模型“蒸馏”小模型,有新招了!甚至能在不同类型和架构的LLMs(大语言模型)上达到新SOTA。这就是来自中科大、腾讯优图实验室提出的一种基于Sinkhorn距离的知识蒸馏方法,能把大的、复杂的教师模型的知识“蒸馏”到小的、简单的学生模型中,从而让小模型也能像大模型一样工作。
羿阁 发自 凹非寺量子位 | 公众号 QbitAI逼近人类水平的语音识别系统来了?没错,OpenAI新开源了一个名为「Whisper」的新语音识别系统,据称在英文语音识别方面拥有接近人类水平的鲁棒性和准确性!不仅如此,对于不同口音、专业术语的识别效果也是杠杠的!一经发布就在推特上收获4800+点赞,
今日GitHub热榜榜首,是最新的开源世界模型。上下文窗口长度达到了100万token,持平了谷歌同时推出的王炸Gemini 1.5,伯克利出品。强大的模型,命名也是简单粗暴——没有任何额外点缀,直接就叫LargeWorldModel(LWM)。