大模型生成RPG游戏,情节角色DIY!谷歌出品,一作上海交大校友
根据初始用户输入,它能设置游戏模拟环境,并在环境中生成角色动作。来自谷歌,北卡罗来纳大学教堂山分校新研究,他们尝试的第一款游戏叫做Unbounded,灵感来自《模拟人生》。
根据初始用户输入,它能设置游戏模拟环境,并在环境中生成角色动作。来自谷歌,北卡罗来纳大学教堂山分校新研究,他们尝试的第一款游戏叫做Unbounded,灵感来自《模拟人生》。
真·“三个臭皮匠,顶个诸葛亮”——基于开源小模型的三个Agent协作,比肩GPT-4的工具调用效果!话不多说,直接来看两个系统执行记录。用户表示自己是一个音乐爱好者,想探索不同的音乐流派以及音乐家。
之前要两天才能训练好的数字人,现在只用半小时就能完成了!到了推理阶段,更是只要16毫秒,就能得到动作流畅、细节到位的场景视频。而且无需复杂的采样和建模,只要随便拍一段50-100帧的视频就足够了,换算成时间不过几秒钟。
用大模型“蒸馏”小模型,有新招了!甚至能在不同类型和架构的LLMs(大语言模型)上达到新SOTA。这就是来自中科大、腾讯优图实验室提出的一种基于Sinkhorn距离的知识蒸馏方法,能把大的、复杂的教师模型的知识“蒸馏”到小的、简单的学生模型中,从而让小模型也能像大模型一样工作。
羿阁 发自 凹非寺量子位 | 公众号 QbitAI逼近人类水平的语音识别系统来了?没错,OpenAI新开源了一个名为「Whisper」的新语音识别系统,据称在英文语音识别方面拥有接近人类水平的鲁棒性和准确性!不仅如此,对于不同口音、专业术语的识别效果也是杠杠的!一经发布就在推特上收获4800+点赞,
今日GitHub热榜榜首,是最新的开源世界模型。上下文窗口长度达到了100万token,持平了谷歌同时推出的王炸Gemini 1.5,伯克利出品。强大的模型,命名也是简单粗暴——没有任何额外点缀,直接就叫LargeWorldModel(LWM)。
医学领域的通用分割模型来啦,发布即开源!来自智源,模型名为SegVol,划重点:是第一次实现同时支持框(box)、点(point)和文本(text) prompt进行任意尺寸原分辨率的3D体素分割。要知道,此前深度学习在医学图像分割方面已经取得了显著进展,但仍然缺乏一种能够通用分割各种解剖类别、
12月4日早上,华为位于深圳万象天地的旗舰地店外早早地排起长队,“花粉”们等待着最新的旗舰手机Mate 70系列正式开卖。Mate 70系列被华为常务董事、终端BG董事长、智能汽车解决方案BU董事长余承东称为“史上最强大的Mate”,同时,它也是首款搭载“纯血”鸿蒙的手机。从2012年开始规划研发,
TensorFlow 2.0已在十一发布,香不香?好用不好用?现在,这里有一份全中文教学的快手上手指南,基于Keras和Eager Execution(动态图)模式,北大学霸出品,获得TensorFlow官方认可。
AI赋能每个人,AI赋能每辆车,推动一个更加安全、便捷和高效的未来……这才是高阶智驾“标配时代”最朴素又最具价值的意义。