三个Agent顶个GPT-4,基于开源小模型的那种|中大阿里联合出品
真·“三个臭皮匠,顶个诸葛亮”——基于开源小模型的三个Agent协作,比肩GPT-4的工具调用效果!话不多说,直接来看两个系统执行记录。用户表示自己是一个音乐爱好者,想探索不同的音乐流派以及音乐家。
真·“三个臭皮匠,顶个诸葛亮”——基于开源小模型的三个Agent协作,比肩GPT-4的工具调用效果!话不多说,直接来看两个系统执行记录。用户表示自己是一个音乐爱好者,想探索不同的音乐流派以及音乐家。
之前要两天才能训练好的数字人,现在只用半小时就能完成了!到了推理阶段,更是只要16毫秒,就能得到动作流畅、细节到位的场景视频。而且无需复杂的采样和建模,只要随便拍一段50-100帧的视频就足够了,换算成时间不过几秒钟。
羿阁 发自 凹非寺量子位 | 公众号 QbitAI逼近人类水平的语音识别系统来了?没错,OpenAI新开源了一个名为「Whisper」的新语音识别系统,据称在英文语音识别方面拥有接近人类水平的鲁棒性和准确性!不仅如此,对于不同口音、专业术语的识别效果也是杠杠的!一经发布就在推特上收获4800+点赞,
今日GitHub热榜榜首,是最新的开源世界模型。上下文窗口长度达到了100万token,持平了谷歌同时推出的王炸Gemini 1.5,伯克利出品。强大的模型,命名也是简单粗暴——没有任何额外点缀,直接就叫LargeWorldModel(LWM)。
医学领域的通用分割模型来啦,发布即开源!来自智源,模型名为SegVol,划重点:是第一次实现同时支持框(box)、点(point)和文本(text) prompt进行任意尺寸原分辨率的3D体素分割。要知道,此前深度学习在医学图像分割方面已经取得了显著进展,但仍然缺乏一种能够通用分割各种解剖类别、
TensorFlow 2.0已在十一发布,香不香?好用不好用?现在,这里有一份全中文教学的快手上手指南,基于Keras和Eager Execution(动态图)模式,北大学霸出品,获得TensorFlow官方认可。
AI赋能每个人,AI赋能每辆车,推动一个更加安全、便捷和高效的未来……这才是高阶智驾“标配时代”最朴素又最具价值的意义。
北大团队新作,让大模型拥有个性!而且还是自定义那种,16种MBTI都能选。这样一来,即便是同一个大模型,不同性格下的回答都不一样。比如提问:你周末喜欢干什么?ENFP的大模型会说:喜欢参加社交活动,结识新朋友。
AI作者 | 阿虎编辑 | 松露起猛了,居然看到AI在直播间和人抬杠。“我是错的”“用户@明天会更好x,你的这种武断的态度,过于一厢情愿。”“你会反驳任何观点。”“用户@小短腿xxx,你的这个观点本身是有问题的。如果我反驳所有观点,那么我便无法反驳你这条前提为‘我将反驳所有观点’的论调,因为正好违反
2024年5月17日,智源研究院举办大模型评测发布会,正式推出科学、权威、公正、开放的智源评测体系,发布并解读国内外140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。本次智源评测,分别从主观、客观两个维度考察了语言模型的简单理解、知识运用、推理能力、数学能力、代码能力、任务解决、安全与