清华发布大模型性能报告:GPT-4第一更懂中文的还是百度
8月10日消息,AI大模型成为今年的热点,OpenAI的ChatGPT一马当先,微软、谷歌、Meta紧随其后,国内科技巨头也迅速跟进,现在国内据说已经有上百款大模型问世了。这么多大模型中,实力到底如何?日前清华大学新闻与传播学院发布了《大语言模型综合性能评估报告》,将国内外的大模型做了一番对比。该报
8月10日消息,AI大模型成为今年的热点,OpenAI的ChatGPT一马当先,微软、谷歌、Meta紧随其后,国内科技巨头也迅速跟进,现在国内据说已经有上百款大模型问世了。这么多大模型中,实力到底如何?日前清华大学新闻与传播学院发布了《大语言模型综合性能评估报告》,将国内外的大模型做了一番对比。该报
o1模型为何在推理时使用中文或其他语言来思考尚不得而知,但有专家猜测,原因可能是模型在训练时使用了中文或其他语言的数据标注,也有可能是模型倾向于自行选择它们认为最能有效实现其目标的语言,或者出现了幻觉。
由APUS与深圳大学大数据系统计算技术国家工程实验室(以下简称“大数据国家工程实验室”)联合研发的伶荔Linly-70B中文大模型正式对外开源,并在GitHub上首发。这是APUS大模型3.0的首个开源大模型,也是国内学术界首个700亿参数规模的开源大模型。
站长之家11月20日 消息:中科大和 IDEA 研究院封神榜团队合作开发了一款名为 ChiMed-GPT 的中文医疗领域大语言模型(LLM)。该模型基于封神榜团队的 Ziya2-13B 模型构建,拥有130亿个参数,并通过全方位的预训练、监督微调和人类反馈强化学习来满足医疗文本处理的需求。ChiMe
机器之心专栏机器之心编辑部香港中文大学(深圳)和深圳市大数据研究院所在的王本友教授团队训练并开源了一个新的医疗大模型 ——HuatuoGPT(华佗GPT),以使语言模型具备像医生一样的诊断能力和提供有用信息的能力。基于医生回复和 ChatGPT 回复,让语言模型成为医生提供丰富且准确的问诊。在医疗领
9月2日,中文大模型测评基准SuperCLUE发布《中文大模型基准测评2024年8月报告》,腾讯混元大模型凭借在多个核心任务上的出色表现,总得分居国内大模型第一名,成为榜单中进步最快的模型之一。据Su
12月28日,国内中文模型评测机构SuperCLUE发布中文大模型基准测评2023年度报告。根据报告,过去半年,国内领军大模型企业实现了大模型代际追赶的奇迹,从7月份与GPT3.5的20分差距,每个月都有稳定且巨大的提升,到11月份测评时已经完成总分上对GPT3.5的超越。
作者 | 徐珊编辑 | 云鹏10月26日智东西北京报道,今天腾讯宣布,腾讯混元大模型正式对外开放“文生图”功能,首次展现其在图像自动生成领域的能力。在现场,我们看到了腾讯混元大模型“文生图”功能是如何一步步成长的。此外,腾讯自研的面向垂直领域的7B和13B模型也首次亮相,腾讯还提及混元大模型的中文能
11月30日至12月1日,首届人工智能与国际中文教育大会在浙江师范大学召开。本次大会由全国国际中文教育专业学位研究生教育指导委员会指导,浙江师范大学主办。浙江师范大学副校长张建珍、全国国际中文教育专业学位研究生教育指导委员会秘书长任世芳出席开幕式并致辞。来自全国30所高校国际中文教育学科相关学院院长
万万没想到,与任务无直接关联的多模态数据也能提升Transformer模型性能。比如训练一个图像分类模型,除了标注好类别的图像数据集,增加视频、音频、点云等模态数据,也能显著提升模型在图像分类上的性能。