大视觉语言模型基准数据集ReForm-Eval:新瓶装旧酒,给旧有的基准数据集换个形式就能用来评估新的大视觉语言模型
概要复旦DISC实验室推出了ReForm-Eval,一个用于综合评估大视觉语言模型的基准数据集。ReForm-Eval通过对已有的、不同任务形式的多模态基准数据集进行重构,构建了一个具有统一且适用于大模型评测形式的基准数据集。所构建的ReForm-Eval具有如下特点:构建了横跨8个评估维度,并为每
概要复旦DISC实验室推出了ReForm-Eval,一个用于综合评估大视觉语言模型的基准数据集。ReForm-Eval通过对已有的、不同任务形式的多模态基准数据集进行重构,构建了一个具有统一且适用于大模型评测形式的基准数据集。所构建的ReForm-Eval具有如下特点:构建了横跨8个评估维度,并为每
如果从chatGPT正式发布算起,不到一年的时间,这场席卷全球的AI大模型风暴正在颠覆一切,包括此刻的中国企业。
《科创板日报》11月22日讯(记者 郭辉) 寒武纪拟以2亿元增资其上海子公司。寒武纪今日(11月22日)晚间发布公告称,经董事会审议通过,同意新增全资子公司上海寒武纪作为“面向新兴应用场景的通用智能处理器技术研发项目”的实施主体。同时,基于目前募投项目实施进展情况,拟使用募集资金1500万元人民币对
2024年12月26日,深度求索(DeepSeek)发布了其最新人工智能(AI)大模型DeepSeek-V3,并同步开源,刷屏中外AI圈。DeepSeek在两年内就成功开发出一款性能比肩国际顶尖的AI模型,成本仅为557万美元,与OpenAI 7800万美元的GPT-4训练成本形成鲜明对比。 聊天