中国大模型语料数据联盟开源发布高质量多模态语料“书生·万卷”
继今年7月在2023世界人工智能大会发起成立“中国大模型语料数据联盟”(以下简称“语料数据联盟”)之后,8月14日,上海人工智能实验室(上海AI实验室)宣布,联合语料数据联盟成员单位共同开源发布“书生
继今年7月在2023世界人工智能大会发起成立“中国大模型语料数据联盟”(以下简称“语料数据联盟”)之后,8月14日,上海人工智能实验室(上海AI实验室)宣布,联合语料数据联盟成员单位共同开源发布“书生
为帮助广大开发者更好地了解大模型语料数据联盟发布的AI大模型语料数据,沟通大模型企业在AI视角下的数据需求,不断服务大模型产业生态和落地应用,联盟发起单位上海人工智能实验室联合成员单位共同打造“解数Talk”系列直播。
在人工智能领域,大模型的应用越来越广泛,但如何实现大模型语料合规高效的流通,一直是困扰行业发展的难题。 近日,由深圳数据交易所(以下简称深数所)主办的2023中国(深圳)数据要素产业创新大会平行活动“数据要素赋能人工智能产业创新专题活动”上,深数所联合中国信息通信研究院(以下简称“信通院”)
生成式人工智能商业化落地探索走深,保障安全也成为其进程中的一个重要议题。 近日,全国信息安全标准化技术委员会组织(以下简称信安标委)组织制定的《生成式人工智能服务安全基本要求》(征求意见稿)(以下简称“征求意见稿”)公开征求意见,从语料安全、模型安全、 安全措施、安全评估等多方面对生成式人工智能
训练AI大模型需要大量的AI语料,但由于数据挖掘不足、无法自由在市场上流通等现状,中文优质数据仍然稀缺,AI语料相关企业受到广泛关注。
近日,深圳数据交易所(以下简称“深数所”)联合中国信息通信研究院(以下简称“信通院”)、华为云计算科技有限公司(以下简称“华为云”)、深圳数鑫科技有限公司(以下简称“数鑫科技”)等发布可信数据空间助力大模型语料合规高效流通案例,为可信数据空间技术在人工智能领域的实际应用提供了新方案。
·征求意见稿首次提出生成式AI服务提供者需遵循的安全基本要求,涉及语料安全、模型安全、安全措施、安全评估等方面,给出了语料及生成内容的主要安全风险共5类31种。·征求意见稿提出,应建立语料来源黑名单,不使用黑名单来源的数据进行训练。“应对各来源语料进行安全评估,单一来源语料内容中含违法不良信息超过5
5月31日2024向星力·未来数据技术峰会在上海隆重举办。峰会聚焦人工智能、大数据、数据要素、数字化转型、新质生产力等热门话题,业内知名专家、学者和企业代表分享最新研究成果、技术创新和实践经验,高层次产、学、研、用四方的交流和思想碰撞,为企业数据化转型和AIGC应用提供新思路、新方向和新方法。星环科
语料数据是大模型训练的重要“燃料”,有助于大模型更好地适配实际的应用场景。业内人士普遍认为,高质量的中文语料对于大模型在各行各业的应用十分关键。 在2023全球数商大会“数据要素市场与大模型语料库论坛”暨中国大模型语料数据联盟开放日上,
11月7日,《上海市推动人工智能大模型创新发展若干措施(2023-2025年)》正式发布。《措施》提出,打造市级智能算力统筹调度平台,构建规模化先进算力调度和供给能力。对符合条件的智算中心,在能耗指标