首页 > 语料库

语料库

  • 打造粤语语料库,让AI赋能广府文化

    广府新语对话  粤语作为汉语方言,是粤港澳地区、东南亚乃至全球华人的通行语言之一。如今,方言正在成为大语言模型应用探索的关键领域,建设多模态通用粤语语料库是广州的新使命。广州日报《理论周刊》邀请权威专家学者,聚焦粤语融合人工智能创新、为弘扬广府文化点燃新引擎,展开探讨。 

  • 中国网络空间安全协会发布用于大模型的首批中文基础语料库

    澎湃新闻从中国网络空间安全协会获悉,12月20日,中国网络空间安全协会人工智能安全治理专业委员会在北京发布了用于大模型的首批中文基础语料库。中国网络空间安全协会相关负责人介绍,在中央网信办相关业务部门指导下,网安协会人工智能安全治理专委会会同国家权威机构,

  • 用于大模型的首批中文基础语料库发布

    中国网络空间安全协会人工智能安全治理专业委员会20日在北京召开发布会,面向社会发布用于大模型的首批中文基础语料库。据悉,网安协会人工智能安全治理专委会会同国家权威机构,发挥企业、高校和科研单位协同优势,通过“共建-共享”机制,

  • 粤语语料库建设与大模型评测重点实验室在广州大学启动

      中新网广州11月17日电(记者 许青青)据广州大学17日消息,大模型与语言资源学术研讨会暨粤语语料库建设与大模型评测重点实验室启动仪式近日在该校举行。记者获悉,该重点实验室由广州大学和广州市社会科学界联合会联合共建,采取政产学研用一体化的模式,形成围绕粤语语料库建设与智能化服务的合作生态。粤语语

  • 直指AI发展两大瓶颈北京这份文件给出答案:实施算力伙伴计划、建设预训练语料库

    《科创板日报》5月16日讯 继表态“支持头部企业打造对标ChatGPT的大模型”后,北京市近日公开待定的新措施,直指AIGC发展中算力、数据不足两大痛点。据北京市政府网站消息,为抢抓大模型发展机遇,重视通用人工智能发展,北京市科委、中关村管委会制定了《北京市促进通用人工智能创新发展的若干措施(20

  • 谁为AI中文语料建设破局?语料联盟与语料库扮演关键角色

    继国家数据局等17部门联合印发《“数据要素x”三年行动计划(2024-2026年)》之后,中央面向公共数据开发利用的首个顶层设计文件《关于加快公共数据资源开发利用的意见》公布,构建公共数据资源开发利用“1+3”政策规则体系。

  • 星环科技成功举办“数据要素市场与大模型语料库论坛”

    11月26日,由中国大模型语料数据联盟指导,上海数据交易所、星环信息科技(上海)股份有限公司主办,上海市数商协会协办的“数据要素市场与大模型语料库论坛暨中国大模型语料数据联盟开放日活动”成功举办,200余家大模型数据、人工智能及技术企业及相关机构代表出席会议。   

  • 上海发布首个行业专属语料库支撑医疗行业大模型训练

    东方网记者刘轶琳11月27日报道:今天,市经济和信息化委员会、市卫生健康委员会、上海市疾病预防控制局共同发布上海市首个卫生健康语料库。同时,会同上海申康医院发展中心指导,由中国电信股份有限公司上海分公司携手上海市人工智能行业协会、复旦大学附属中山医院、同济大学附属东方医院以及人工智能产业链上下游企业

  • 星环科技成功举办数据要素市场与大模型语料库论坛

    2023全球数商大会于11月25-26日在上海成功举办,活动期间共举办1场开幕式、1场主论坛、1场数据交易节及20场主题论坛。11月26日,由中国大模型语料数据联盟指导,上海数据交易所、星环信息科技(上海)股份有限公司主办,上海市数商协会协办的“数据要素市场与大模型语料库论坛暨中国大模型语料数据联盟

  • 人工智能赋能医学上海发布卫生健康行业语料库、医疗应用场景MaaS平台

    中新网上海11月27日电 (记者 陈静)上海市经济和信息化委员会、上海市卫生健康委员会、上海市疾病预防控制局27日共同发布上海市卫生健康行业语料库,包括临床医学1.0版和公共卫生1.0版。上海市卫生健康行业语料库27日正式发布。(上海市卫健委供图)上海市卫生健康行业语料库立足于“健康中国”国家战略,