广东探索打造“粤港澳大湾区数据特区”,人工智能相关数据产品累计交易额近5000万
21世纪经济报道记者张雅婷 广州报道
11月13日,广东省人民政府发布关于加快建设通用人工智能产业创新引领地的实施意见(下称“《实施意见》”)并召开新闻发布会。该文件聚焦广东通用人工智能产业创新发展重点提出22条政策举措,力争在算力、算法、数据、产业、生态等方面取得重大突破。
《实施意见》强化粤港澳协同发展,探索打造“粤港澳大湾区数据特区”,进一步助推“数字湾区”建设。为加强高质量数据供给能力,《实施意见》提出着力构建高质量多模态中文数据集,开展公共数据标注攻坚行动,从而促进通用人工智能(大模型)应用创新。
探索打造“粤港澳大湾区数据特区”
数据是人工智能学习的基础。此次《实施意见》提出充分利用港澳制度和资源优势,发挥珠海横琴,深圳前海、河套,广州南沙等地区的桥头堡、试验田的作用,率先提出探索打造“粤港澳大湾区数据特区”,力争在湾区内建立数据流通规则体系、完善运营机制等方面形成工作探索。
广东省科技厅厅长王月琴在发布会上表示,大湾区协同联动是广东发展通用人工智能的基础与优势,应发挥大湾区在基础研究、营商环境、国际化科研资源等方面的优势,集聚全球高端要素资源和国际顶尖人才,着力突破人工智能关键核心技术及成果应用。
今年6月,国家互联网信息办公室与香港特区政府创新科技及工业局签署的《关于促进粤港澳大湾区数据跨境流动的合作备忘录》,建立粤港澳大湾区数据跨境流动安全规则,促进粤港澳大湾区数据跨境安全有序流动。
推动粤港澳大湾区数据要素畅通流动,也是广东正在加速推进“数字湾区”建设的重要举措。今年以来,广东深入实施“湾区通”工程。随着《粤港共建智慧城市群合作协议》和《粤澳共建智慧城市群合作协议》的签署,广东与港澳地区共建智慧城市群,将点在数据资源整合、开放和应用创新等方面发力,促进大湾区数据要素便捷流动。
发布会上,省政务服务数据管理局副局长魏文涛表示,该局计划建设可信数据空间,探索建设“粤港澳大湾区数据特区”,通过利用隐私计算、可信数据链等多种安全技术,确保数据跨境流通的效率与安全,从而有序推动跨境数据双向流通,赋能广东省“新一代人工智能”技术发展。
构建高质量多模态中文数据集
为了加快推动人工智能数据资源建设,提升数据供给,《实施意见》提出,着力构建高质量多模态中文数据集。汇聚高质量与高可用的中文数据,开展公共数据标注攻坚行动。
今年9月,广东省公共数据标注训练试点已在2023数据要素发展大会上正式启动,将通过建立高质量的公共数据中文语料库、搭建公共数据标注训练平台、探索公共数据标注试点场景等措施,挖掘公共数据在通用人工智能(大模型)领域的价值。
为加快数据资源和数据要素体系建设,着力构建高质量多模态中文数据集,广东省政务服务数据管理局将联合各级政府部门、人工智能(大模型)行业龙头企业,分阶段分批汇聚涵盖文本、图像、视频、音频等多模态数据,通过数据归集、清洗、分级分类、标注等治理过程,构建高质量中文语料库,积极推动人工智能数据产品交易。据介绍,广东省人工智能相关数据产品截至目前累计交易额近5000万。
“我们在清远设立的百度智能云(清远)人工智能基础数据产业基地,目前累计引进孵化数据标注企业5家,稳定在职标注师超200人。”魏文涛说。
同时,广东将加快典型应用场景建设,推动通用人工智能技术在数字政府领域落地见效。鼓励各级部门、企业单位和研究机构,围绕政务服务、区域治理、民生实事、乡村振兴等领域应用需求,开展人工智能创新应用研究,挖掘公共数据在通用人工智能(大模型)领域的价值。
目前,省政务服务数据管理局已引入6家企业,采用私有化部署的方式,在政务外网开展大模型部署和大模型应用开发。梳理出了“粤经济”Eco-GPT、通用行政材料辅助撰写、项目立项智能审批、“投资广东”产业转移招商引资、粤视+、粤省心12345热线等场景应用,其中“粤经济”Eco-GPT、通用行政材料辅助撰写等场景已启动数据训练。
- 免责声明
- 本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。