首页 > AI资讯 > 最新资讯 > 从创新到应用,AI如何破局?

从创新到应用,AI如何破局?

新火种    2023-09-22

  ChatGPT引发的大模型浪潮,让各大互联网科技企业躬身入局,掀起了一场“肉搏战”,也拉开了国产大模型进击的序幕。

  尽管大模型最先发端于国外,却在国内引发轰轰烈烈的应用。中国能否拔得“中国版ChatGPT”头筹?如何实现关键技术与产业应用紧密结合,实现“弯道超车”甚至“直道冲刺”?

  琶洲实验室副主任、华南理工大学计算机科学与工程学院院长陈俊龙认为,我国的人工智能产业在应用端和服务端有极大的先发优势和广阔市场,接下来,可以从基础理论、应用落地两端发力。

  ●南方日报记者郜小平

  如何扬长?

  发挥产业先发优势

  在这一波大模型热中,国产大模型起步虽然稍晚,但反应仍然敏捷。

  从今年3月百度率先发布大语言模型生成式AI产品“文心一言”后,各大科技互联网巨头纷纷入局,国内大模型瞬间遍地开花。包括阿里、华为、商汤科技、科大讯飞、360、腾讯等,纷纷推出各类大模型。

  各大企业的较量,从以ChatGPT为代表的通用大模型转入到垂直领域应用,深入实体经济,赋能千行百业。

  这与国内的产业转型高度契合。当前,我国产业正面临智能化转型,人工智能与国内各行业深度融合,成为驱动产业转型升级的重要力量。众多产业对高质量发展的需求,为大模型的落地应用提供了场景支撑。可以说,产业应用的实际场景已经成为了大模型的最佳“练兵场”。

  例如,在电力能源场景中,传统的AI模型往往需要重复大量枯燥的数据标注工作,而大模型可实现数据自动化标注,让员工有时间做更有价值的工作。

  商汤科技与南方电网人工智能公司合作研发了不少特定场景下的小模型,如智能巡检、三维建模等,提供大模型的训练基础设施、算法、训练和微调服务,服务于电力的发输配变用调等各个方面。

  百度CEO李彦宏就曾谈到,大模型技术将重构全球数字化产业。新的国际竞争战略关键点,不是一个国家有多少个大模型,而是你的大模型上有多少原生的AI应用,这些个应用在多大程度上提升了生产效率。“如果我们能挤上牌桌,获得竞赛入场券,中国将拥有更壮大的数字化产业,数字经济规模将获得巨大增长”。

  陈俊龙提到,我国的人工智能产业在应用端和服务端有极大的先发优势和广阔市场,但在人工智能基础理论方面的研究较欠缺。过去的研究中,往往展现市场带动研发的姿态,中国应当发挥政校引导优势,建立项目目标指引,从单点突破转为体系统筹,从基础理论、应用落地两端发力,使AI行业呈现健康的发展姿态。

  怎么补短?

  挺进关键核心技术

  在多位专家看来,把关键技术与产业应用紧密结合,也能反向促进基础研究和关键技术的发展。

  科大讯飞董事长刘庆峰坦言,讯飞不仅要致敬和追赶OpenAI,更要的是在源头上做自主创新。通用人工智能将是一个新的进程,但绝不是一蹴而就的,所以既要有短期攻关的雄心,更要有长期主义的恒心。

  中国大模型正呈现蓬勃发展态势,实际上,大模型不是“平底起高楼”,在此之前,中国的人工智能技术就已经位列全球前列。中国大模型技术沿各技术路线迅速发展,在自然语言处理、机器视觉和多模态等领域涌现出多个具有行业影响力的预训练大模型。

  “大模型其实也不是从天上掉下来的,去年突然火了,大家就去做大模型,我们在2020年就对语言的生成投入了很多精力。”京东探索研究院院长、京东科技智能服务和产品部总裁何晓冬表示,京东在生成式人工智能领域有20多年的经验,在他看来,大模型并不是一蹴而就的技术产品,尽管各家集中发布了大模型,但这是由各个平台长期的技术积累所推动的。

  在科技圈,有这样一个津津乐道的故事:7年前,商汤科技在深圳举行第一次高管会,其中一个主题是关于企业文化的探讨。此后,商汤确定了“让人工智能引领人类进步”的使命,商汤科技创始人、香港中文大学教授汤晓鸥又在这句话之前加上了四个字——“坚持原创”。

  在2023世界人工智能大会开幕式发言中,汤晓鸥分享了他的三个学生在大模型研究中作出的原创贡献:王晓刚带领开发的DeepID系列首次让机器的人脸识别超过了人的眼睛,何恺明有关残差网络(ResNet)的论文解决了深度网络的梯度传递问题,林达华的计算机视觉开源算法体系OpenMMLab成为国际上最具影响力的视觉算法开源体系。

  “中国的科技原创者也开始看到了曙光。”他说。

  除了埋头研发,跨国科研合作也成为专家们的关注焦点。陈俊龙就提到,中美两国在人工智能领域是全球的领头羊,然而单打独斗是不可取的。美国AI领域高水平论文平均引用率为44.99%,中国AI领域高水平论文平均引用率为31.88%,中美合作论文的平均引用率达51.2%,其影响力明显高于中国和美国各自论文的平均引用水平。这表明,跨国合作的科研成果在世界人工智能研发领域的展示和交流概率大大增加。

  “放眼世界,只有中国才有可能成为美国之外‘智慧涌现’的第二极。”刘庆峰说道。

  对于大模型接下来的发展,何晓冬表示非常有信心。“如果从更高层次来看,大模型会走向多模态,走向具身智能,比如说机器人真的有通用智能,这本身就是很激动人心的事情”。

  怎样攻坚?

  底层技术成角力场

  看起来势头凶猛的国产大模型依旧面临着不容忽视的挑战,这并不意味着大模型门槛就低。对国产大模型而言,这注定是一场漫漫征途。

  新的算法不再开源、算力底座不稳、高质量训练数据稀缺,被称为人工智能发展的“三驾马车”中,似乎每个要素都布满荆棘。发展大模型往往意味着数亿到数十亿美元的资金持续投入。

  行业数据依然是最大的痛点,特别是在搜集文档形成提示样本方面,还需要下功夫。以商汤科技联合南方电网人工智能公司联合推动的大模型为例,负责整理文档、数据和撰写提示这些“脏活累活”的劳务团队就超过40人,这与OpenAI这方面的劳务投入是相一致的,否则大模型会“学不到电力系统知识,或者学到不应该学的”。

  构建大模型是成本极高的系统工程,需要大量的高质量数据进行训练和优化,还必须经过清洗和预处理,某种程度上,大模型掀起了科技公司领域的“云上战争”。目前,包括华为、腾讯、商汤科技等厂商,已纷纷前瞻性布局算力中心,打通算力、算法和平台,支持大模型训练的基础。

  陈俊龙建议,注重底层硬件和框架自研。受限于AI高性能芯片的缺失,我国大模型的高算力需求终将面临瓶颈。需要加强芯片的设计和制造能力,提高芯片的性能和能效,多支持、扶持华为昇腾、摩尔线程等芯片、计算卡相关的设计和生产主体。此外,人工智能框架是搭建模型的基础,包括TensorFlow、PyTorch等。我国也有相应的深度学习框架,如百度的PaddlePaddle、华为的MindSpore,但知名度和普及率远不及前者。需要加强对框架的研究和开发,提高框架的性能和易用性。

  同时,他指出,政府应注重与资源、院校、用户的四方协同,合理制定发展战略。发挥计算资源优势方面,在广州人工智能公共算力中心、深圳鹏城云脑、横琴人工智能超算中心、韶关数据中心集群的算力保障下,政府应大力推广算力共享与服务,促进院校与企业摆脱设备限制、简化软硬件平台的采购维护流程,将重心投入算法和服务的研发。

(文章来源:南方日报)

Tags:
相关推荐
免责声明
本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。