首页 > AI资讯 > 最新资讯 > 前沿对话|AI大模型时代,地理空间智能面临哪些机遇和挑战?

前沿对话|AI大模型时代,地理空间智能面临哪些机遇和挑战?

新火种    2023-10-23
前沿对话|AI大模型时代,地理空间智能面临哪些机遇和挑战?###

  行业热点

  人工智能技术用到GIS数据生产、管理、分析等方面,进一步提升了GIS的智能化水平,地学大模型应用也已经起步。面对“来势汹汹”的AI大模型,地理空间智能将面临着哪些机遇和挑战?

  在2023地理信息软件技术大会主题大会的前沿对话环节,国际欧亚科学院院士、南京大学教授李满春,中国工程院院士、深圳大学智慧城市研究院院长郭仁忠,中国国土勘测规划院党委书记、院长冯文利,武汉大学遥感信息工程学院院长张永军,美国威斯康星大学长聘副教授、国际华人地理信息科学协会理事会主席高松,阿里云智能副总裁曾震宇,超图软件集团创始人、欧亚系统科学研究会理事长钟耳顺,针对“AI大模型时代,地理空间智能将面临着哪些机遇和挑战”主题,展开了一场头脑风暴。

  现将现场文字速记整理,以飨读者。从他们的言辞间,我们不难看出,想要真正实现融合人工智能的地理空间智能,业界还有很长的一段路要走。

  在“前沿对话”环节伊始,国际欧亚科学院院士、南京大学教授李满春从ChatGPT的问世与带来的价值出发,介绍了AI大模型发展历程、发展现状、特点及其应用情况。

  “

  李满春:2022年11月底,OpenAI公司推出人工智能对话机器人ChatGPT。不同于以往的AI生成内容工具,ChatGPT不仅在内容生产上快速高效,并且具有一定的创作能力,作诗、写代码、聊天……各类文本信手拈来,带给人们强烈的科技震撼,在全球掀起了一股AI热潮。

  ChatGPT是使用深度学习技术生成的人工智能大型语言模型。所谓大模型,是指在大规模的数据集的基础上进行训练,并且适用于深度学习模型,是“大算力+强算法”相结合的产物,是人工智能的发展趋势和未来。国际上大模型起步于2010年的前后,国内大模型兴起于2021年。据《中国人工智能大模型地图研究报告》显示,中国大模型呈现蓬勃发展态势。

  目前大模型应用体现在三个方面:一是自然语言理解,通过预训练模型,实现准确和流畅的语言理解和生成;二是计算机视觉,大模型对于跨模态语义有着零样本语义对齐能力,可为下一步发挥作用打下基础,如构建视觉的基础模型;三是多模态,多模态的大模型可以同时处理图像、音频、文本等多种类型的数据,也可以通过大模型对海量科学数据进行处理,挖掘其中的规律。

  近年来,3S技术与人工智能、大数据、物联网等技术进一步深度融合,让地理智慧走向空间智能。人工智能技术用到GIS数据生产、管理、分析等方面,进一步提升了GIS的智能化水平,地学大模型应用也已经起步,在健康地理学、城市地理学等方面已经实现了一些价值。

  ”

  人工智能加速发展

  地理信息领域应用初见成效

  李满春:ChatGPT再次点燃了人们对人工智能的热议,郭老师对此怎么看?

  郭仁忠:ChatGPT的出场确实惊艳,它或将为地理信息带来新的发展机遇。地理信息领域有很多待处理的问题,现有的技术效果不尽如人意,期待新的大模型能够带来新方案。同时,ChatGPT自身也存在一些局限性,它需要相关领域知识的支撑。这对地理信息领域提出了新挑战:我们现有的数据和知识,能否激发出大模型的算力?

  ▲国际欧亚科学院院士、南京大学教授李满春

  ▲中国工程院院士、深圳大学智慧城市研究院院长郭仁忠

  李满春:永军老师如何看待将大模型移植到地理空间领域的可能?

  张永军:目前我们研究的这一代技术基本以深度学习为主。如果要将自然语言理解、视觉模型、多模态模型等大模型的体系,移植到地学领域,可以借鉴原先将深度学习移到地学的方法,用地学专业和小样本知识,训练地学大模型。如此,基于地学大模型进行遥感影像的解译,或许可达到人的智能解译水平。

  ▲武汉大学遥感信息工程学院院长张永军

  李满春:冯院长一直关心如何利用大模型来提高自然资源数据融合的准确度和自动化程度。

  冯文利:空间治理能力的提升,离不开高新技术的转化和应用,尤其是强调空间管控精准和高效的国土勘测规划领域。近年来,借助信息手段,国土调查能力已逐步提高。

  为了快速、精准地处理国土影像数据,我们采用了人工智能技术,完成了对影像的全方位解译。对于道路、水体、建筑物等影像特征较为明显的,识别精准度可达到90%以上;对于耕地和耕地内部不同的种植结构等边界不清晰的地方,准确度稍显欠缺,人工智能的技术还需要再提升。

  目前,我们形成了人机交互为主、实地调查为辅的方法来确保数据的准确性,人工智能只是作为一个辅助的手段。希望通过技术大踏步发展,我们能够实现以人工智能为主、人力调查为辅。

  ▲中国国土勘测规划院党委书记、院长冯文利

  李满春:利用大模型为信息化工作提供服务,在国外是怎样的研究状态?

  高松:目前,多模态和多源大数据的融合,在特定的场景已经有比较好的应用,如道路网络因为物体的遮掩无法看到清晰的边界,多模态就可以提升地物信息的提取能力。

  想要打造地理空间大模型,可以采用三种预训练方式:第一类,针对视觉、图像、轨迹、文本等分别预训练,再通过串联的方式把它们融合起来;第二类,把多模态数据同时通过对比的方式,如图文对比学习,找到它们之间的关联,再去做训练;第三类,通过地理知识图谱可以更好地关联无监督大数据的融合。构建地理知识图谱之后,我们可以挖掘或者嵌入早期经典的定性、定量的空间推理方式,在地理知识图谱上实现。

  通过这样的三类不同的预训练,我们可以把多模态、多源的地理空间大数据更好融合,进而展开大模型训练。

  ▲美国威斯康星大学长聘副教授、国际华人地理信息科学协会理事会主席高松

  李满春:钟总早年提出一个名词“地理空间控制”,今天您对这个词有什么新看法?

  钟耳顺:地理空间控制是2013年提出的。人类可以不懂语言,但是一定会生存在地理空间中,我认为地理是最基础的东西。随着地理空间智能的发展,有很多事物都会走向人工智能,要依靠地理空间坐标、位置进行控制,这是我早期提出的概念。人工智能是一个途径,地理空间控制可能是一个最终实现目标。

  ▲超图软件集团创始人、欧亚系统科学研究会理事长钟耳顺

  李满春:预训练大模型在地理空间、地学领域等有着什么样的应用场景?

  曾震宇:未来我们可以围绕卫星遥感领域以构建预训练模型,在大模型上加上少量的人工标注数据,使其可以用在下游的自然资源领域等多种应用场景中。这值得探讨和研究。

  ▲阿里云智能副总裁曾震宇

  机遇与挑战并存

  地理信息领域当积极应对

  李满春:在人工智能时代,大模型对于地理信息领域将起到非常大的作用。在人工智能下一步的发展当中,地理信息领域该做些什么?

  郭仁忠:面对蓬勃发展的人工智能大模型,地理信息领域可能面临两大挑战。

  第一,ChatGPT虽然在一本正经地“胡说八道”,但它是基于相当数量的知识预训练,所以,我们要尽可能把地理信息的知识、数据整理出来,为地学大模型提供预训练学习的内容。

  第二,ChatGPT展示了超强的纯语言智能,但地理空间智能不是纯语言智能,更需要空间智能分析能力,二者的逻辑不一样。因此,地理信息领域和人工智能领域的专家要相向而行,共同解决这个问题。

  李满春:我们不仅要语言智能,还要空间智能,特别是面向生态文明建设的新时代国土空间规划编制,大模型能为我们带来什么价值?

  冯文利:我们一直在探索前沿技术的应用,早年间我们进行国土调查都是绘制图表,通过卫星全覆盖以后,我们实现了空间矢量化图斑的管控,这次最新的国土调查又实现了云端管理,打造了“互联网+调查”的模式。

  下一步,我们期待空间智能把智慧赋予到国土空间的工作中去,完善快速处理、自动识别等能力,建立起更智能的体系,助力我们真正进入人工智能的新时代。

  李满春:这个过程当中,阿里云的大模型能够进一步发挥怎样的作用?

  曾震宇:当前的挑战是,如何将沉淀多年的影像遥感信息进行提炼,变成语义信息,与影像结合来打造预训练模型。大模型之所以能取得好效果,是因为学习了海量的图文信息。未来,我们应探索如何将语义信息与图像结合,将自然资源国土空间的相关的特征进行提取,放到模型中去训练。

  此外,卫星遥感领域跟互联网不同,现阶段卫星影像跟语义相关的数据并不多,其中还包含部分人工标注出的数据。如果能建立一些机制,以自动的方式给卫星遥感影像添加语义信息,将对训练预训模型起到很大帮助。

  李满春:我们所见到的地理现象,在空间上表现出异质性,这将带来更多挑战。对此高松老师有什么见解?

  高松:现阶段比较理想的情况是,已经开发完成的模型具备好的泛化能力和迁移能力,即:在某一个区域特定时段训练的模型,能迁移到世界上另外的一个区域和新时段。

  但有研究发现,具有地理空间相似性区域的模型表现较好,果用海量的(如全球尺度)数据,来训练地学空间大模型,也许能解决空间异质性的问题。以遥感为例,现阶段主要聚焦区域性训练,如何把亚洲、欧洲、美洲各个区域的训练模型耦合起来,是值得探索的方向。

  李满春:ChatGPT对于您想象的、或者原来看好的AGI距离还有多远?

  钟耳顺:ChatGPT基于语义信息运作,这与地理学的逻辑方式不同,地理学是非线性的,比较难把握规律,很难找一个标准答案。但ChatGPT提供了一个范式,将人工智能融合地理空间信息,基于全球的影像数据进行训练,是不是可以把GI(空间智能)发展为通用地理信息模型?这对地理学是一个挑战。

  李满春:当前,国土空间规划正在建立“一张图”实施监督信息系统,冯院长如何看待?

  冯文利:目前很多资源调查单位、国土空间规划编制和研究单位等,都在探索如何打通基于底图(底座)实现智能规划路径。海南已经实现了以“机器管规划”赋能国土空间智慧治理,其他地方也在尝试。我们也在搜索,通过一些样本和算法,把编制规划的规则转成算法,训练出大模型,实现自动生成一张空间蓝图。希望能汇聚业界各方力量,共同将这个蓝图变为现实。

  面对奔腾的大模型浪潮

  要长期投入和深度学习

  李满春:各位的发言也反映了一点:地学特别复杂,包括很多不确定性。面对ChatGPT的问世,地学领域该如何尝试进行改变?

  郭仁忠:这是地学领域一直在考虑的问题。ChatGPT的智能语言处理效果很好,但是知识呈现方式、分析问题方法跟地学领域不完全一样,确实需要深化地理信息和人工智能领域等的深度融合。

  事实上,人工智能对自然语言、图象、声音等识别与处理的效果好,是因为人物、物力的长期大量的投入,实现了一个长期的深度学习。地学领域也可以参考这种方法,也许某一天能找出适合地学领域的方法,来处理一些亟待解决的问题。

  李满春:郭老师给我们指明了一个方向,先从能够做到的或者相对确定性的事情做起来,比如跨模态的遥感影像解译。永军有什么能分享的经验?

  张永军:现在业界面临跨模型融合问题。ChatGPT是语言模型,SAM(Segment Anything Model)可看做视觉模型,假设将一张黄鹤楼图像放到视觉模型当中,它能立刻识别“这是黄鹤楼”,ChatGPT则能整理出所有与黄鹤楼相关的文本资料,并转成语音播报。这就是视觉+文本的跨模态机制。

  但想要在模型中把文本、图像、声音、时间、序列融合在一起,还需要知识图谱。以遥感知识图谱为例,构建了遥感知识图谱之后,人们可以在解译的基础上,摘去很多错误的伪提取,让跨模态知识跑在预训练模型之上,再联合文本、图像、时空信息、规则等,构造一个地理空间智能的大模型。但这个模型的规模会非常大,大到一定程度后,只有阿里云这样的大公司才能用。我想请教曾总:百亿级、千亿级的模型有多大?会在什么场景中使用?

  曾震宇:AI界对很多事情没能精确量化计算方式,机器学习、深度学习、大模型训练均是如此。如果有足够多的高质量数据,那可以把数据投入模型中进行训练。这里要关注:模型的大小是不是能能容纳这些数据,训练的时间是不是足够把相应的知识抓取充分,基于此来摸索模型达到极限所需要的阈值。

  李满春:从遥感影像的角度您怎么看?他刚才说到他的一个情况,模型要大到怎样的程度?

  张永军:遥感影像本来就很大,如果模型也很大,那给计算资源带来很大压力,所以我们现在做遥感影像解译用的是深度学习,希望训练的模型物理尺寸越小越好。

  曾震宇:其实很多技术都在训练模型,模型的能力越强,消耗的资源越多,因此,现在有多研究都在尝试把模型压缩成一个体量小的模型,以经济实惠的方式,将模型使用在更多高频的场景中。

  对大模型的寄语

  郭仁忠:愿景很美好,目标很明确,道路很漫长。

  冯文利:让我们携手进入AI新时代,共同赋能国土空间治理的新模式。

  张永军:我们追求的是大模型、小样本,地理空间智能未来无限可能。

  高松:地球是复杂系统科学,希望未来打造将地学知识和AI能力结合的地理空间智能的新时代。

  曾震宇:深度学习已经对地学领域产生了深刻的影响,相信经过产学研多方努力,预训练大模型一定在地理信息领域产生更加深远的影响。

  钟耳顺:地理信息与人工智能融合前景广阔,但是任重而道远,希望寄托在年轻一代人身上。

Tags:
相关推荐
免责声明
本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。