,IBM 和美国宇航局马歇尔太空飞行中心最近宣布展开合作,利用 IBM 的人工智能(AI)技术,从 NASA 海量的地球与地理空间科学数据中发掘新洞察。这项合作是首次把 AI基础模型技术应用于 NASA 的地球观测卫星数据。
IT之家备注:基础模型是在一组广泛的未经标记的数据上进行训练的 AI 模型类型,可用于不同任务,并且可以举一反三,将某一情况的信息应用于另一种情况。
IBM 称,过去五年,基础模型快速推进了 AI 自然语言处理领域的技术发展,现在,IBM 正在探索和开创除 NPL 领域之外更多的基础模型应用场景。
地球观测工作使科学家研究和监测地球成为可能,同时这项工作也正以前所未有的速度和数量在收集数据,迫切需要借助新的创新方法从这些庞大的数据源中提取知识。此次 IBM 与 NASA 携手合作的目标,就是要为研究人员提供一种更为简单的方法来分析这些大型数据集,并从中获取见解。IBM 的基础模型技术有望加快这些数据的发现与分析,从而快速推进人类对地球的科学理解以及对气候相关问题的响应。
IBM 和 NASA 计划开发几项新的技术来从地球观测工作中提取见解。其中一个项目将在 NASA 的Harmonized Landsat Sentinel-2数据集上训练 IBM 的地理空间智能基础模型,HLS 数据集记录了地球轨道卫星所捕获的土地覆盖和土地利用变化的数据,通过分析这些 PB 量级的卫星数据,来确定自然灾害、周期性作物产量和野生动物栖息地等现象的地理足迹变化,这一基础模型技术将帮助研究人员对地球的环境系统进行重要的分析。
这项合作的另一个输出成果,预计将会是一个易于搜索的地球科学文献语料库。IBM 开发了一个 NLP 模型,经过近 300,000 篇地球科学期刊文章的训练,该模型可以组织相关文献并且可以更为轻松地发现新知识。这一训练完备的模型,包含了迄今为止在红帽 OpenShift 软件上训练的最大的 AI 工作负载,使用 IBM 的开源多语言问答系统 PrimeQA。除了为研究人员提供资源外,还可以把地球科学的新语言模型注入 NASA 的科学数据治理以及管理的流程当中。