地球科学中数据驱动的发现
长期以来,人类一直在探索三个重大的科学问题:宇宙的进化,地球的进化和生命的进化。地学家们承担了阐明地球和生命进化的任务,这些进化史保存在跨越45亿多年地球历史的信息丰富但不完整的地质记录中。深入研究地球的深厚历史有助于地球学家破译地球演化的机制和速率,揭示气候变化的速率和机制,寻找自然资源,并展望地球的未来。
演绎推理和归纳推理已被广泛用于研究地球历史。与演绎和归纳相反,绑架源自对大量可靠数据的积累和分析,而与前提或概括无关。因此,绑架有可能在科学中产生变革性的发现。随着大量深层地球数据的积累,地球科学家准备通过数据驱动的归纳发现来转变深层地球科学的研究。
但是,必须解决三个问题,以利于使用深度数据库进行绑架式发现。首先,许多相关的地理数据资源不符合科学数据管理和管理的FAIR(可找到,可访问,可互操作和可重用)原则。其次,数据库中使用的概念和术语定义不明确。因此,相同的术语在整个数据库中可能具有不同的含义。没有标准化的术语和概念定义,就很难实现数据的互操作性和可重用性。第三,数据库在地理区域,空间和时间分辨率,地质主题的覆盖范围,数据可用性的局限性,格式,语言和元数据方面高度异构。由于地球复杂的演化以及多个球体(例如岩石圈,
地球历史中的科学问题可以使用已知和未知框架来解决:(1)已知已知。相对于其他两个类别,该类别包括地球历史上被广泛接受和广泛理解的事件,尽管不确定性仍然存在。(2)已知的未知数。此类事件包括已被广泛接受的事件,但对关键方面的了解却很少。在许多情况下,可以通过其他观察,测量或实验来检验有关此类事件的假设。(3)未知的未知数。此类别包括发生在地球历史上但尚未发现的事件。通过其知识系统和平台,DDE旨在协调深层地球数据,并促进在这些未知数(尤其是地球历史中的未知数)中进行数据驱动的发现。笔记:前寒武纪和古生代的时间尺度不同。图片来源:科学出版社
大数据和人工智能正在创造解决这些问题的机会。为了通过深层大数据有效而有效地探索地球的演化,我们需要跨越深层地球科学各个领域的FAIR,综合和综合数据库,以及量身定制的计算方法。此目标激发了“深层数字地球计划”(DDE),这是由国际地质科学盟(IUGS)发起并与国家地质调查局,专业协会,学术机构和科研机构合作开发的第一个“大科学计划”。世界各地的科学家。DDE的主要目标是通过国际和跨学科的合作促进深度的,数据驱动的发现。使用知识引擎(深度地球引擎)进行知识发现,该引擎提供计算能力,模型,方法和算法。
为了实现其使命和愿景,DDE计划包含三个主要组成部分:计划管理委员会,卓越中心以及工作,平台和任务组。DDE将基于现有的深层地球知识系统并开发一个开放平台(图2)。深度地球知识系统由深度地球概念的基本定义和概念之间的关系组成,这对于协调深度地球数据和开发知识引擎以支持对地球演化的归纳探索来说是必不可少的。DDE研究计划的第一步是建立在现有的深层地球知识系统上。DDE研究计划的第二步是建立可互操作的深度地球数据基础架构。DDE研究计划的第三步是开发一个深层地球开放平台。
DDE程序的执行包括四个阶段。在第一阶段,DDE建立了具有国际政策和管理标准的组织结构。在第2阶段中,DDE组成了初始团队,并与地球科学领域的现有本体研究人员合作,以现有的深层地球知识系统和数据标准为基础,同时致力于链接和协调深层的地球数据库。在阶段3中,DDE为云计算和超级计算环境开发了量身定制的算法和技术。在阶段4中,地球科学家和数据科学家在引人入胜的综合性科学问题上无缝协作。
作为DDE计划的综合雄心和国际野心,预计将面临一些挑战。但是,通过创建一个开放访问的数据资源,该资源首次集成了地球叙述的过去的各个方面,DDE有望以崭新而生动的细节了解我们星球的过去,现在和未来。