前景回顾:
大数据在化石的埋藏学和形态学领域的应用很大程度上帮助了科学家们更快更好地找寻化石并分门别类了解他们的演化历史。那些生活在遥远地质时代的生物虽然保存成了化石,但曾经也与我们一样生存在一片蓝天白云之下.......
那么如何用大数据解码他们生存的环境并将这些故事串联成册呢?
一、花开源自要春风--大数据与古气候
冬天刚刚过去,大家最近是不是感受到春天的温暖了呢?每年冬天,南北方的暖气之争总是绕不过的话题,没有暖气的南方朋友总是饱受寒冬的折磨。那在很久很久以前的地球上,没有暖气没有人类的时代,那些古生物们是如何度过冬天的呢?他们的冬天有多冷呢?又或许,他们真的经历过冬天吗?科学家们又是如何得知史前“冬天”的存在呢?
地球的停暖期——冰河时期
这不就是冬天没有暖气的江浙沪吗?
地质历史上的冰期(Glacial period)是指一段持续的全球低温、大陆冰盖大幅度向赤道延伸的时期。与之相对的概念是间冰期(Interglacial period),即全球气温升高,冰盖消融退化的时期。冰期和间冰期可不像咱现在的冬天,就几个月,他们的持续时间都是用万年来计算的。而一个冰河时期则由多个冰期和间冰期交替旋回组成。
在距今7亿至6亿年前,当时的地球就经历了一次严重的冰河期,海洋几乎全部冻结,冰川已经蔓延到了赤道地区,全球可能都遭受了冰封,这就是所谓的“雪球地球”事件。听起来是不是很像电影《流浪地球》中的画面,这样的场景曾经是真实存在的。其实咱们现在就处在第四纪冰河期中,开始于258万年前。但全球变暖,冰川消融,海平面上升……现在的环境是不是很难让你联想到冰河时期呢?这只是因为咱们正处于1.17万年前开始的一个间冰期中。
冰冻的世界。图片来源:电影《流浪地球》
万能温度计——氧同位素
朋友,今天你量体温了吗?
科学家们都是怎么探测并分析出这一切的呢?除了冰碛沉积物等地质证据外,还不得不提到一个重要工具:氧同位素。
同位素(Isotope)是化学元素的不同种类, 特定元素的同位素拥有同等的质子数量和不同的中子数量,但他们在元素周期表上统统占据同一格,因此命名为同位素。提起同位素,许多人脑海中冒出的关键词都是“辐射”“放射性”“有害”等等,但其实并不是所有同位素都具有放射性,在自然界广泛存在的是稳定同位素。现在地质学家常常通过分析同位素来研究古代环境。
同位素(Isotope)是某种特定化学元素之下的不同种类,同一种元素下的所有同位素都具有相同质子数目,但中子数目不同。这些同位素在化学元素周期表中占有同一个位置,因此得名。插绘:王盛宇
氧同位素中,最丰富的是18O和16O。研究表明,18O和16O比值的变化,即δ18O,可以反映周围环境的温度变化。16O比18O少了两个中子,因此16O比18O轻,更容易随水蒸气蒸发。在温度偏低时,蒸发作用没那么强烈,含有16O的水分子比含18O的水分子更容易蒸发,水体中18O和16O的比值就会升高。这就好比一杯椰果珍珠奶茶,椰果的密度要小于珍珠,吸溜奶茶的时候就更容易吸上来椰果,所以越喝珍珠剩的越多,剩下的珍珠和椰果的比例自然也就更高了。
16O和18O具有相同的质子数,但 16O比18O少了两个中子,因此16O比18O轻,更容易随水蒸气蒸发。插绘:王盛宇
δ18O温度计的各种使用方法
给贝壳算命
都说海螺会唱歌?那你问它几岁了它敢答应吗?
在地球科学的研究中,科学家们常用有孔虫、双壳类等生物中的δ18O值来分析当时的水体温度及气候变化。18O和16O在碳酸盐中的比例取决于水环境的温度,那么δ18O值的规律性变化也就反应了水体温度的季节性波动。因此,分辨贝壳中δ18O值的变化周期,就能推断出它的年龄。
以双壳动物帘蛤Mercenaria stimpsoni为例,沿着贝壳的生长方向,每隔一两个毫米挖个坑采个样测量δ18O值,就能得到贝壳生长过程中δ18O值的变化趋势。每一个波动周期就代表着一次季节的更替 (Kubota et al., 2017)。认真观察壳体经历过的季节周期数,你就能知道它的年龄。仔细研究变化的规律,你还能知道它的喜好。有的贝壳喜欢春天和秋天,一到时候就可劲地长。有的贝壳讨厌冬天,一着凉就按下暂停键坐等夏天,等着“春江水暖壳先知”。
Mercenaria stimpsoni的生长方式,及壳中δ18O值的规律性变化。图片更改自(Kubota et al., 2017)
给地球测体温
地球也会发烧吗?
既然δ18O能测出一只贝壳经历过的季节变化,那它能不能扩大使用范围,测一测整个地球的温度变化呢?比如海洋的温度呢?
海水中的水分子同时包含了大量16O和18O。在全球变冷冰川作用增强的时候,海水中含16O的水分子更易蒸发,形成降雨后遇冷凝固在冰川中。这样冰川中16O储存的越来越多,海水中的18O也就越来越富集,海洋沉积物和海洋生物中的δ18O值也就相应升高了。
冰川作用下氧同位素的循环方式。海水中含16O的水分子更易蒸发,形成降雨后遇冷凝固在冰川中。插绘:王盛宇
如果你喝完了一杯珍珠椰果奶茶,那就知道了这杯奶茶里珍珠和椰果的比例。但如果你想知道所有珍珠椰果奶茶里珍珠和椰果的比例呢?那你就需要喝很多很多杯奶茶。同理,某个生物中的δ18O只能代表其中一个数据点,如果我们想知道某个地区或者某个时期里δ18O的整体变化趋势,那我们就需要很多很多个数据点。
来自世界各地的科学家们,测量过很多来自不同地区不同时期不同物种的δ18O数据。将这些数据整合起来,选用适当的计算方法,就能分析出整体的变化趋势,从而反映出整个地质历史时期的温度变化。随着科学技术的发展,我们能获得的数据越来越多,数据库也随之完善,分析的精度也就越来越高。例如图5展示的δ18O值变化趋势,就是在58,532个来自各个时期的海洋贝壳的数据基础上得出的(Veizer and Prokoph, 2015)。从图中可以看到,越往前追溯,δ18O的值相对越小,意味着早期海洋的温度越高。
寒武纪至今δ18O值的变化趋势反映出古海洋的温度变化,数据采集自腕足动物和浮游有孔虫。越往前追溯,δ18O的值相对越小,意味着早期海洋的温度越高,但这也可能是沉积后重结晶作用的结果。图片来源:(Veizer and Prokoph, 2015)。
如果哪天一只猛犸象在博物馆遇见了一只三叶虫,它大概也得感叹一句:夏虫不可语冰呀。
二、万物兴歇皆自然—大数据与古生物多样性
接下来,让我们看看大数据是如何把这些化石由“点”连成“线”的。
残卷半掩
化石,作为最为普通人所熟悉的科学研究对象之一,其实就是记录地质历史时期生物的一个又一个字符。而埋藏他们的地层,恰是记录当时生命历程的一页页书卷。但是这些书卷并没有整齐的放在那里,等待后人去翻阅,而是在一次次地质活动当中,被地震错断,被火山消熔,被海水遮盖……面对这些散落的字符,残破的书卷,如何将他们依时间重新汇编,将它们翻译成今人的语言,便是古生物和地层学家的工作与使命。
经过长达数十年各国科学家的合作与不断努力,地质历史被划分为许多不同时间单位,并通过标准化石来实现全球对比。经过不断的讨论和修订,在2008年国际地层委员会发布了第一版国际地质年代表。为地球生命的编年史定下时间框架。自此,每一块石头代表的书页有了属于自己的章节,而这些章节的划分也随着科学家的研究越来越清晰。
2020年第一版国际地质年代表。引自International Commission on Stratigraphy。
曙光初现
多年来,古生物学家一直对记录地质年代的化石种类的存在时间延限、各个地质历史时期生物多样性及驱动原因感兴趣(Phillips,1860)。地层学制定了可用于生物地层学的地层范围图,以建立一个相对的时间尺度,并用于地方与地方之间的对比。在20世纪50年代和60年代之后,在Norman Newell和Jim Valentine的早期研究之后,古生物学家开始思考全球和地区的多样性模式。
20世纪60年代,在美国罗切斯特大学,一个青年在图书馆里焚膏继晷,兀兀十年。John Sepkoski将图书馆文献中的化石记录整理汇编,画出了一条显生宙以来科一级的多样性曲线,并分析了不同地质历史时期的生物演化模式(Valentine,1973;Sepkoski,1976, 1978, 1979, 1984)。在片段式地见过了无数恐龙、三叶虫之类的神奇生物之后,人们第一次得以见到漫长地质历史时期中物种多样性变化的大致规律。那条曲线中识别出的五次生物大灭绝事件,至今仍然在被加以统计学、同位素化学、地层学、沉积学等方法不断研究,各种理论、假说也层出不穷。
全球显生宙属级生物多样性曲线。数据来自Sepkoski(2002)
但是,这些都是最初的纸质汇编的数据,难以实现共享和补充。随着计算机时代的来临,更为高效的数据整理方式——数据库被应用到了古生物统计当中。到目前位置,包含古生物数据最多的数据库应该是北美为基地的古生物数据库Paleobiology Database(简称PBDB)。PBDB包含众多的古生物学及其他地质学数据条目,如物种名称、作者和出版物、地层学、地质构造、相和沉积学等等,内部信息相互关联,易于修订。任何人都可以查询和上传自己的数据,会有专门的科学家进行核验和添加。因此它可以无限扩展,并且可以添加新的列表和分析函数。PBDB迄今已囊括了500多位科学家贡献的近150万条分类明确的化石记录。
Paleobiology Database(PBDB)的数据点浏览界面。图片来源https://paleobiodb.org/navigator/
2008年,以John Alroy教授为首的团队依据PBDB中的化石数据,形成了一条新的化石多样性曲线(Alroy et al.,2008)。这条曲线采用的数据已经与Sepkoski曲线有数量级的差异,这些数据经过了标准化校准,曲线也有许多差别,但是五次大灭绝仍然鲜明可见。尽管在数据数量上有了质的飞跃,但是长达数百万年的一个时间单位,时常让科学家困惑统计出来的数据是否偏离实际规律,生命历史上短暂而精彩的故事是否因此被忽略。
Alroy等的全球显生宙属级多样性曲线。图片来源(Alroy, Aberhan et al. 2008)
同期各类古生物的数据库也逐渐出现,定量化研究古生物的手段蓬勃发展,不同地区或某一时段的精细化多样性研究不断发表,但是能很好地将这些散落的章节汇编成册的工作却一直没有出现。
柳暗花明
汇编需要的不仅是字符,更是书页。许多化石难以被鉴定到准确时间,但相互制约就可以呈现出良好的“秩序”。这是高精度生物多样性研究的基础。当化石在岩石中分布的大数据汇集在一起,就可以从字符变成书页,科学家们所要做的是编辑工作。最新的化石序列编辑方法叫做约束最优化法(Constrained Optimization,简称CONOP)。
CONOP可以有效整合不同剖面的化石记录,用数学计算得出一个所有化石出现、消失的最可能序列。在这个序列的基础上,再把各个化石类群,如门纲目科属种,累加起来就形成了多样性曲线。
CONOP实践的一个成功的例子就是Sadler等于2009年用两种海洋动物笔石【漂浮生活的海洋无脊椎动物】、牙形刺【一种类似鳗鱼的海洋脊椎动物的牙齿】等建立了高精度的奥陶纪—志留纪时间框架(Sadler et al.,2009),其最终的时间分辨率可以达到2-10万年的分辨率。这个分辨率对于时间总跨度约六千六百万年的奥陶纪—志留纪来说,非常高了!Sadler称这一技术的效果是传统计时技术的十倍以上。
再添佳绩
随着计算机算力的提升,CONOP的并行计算也被开发出来。南京大学沈树忠院士和樊隽轩教授等在过去十年里收集了中国南部的大量地质剖面和化石记录,从中遴选了3112个剖面的11268个海洋生物物种化石,用CONOP方法寻求时间跨度近3亿年的地质时间段中的生物多样性变化。在这个工作中,可以进行并行计算的新版约束最优化程序CONOP.SAGA发挥了巨大作用。他们将运算架设在我国的“天河二号”超级计算机上,经过反复计算和统计学方法的验证,获得了中国寒武纪—三叠纪海洋生物的多样性变化,其时间分辨率约为2.6万年,较国际同类研究的精度提高了400倍左右(Fan et al. 2020)。这一成果为大数据在古生物学上的应用开启了新篇。
华南古生代海洋生物种级多样性曲线。图片来源(Fan et al. 2020)
这一成果只是科学家探索的一个初始。由中国科学家倡议、13个国际组织与机构共同发起了一项国际科学计划 ——“深时数字地球”,希望协同全球地学的科学家,整合过去数十亿年的地球演化的数据,实现全球数据共享。这一计划将搭建起全球地球科学家与数据科学家合作交流的平台,相信会有更丰富的数据量,也会有更高效的计算方法逐渐展现,更为精细的生命演化编年史的书写也将得以实现。
DDE官网http://ddeworld.org/
三、尾声
古生物大数据的工作对于揭示生物演化规律以探索生命的本质,从长期探索生物与环境的互动关系以为现今提供参考,建立地质年代框架以实现资源勘探都有深远意义。然而,看似寻常最奇绝,成如容易却艰辛。历经数年甚至十几年的数据搜集归纳整理结合现代科技手段定量计算,才能将这部生命编年史的残卷一点一点拼接起来。
回望地球生命演化史,这是一首岁月的长歌,也是一场生命的传奇。五亿多年前寒武纪的小虫睁开了第一双看到世界的眼睛,四亿年前泥盆系的鱼儿爬上陆地,两亿多年前三叠纪那场百万年的雨季里长出了参天大树,六千万年来哺乳动物在这颗星球上繁荣昌盛。火山与洪水,冰期与温室,曲折的演化历程亦造就了许多不朽的神话。他们就深埋在我们脚下的土地之中,等待着一次次创新、探索与诠释。
生物演化过程及部分重大事件。图片制作:南京大学 杨子潇
思考与荐书:
地球历史上发生过多次重大的生物灭绝事件,这些事件其实是发生在百万年或者万年历史中。你是否想过,在这些灭绝事件期间的某一天,地球上的生灵们在经历什么呢?大家可以参考《灭绝与演化/Extinction and Evolution: What Fossils Reveal about the History of Life》思考这件事。书作者尼尔斯·艾崔奇(Niles Eldredge)是著名的古生物学家,是生物演化“点断平衡”理论之父。在书中,他展示了超过200件精美的化石标本,记录了数十亿年的演化历程,并寻求一系列生命演化的启示:什么是生命的秩序?达尔文一生所求的关键化石为何始终缺失?每次生命大爆发之前,都有大规模物种灭绝降临,在生命的轮回中大灭绝究竟扮演了什么角色?
如果大胆设想,有一种灭绝的生物存活到了现代,它们怎么生活?吃什么样的食物?亿万年后,有什么样的生物在“定量”我们的世界?现在我们观察到的气候变化,在地质历史的长河上又会留下怎样的痕迹?
参考文献
Alroy, John, Martin Aberhan, David J Bottjer, Michael Foote, Franz T Fürsich, Peter J Harries, Austin JW Hendy, Steven M Holland, Linda C Ivany, and Wolfgang Kiessling. 2008. Phanerozoic trends in the global diversity of marine invertebrates. Science, 321, pp.97-100.
Benton, M.J., Dhouailly, D., Jiang, B. and McNamara, M., 2019. The early origin of feathers. Trends in ecology & evolution, 34(9), pp.856-869.
Bhullar, B.A.S., Marugán-Lobón, J., Racimo, F., Bever, G.S., Rowe, T.B., Norell, M.A. and Abzhanov, A., 2012. Birds have paedomorphic dinosaur skulls. Nature, 487(7406), pp.223-226.
Crampton, J. S., S. R. Meyers, R. A. Cooper, P. M. Sadler, M. Foote, and D. Harte. 2018. Pacing of Paleozoic macroevolutionary rates by Milankovitch grand cycles, Proc Natl Acad Sci U S A, 115, pp.5686-91.
Fan, J. X., S. Z. Shen, D. H. Erwin, P. M. Sadler, N. MacLeod, Q. M. Cheng, X. D. Hou, J. Yang, X. D. Wang, Y. Wang, H. Zhang, X. Chen, G. X. Li, Y. C. Zhang, Y. K. Shi, D. X. Yuan, Q. Chen, L. N. Zhang, C. Li, and Y. Y. Zhao. 2020. A high-resolution summary of Cambrian to Early Triassic marine invertebrate biodiversity, Science, 367, pp.272-77.
Kemple, William G, Peter M Sadler, and David J Strauss. 1989. A prototype constrained optimization solution to the time correlation problem. Statistical applications in the earth sciences, 89, pp.417-25.
Kubota, K., Shirai, K., Murakami-Sugihara, N., Seike, K., Hori, M. and Tanabe, K., 2017. Annual shell growth pattern of the Stimpson's hard clam Mercenaria stimpsoni as revealed by sclerochronological and oxygen stable isotope measurements. Palaeogeography, Palaeoclimatology, Palaeoecology, 465, pp.307-315.
Phillips, J., 1860. Life on the Earth: its origin and succession. Macmillan and Company.
Sadler, P. M., R. A. Cooper, and M. Melchin. 2009. High-resolution, early Paleozoic (Ordovician-Silurian) time scales. Geological Society of America Bulletin, 121, pp.887-906.
Sepkoski, J John. 1976. Species diversity in the Phanerozoic: species-area effects. Paleobiology, 2, pp.298-303.
———. 1978. A kinetic model of Phanerozoic taxonomic diversity I. Analysis of marine orders. Paleobiology, 4, pp.223-51.
———. 1979. A kinetic model of Phanerozoic taxonomic diversity II. Early Phanerozoic families and multiple equilibria. Paleobiology, 5, pp.222-51.
———, 2002. A compendium of fossil marine animal genera. Bulletins of American paleontology, 363, pp.1-560.
Valentine, James W. 1973. 'Phanerozoic Taxonomic Diversity: A Test of Alternate Models', Science, 180: 1078-79.
Veizer, J. and Prokoph, A., 2015. Temperatures and oxygen isotopic composition of Phanerozoic oceans. Earth-Science Reviews, 146, pp.92-104.
Walsh, S., McLeod, N. and O’NEIL, M., 2008. Analysis of spheniscid humerus and tarsometatarsus morphological variability using DAISY automated image recognition. Oryctos, 7, pp.129-136.
Wang, M., O’Connor, J.K., Xu, X. and Zhou, Z., 2019. A new Jurassic scansoriopterygid and the loss of membranous wings in theropod dinosaurs. Nature, 569(7755), pp.256-259.
West, Ian M. 2012. “Geology of Great Britain - Introduction; for the Geology of the South Coast.” Romsey and Faculty of Natural and Environmental Sciences, Southampton University, UK. http://www.soton.ac.uk/~imw/Geology-Britain.htm.
南京大学生物演化与环境科教融合中心张书涵、田庆羿、王盛宇、杨子潇(排名不分先后)供稿。