首页 > 生活 > > 正文
2024-07-30 14:46:58

科学家开发一种新的计算机语言来模拟生物体特征

导读 大自然最美丽的一面是生物体展现出无穷无尽的形状、颜色和行为。这些特征有助于生物体生存和寻找配偶,例如雄孔雀的彩色尾巴如何吸引雌孔雀...

大自然最美丽的一面是生物体展现出无穷无尽的形状、颜色和行为。这些特征有助于生物体生存和寻找配偶,例如雄孔雀的彩色尾巴如何吸引雌孔雀,或者它的翅膀如何帮助它飞离危险。了解特征对于生物学家来说至关重要,他们研究这些特征是为了了解生物体如何进化并适应不同的环境。

要做到这一点,科学家首先需要用语言描述这些特征,比如说孔雀的尾巴“充满活力、色彩绚丽、华丽”。这种方法适用于小型研究,但当观察数百甚至数百万种不同的动物或植物时,人类大脑不可能记住所有的东西。

计算机可以提供帮助,但即使是最新的人工智能技术也无法让生物学家掌握人类语言。这极大地阻碍了研究,因为尽管科学家可以处理大量 DNA 数据,但将这些信息与身体特征联系起来仍然非常困难。

为了解决这个问题,芬兰自然历史博物馆的研究人员Giulio Montanaro 和 Sergei Tarasov 与同事们一起创建了一种名为 Phenoscript 的特殊语言。这种语言旨在以人类和计算机都能理解的方式描述特征。使用 Phenoscript 描述特征就像为生物体的外观编写计算机代码一样。

Phenoscript 使用一种叫做语义的技术,它可以帮助计算机理解单词背后的含义,就像现代搜索引擎根据搜索内容知道水果“苹果”和科技公司“Apple”之间的区别一样。

“这种语言仍在测试中,但前景广阔。随着越来越多的科学家开始使用 Phenoscript,它将通过提供大量特征数据用于大规模研究,从而彻底改变生物学,推动新兴的表型组学领域,”Montanaro 解释道。

在他们最近发表在开放获取、同行评审的《生物多样性数据期刊》上的研究论文中,研究人员首次使用这种新语言,为 Grebennikovius 属的四种蜣螂创建了语义表型。然后,为了展示语义方法的强大功能,他们对生成的表型描述应用了简单的语义查询。

最后,该团队进一步展望了科学家处理物种信息的方式的现代化。他们的下一个目标是将语义物种描述与纳米出版物的概念相结合,“将离散的信息片段封装成一个综合的知识图谱”。因此,可以直接查询已成为该图谱一部分的数据,从而确保它通过各种语义资源保持可查找、可访问、可互操作和可重用 (FAIR)。