一组研究人员利用人工智能发现了一种可能具有有利价值的热电材料。该小组能够克服人工智能的传统陷阱,为人工智能如何彻底改变材料科学提供了一个很好的例子。
他们的发现详情发表在2024 年 3 月 8 日的《科学中国材料》杂志上。
“寻找合适材料的传统方法需要反复试验,这既耗时又昂贵,”东北大学高级材料研究所 (WPI-AIMR) 副教授、该论文的通讯作者李浩表示。 “人工智能通过梳理数据库来识别潜在的材料,然后可以通过实验验证来改变这一点。”
尽管如此,挑战仍然存在。大料数据集有时包含错误,过度拟合预测的温度相关属性也是常见错误。当模型学会捕获训练数据中的噪声或随机波动而不是潜在的模式或关系时,就会发生过度拟合。因此,该模型在训练数据上表现良好,但无法泛化新的、未见过的数据。在预测与温度相关的属性时,当模型遇到训练数据范围之外的新条件时,过度拟合可能会导致预测不准确。
李和他的同事试图克服这个问题,开发出一种热电材料。这些材料将热能转化为电能,反之亦然。因此,获得高度准确的温度依赖性至关重要。
“首先,我们采取了一系列理性行动来识别和丢弃有问题的数据,从 Starrydata2 数据库(一个从已发表论文中收集数字数据的在线数据库)中获取了 92,291 个数据点,其中包括 7,295 种成分和不同的温度,”Li 说道。
随后,研究人员实施了一种基于组合的交叉验证方法。至关重要的是,他们强调具有相同成分但不同温度的数据点不应分成不同的组,以避免过度拟合。
然后研究人员使用梯度提升决策树方法构建了机器构建模型。该模型在 2023 年发布的训练数据集、测试数据集和新的样本外实验数据上实现了显着的 R2 值 0.89、~0.90 和~0.89,证明了模型在预测新可用材料方面的准确性。
WPI-AIMR 助理教授薛佳表示:“我们可以利用这个模型对材料项目数据库中的稳定材料进行大规模评估,预测新材料潜在的热电性能并为实验提供指导。”和论文的共同作者。
最终,该研究说明了在机器学习中的数据预处理和数据分割方面遵循严格指南的重要性,以便解决材料科学中的紧迫问题。研究人员乐观地认为,他们的策略也可以应用于其他材料,例如电催化剂和电池。
关于世界一流国际研究中心计划 (WPI)
WPI 计划由日本文部科学省 (MEXT) 于 2007 年启动,旨在培育具有最高标准和卓越研究环境的全球知名研究中心。这些中心数量有十多个,分布在全国各地,具有高度的自主权,可以创新管理和研究模式。该计划由日本学术振兴会(JSPS)管理。