随着大语言模型的巨大成功,“材料大模型”的概念吸引了极大的研究兴趣。然而,由于材料中结构-物性关系的复杂性,建立材料大模型的任务极具挑战。
由清华大学徐勇教授、段文晖教授领导的研究团队致力于通过深度学习密度泛函理论哈密顿量(DeepH)方法构建材料大模型。密度泛函理论(DFT)是计算物理与材料科学的主流方法,在材料计算设计中发挥了重要作用。DFT哈密顿量是DFT计算的基本物理量,所有其他DFT物理量(包括总能量、电荷密度、能带结构、响应性质等)均能由其直接导出(图1)。
在过去的工作中,DeepH方法被广泛应用于构建专用材料模型,而其尚未被应用于构建覆盖元素周期表的通用材料模型。DeepH方法利用物理先验知识提升它的模型性能,重要的物理先验包括基本物理规律的协变性、以及“量子近视性原理”。根据“量子近视性原理”,局域物理量,如DFT哈密顿量,可被附近的化学环境所确定,而并不依赖于整个材料结构。这一性质保证了DeepH方法具有良好的泛化能力(图1)。相比于专用材料模型,构建通用材料模型对DeepH方法的鲁棒性与泛化能力提出了更大的挑战。
研究团队首先建立了一个大型DFT材料数据库,其中包括超过10,000种材料结构的计算数据。基于此材料数据库与改进的DeepH方法(DeepH-2),研究人员构建了一个DeepH通用材料模型,可处理多样化元素组成与原子结构的复杂材料体系,并在材料性质预测方面达到了出色的精度(图2)。该通用材料模型可准确预测复杂测试材料的多种物性,验证了模型出色的通用性能(图3)。
该工作不仅展示了DeepH通用材料模型的概念,还为构建材料大模型奠定了基础,为推动人工智能驱动的材料发现提供了新机遇。
研究详情请见原文:
Universal materials model of deep-learning density functional theory Hamiltonian
https://doi.org/10.1016/j.scib.2024.06.011
Journal
Science Bulletin