近二十年來,機器學習方法的發(fā)展為我們的生活帶來許多便利。智能網絡搜索、語
音識別,乃至無人超市、無人駕駛汽車等,依托于機器學習方法的新事物正迅速地在生
活中普及。Alpha Go的橫空出世更讓世界驚嘆于人工智能的潛在價值。在科研領域,
大數據的理念正在改變著科研人員對未知世界的探索方式。美國在2011年提出了材料基
因組計劃(Materials Genome Initiative),以期加快材料的研發(fā)過程。我國懷柔科學
城的發(fā)展規(guī)劃中,“材料基因組研究平臺”項目已全面開工建設。高通量實驗+高性能
計算+深度數據分析的研究方式已經成為時代發(fā)展的趨勢。
在非晶合金研究領域,如何設計并開發(fā)處具有良好玻璃形成能力的合金,是一個具
有重要產業(yè)價值的科學問題。過去非晶合金材料新體系的探索主要依據經驗性判據的指
導,由于其準確性與通用性的限制,非晶新材料的研發(fā)速度非常緩慢。 如何提高材料
設計的效率,尋找具有更優(yōu)性能的材料,是非晶材料領域非常具有挑戰(zhàn)性的問題。
最近,中國科學院物理研究所/北京凝聚態(tài)物理國家實驗室(籌)汪衛(wèi)華研究組
(EX4組)博士研究生孫奕韜在汪衛(wèi)華研究員、白海洋研究員及人民大學物理系李茂
教授的指導下,使用機器學習的方法,對二元合金的玻璃形成能力進行了系統(tǒng)分析,
建立了合金成分與性能之間的關聯,并對可能的新材料進行了預測。研究過程中使用
了支持向量機(Support Vector Machine)這種方法(圖1),通過構建多維空間,
并在這個多維空間內對數據進行分割,從而建立輸入參量與輸出參量之間的關聯。該
研究方法可通過不斷選擇新的參數對模型進行重復訓練,探討了合金的不同性質對其
玻璃形成能力的影響(圖2)。
研究發(fā)現,參量?Tliq(表征合金過冷能力的參量)與合金的玻璃形成能力有最為
顯著的關聯,而且使用參量?Tliq與Tfic(表征合金熱穩(wěn)定性)作為輸入參數,可以得到
具有最佳預測效率的模型。通過對最佳模型的分析,發(fā)現已知的具有良好玻璃形成能
力的二元合金,其分布與模型的預測值具有很好的一致性(圖3)。使用這個模型,可
以對未知的合金成分進行預測,這樣由深度數據分析指導設計的實驗,可以極大地縮
短非晶合金材料的研發(fā)周期(圖4)。該工作作為使用新的工具對經典問題進行分析的
一種嘗試,得到了初步成果。這表明,機器學習的方法在非晶材料設計與研發(fā)領域具
有重要的應用前景。采用更全面、完善的數據庫,運用更深入的人工智能算法,機器
學習方法能夠為非晶等領域科研人員提供更精準的信息,進一步加速材料的研發(fā)過程。
這項研究結果最近發(fā)表在J. Phys. Chem. Lett.(IF=9.35) 8, 3434(2017)上。
該項研究工作得到國家自然科學基金項目(51571209,51461165101)、科技部973
項目(2015CB856800)和中科院前沿科學關鍵研究項目(QYZDY-SSW-JSC017)的
支持。
圖1. 支持向量機方法的基本過程,包括四個主要部分:數據庫的建立,模型的訓練,模型的評估,以及最
優(yōu)模型的預測
圖2. 不同的輸入參數得到的模型的預測結果
圖3. 最優(yōu)模型的預測結果。已發(fā)現的優(yōu)秀材料與模型預測(紅色區(qū)域)有很好的一致性
圖4. 最優(yōu)模型預測得到最佳玻璃形成能力的合金體系的成分云圖