<menu id="fucde"><blockquote id="fucde"></blockquote></menu>
  • <pre id="fucde"><ruby id="fucde"></ruby></pre>
    <acronym id="fucde"><label id="fucde"><menu id="fucde"></menu></label></acronym>
    <pre id="fucde"><del id="fucde"><xmp id="fucde"></xmp></del></pre>
  • <p id="fucde"></p>

    <table id="fucde"></table>

    首頁>新聞中心>智能制造

    “構建材料人工智能需摒棄‘萬能大模型’幻想”
    ——中國鋼研首席科學家談如何構建“AI友好數據集”

    2025-05-27 07:45:00

      本報記者 樊三彩
      自大模型爆火以來,國內外相繼發布了多項材料大模型:2023年11月,谷歌發布材料AI(人工智能)模型 GNoME;2023年12月,微軟發布了材料AI生成模型 MatterGen;2024年6月,清華大學團隊發展出DeepH通用材料模型,并展示了一種構建材料大模型的可行方案;2025年2月份,松山湖實驗室發布MatChat材料大語言模型;2025年3月份,北京鋼研新材發布“AI新材道”智能選材大模型。
      “這些工作引領著未來,但也帶來了爭議?!苯?,中國鋼研科技集團數字化研發中心首席科學家蘇航在接受《中國冶金報》記者采訪時發出4連問:我們如何信任和驗證黑盒模型給出的結果?我們需要通過模擬數據進行模型訓練嗎?機器學習能否引領實現原始創新?帶有幻覺的模型適合科學研究嗎?“這些問題將深刻影響未來10年材料人工智能的發展方向?!碧K航認為。
      “早在上世紀80年代,中國科學院就有一個材料模式識別學派,將機器學習應用于新材料發現,后來一度中斷的主要原因就在于很難獲取高質量的數據集?!碧K航認為,今天我們要發展有價值的AI材料模型,首先需要構建起“AI友好的數據集”。
      廣義而言,AI for Science(科學人工智能)起源于大科學項目。大型望遠鏡、衛星、基因測序儀、同步加速器、中子源和電子顯微鏡,每年生成PB(十萬兆字節)級乃至EB (百萬兆字節)級的數據量,從中提取有價值的信息對科學家而言是艱巨的挑戰,因而機器學習成為必然選擇。當前,AI for Science的成功主要在自然科學領域,而非技術科學領域。
      “相比傳統機器學習回歸模型,大模型有兩個必要的特征,一是參數量足夠大,二是具備泛化(外推)能力。它們對高質量數據的要求包含4個方面?!碧K航進一步闡釋道,一是同源性。數據來源統一,消除未知因素的干擾,但文獻數據不滿足同源性。二是分散性??臻g上樣本盡可能分散,“好”“壞”數據兼備,但工業生產數據不滿足分散性。三是可信性。數據的來源、去向、產權、責任清晰,匿名網絡數據、強制征集數據的可信性不高。四是完備性(特別針對大模型)。數據覆蓋特征空間大部分可能的模式、形成閉環,目前材料領域僅計算數據相對完備。
      “數據閉環是AI生成的前提。國際上現有成功的科技大模型的共同特征是:具備大科學項目研究背景,具備完備閉環、開源的數據集積累?!碧K航補充道,目前在世界范圍內,還不具備建立通用材料大模型的數據基礎,但越小的領域內越有可能出現突破性的AI應用,前提是數據集相對完備。
      “要在細分領域獲得與專業人士相當的預測能力,需要達到一定的基礎數據量,即我們稱之為Scaling Law的數據下界;同時,數據采樣應盡可能遍歷所有特征模式。如鋼鐵金相圖譜的可能特征模式在20種左右,達成閉環的數據量僅需要數百張覆蓋所有特征的照片,而不是數萬張。這意味著在細分領域建立具備無限泛化能力的材料AI,并不一定都需要大規模的數據集?!碧K航舉例道。
      “在材料為代表的工程科學領域,須適應AI對大數據的需求,改變傳統上以驗證為主的科研模式,建立AI友好的矩陣化數據生產新模式,才能讓AI加速技術發現與發明?!碧K航介紹,中國鋼研正在實踐“計算數據+實驗數據+應用數據”的矩陣化數據生產新模式,取得顯著成果。
      中國鋼研新材道團隊開發了區塊鏈材料數據發現與共享協議,配合材料模式識別、隱私計算,讓數據可用但不可見。2023年,中國鋼研發布全球首個“材料數據區塊鏈 通則”,建立了包括鋼鐵、裝備制造、裝備用戶在內的10多個企業私有云,50個鋼鐵企業輕節點;已覆蓋6000多個國家、團體、企業的產品標準,20多萬種鋼鐵、高溫合金、焊材、鋁合金的材料產品。
      “在我看來,當前形勢下,構建材料人工智能(AI for Material)需摒棄‘萬能大模型’幻想,重點關注3個方向的技術工作?!碧K航表示。
      一是細分領域完備數據集建設和專業模型的開發,如材料產品數據集,金屬多元相圖,金相組織,基于自動生成數據集的試驗、計算模型等,基于材料區塊鏈的多節點數據協同可加速完備數據集的形成。
      二是大語言模型智能體(AI Agent)的創新應用?;谕ㄓ么笳Z言模型,建立AI輔助計算、建模、設計智能體群,并實現多智能體協同。
      三是以場景創新驅動方法論創新?!靶沦惖罒o常路,無需跟隨。AI領域,美國的優勢在技術,中國的優勢在場景,但場景創新可以反過來驅動AI技術進步,DeepSeek(深度求索)就是范例?!彼f。
      《中國冶金報》(2025年05月27日 04版四版)

      

    來源:中國冶金報-中國鋼鐵新聞網

    編輯:宋玉錚

    版權說明

    【1】 凡本網注明"來源:中國冶金報—中國鋼鐵新聞網"的所有作品,版權均屬于中國鋼鐵新聞網。媒體轉載、摘編本網所刊 作品時,需經書面授權。轉載時需注明來源于《中國冶金報—中國鋼鐵新聞網》及作者姓名。違反上述聲明者,本網將追究其相關法律責任。
    【2】 凡本網注明"來源:XXX(非中國鋼鐵新聞網)"的作品,均轉載自其它媒體,轉載目的在于傳遞更多信息,并不代表本網 贊同其觀點,不構成投資建議。
    【3】 如果您對新聞發表評論,請遵守國家相關法律、法規,尊重網上道德,并承擔一切因您的行為而直接或間接引起的法律 責任。
    【4】 如因作品內容、版權和其它問題需要同本網聯系的。電話:010—010-64411649
    品牌聯盟
    • 燃燒裝置2.gif
    • 湖南華菱集團.jpg
    • 山東鋼鐵集團.jpg
    • 1_看圖王.png
    • 微信圖片_20240117152632.jpg
    • W020190430461031429831.jpg
    • 首鋼.jpg
    • 冶金工業規劃研究院logo1.jpg
    • W020130618825601874406.jpg
    • W020130618825602778336.jpg
    • W020130618825603702632.jpg
    • W020130618825617201098.jpg
    • W020130618825606679805.jpg
    • W020130618825607505186.jpg
    • brand04.png
    • brand06.png
    • brand05.png
    • brand03.png
    • brand02.png
      read_image.gif

      地址:北京市朝陽區安貞里三區26樓 郵編:100029 電話:(010)64442120/(010)64442123 傳真:(010)64411645 電子郵箱:csteelnews@126.com

      中國冶金報/中國鋼鐵新聞網法律顧問:大成律師事務所 楊貴生律師 電話:010-58137252 13501065895 Email:guisheng.yang@dentons.cn

      中國鋼鐵新聞網版權所有,未經書面授權禁止使用 京ICP備07016269號 京公網安備11010502033228

      国产V综合V亚洲欧美久久|国产叼嘿免费久久精品一区二区|中文字幕在线不卡精品视频99|久久久久精品免
      <menu id="fucde"><blockquote id="fucde"></blockquote></menu>
    • <pre id="fucde"><ruby id="fucde"></ruby></pre>
      <acronym id="fucde"><label id="fucde"><menu id="fucde"></menu></label></acronym>
      <pre id="fucde"><del id="fucde"><xmp id="fucde"></xmp></del></pre>
    • <p id="fucde"></p>

      <table id="fucde"></table>