近日,繼10月9日宣布與全球智能產(chǎn)品ODM頭部企業(yè)龍旗科技達成深度戰(zhàn)略合作后,智元機器人再次公布一項重大技術(shù)突破:其研發(fā)的真機強化學習技術(shù),已在與龍旗科技合作的驗證產(chǎn)線中成功落地,為消費電子等精密制造領(lǐng)域帶來“即插即用”的智能升級方案。
據(jù)了解,智元此次落地的真機強化學習方案,實現(xiàn)的突破主要在于:機器人可在真實產(chǎn)線中自主學習、持續(xù)優(yōu)化作業(yè)策略,新技能訓練與穩(wěn)定部署僅需數(shù)十分鐘,且性能全程不降級。在換線、換型或流線調(diào)整時,該系統(tǒng)只需最小的硬件改動和標準化部署流程,即可顯著提升柔性、壓縮部署時間與成本,破解“產(chǎn)線剛性與產(chǎn)能波動”的行業(yè)痛點。
長期以來,精密制造產(chǎn)線面臨剛性瓶頸,傳統(tǒng)機械臂依賴復雜夾具設計與場地改造,調(diào)試周期長、換型成本高;“視覺+力控”等柔性方案雖有改進,卻存在參數(shù)敏感、部署復雜等問題,難以適配消費電子行業(yè)高頻產(chǎn)品迭代需求。
相較傳統(tǒng)方案,該真機強化學習方案具備三大核心優(yōu)勢。一是極速部署,訓練周期從“數(shù)周”銳減至“數(shù)十分鐘”,效率實現(xiàn)指數(shù)級提升;二是超高適配,自主克服來料位置偏差、尺寸公差等擾動,在長周期運行中持續(xù)保持工業(yè)級穩(wěn)定性與100%任務完成率;三是柔性換型,任務變更僅需快速再訓練,無需定制夾具或復雜工裝,即可適配不同產(chǎn)品與工序,破解消費電子行業(yè)長期存在的“產(chǎn)線剛性與產(chǎn)能波動”難題。
智元機器人表示,真機強化學習方案在占用空間、硬件依賴與環(huán)境適配方面展現(xiàn)出高度通用性,可在不同工位和產(chǎn)品線上快速遷移與復用。
機器人在十分鐘內(nèi)學會新技能,這一進步背后的技術(shù)突破如何?11月3日,智元機器人合伙人兼首席科學家羅劍嵐在接受證券時報等媒體采訪時表示,機器人實現(xiàn)十分鐘學會新技能,主要是通過預訓練模型,結(jié)合少量示范和糾錯,快速點亮策略,并在工業(yè)給定范圍內(nèi)微調(diào)參數(shù)來達成的。
“在工業(yè)產(chǎn)線上,能把技術(shù)做到50%和做到100%,是完全不同的兩件事,智元目前是首個真正將真機強化學習應用在產(chǎn)線上的廠商,這一突破點主要在于性能,在于真正能將AI模型部署在工廠中,實現(xiàn)百分之百的準確率。”羅劍嵐指出。
據(jù)羅劍嵐介紹,與傳統(tǒng)的仿真強化學習相比,真機強化學習的核心突破在于直接將學習閉環(huán)嵌入產(chǎn)線。“不需要解一個近似目標,而是直接優(yōu)化最關(guān)心的指標,把通過率、節(jié)拍、良率這些變成訓練時的第一性目標,而不是像傳統(tǒng)方法那樣去解一個近似目標。真機強化學習使用的是產(chǎn)線原生信號進行判定和獎勵,這樣就無需解決仿真與現(xiàn)實的差距問題,傳統(tǒng)強化學習大多在仿真環(huán)境中進行,而我們直接在真實產(chǎn)線中解決這個問題。”
從落地場景來看,智元真機強化學習方案在龍旗科技產(chǎn)線中落地,主要用于上下料這類傳統(tǒng)自動化難以完成、需要柔性換線的任務。上下料指的是在工廠中將料品在不同工序間轉(zhuǎn)移、放置的過程,羅劍嵐指出,目前整個工業(yè)中未被自動化或難以自動化的環(huán)節(jié),約80%都集中在上下料,這類任務的主要難點在于工序間的不確定性、有限范圍內(nèi)的變化,以及對精度的要求。
“龍旗內(nèi)部有很多工序,我們之所以選擇上下料這個工序作為起點,是因為它具有代表性,許多工序抽象出來都有共性。比如我們在龍旗科技FCT測試站上看到的iPad放置工序,就是一個要求非常精密、輕柔、穩(wěn)妥,不能有任何損壞的高精度工序。”羅劍嵐進一步解釋稱。
羅劍嵐強調(diào),真機強化學習方案在產(chǎn)線工序上落地,相當于在工序上不斷鍛煉機器和大腦。每個工序、產(chǎn)線或機臺都存在微小差異,比如料盤放置等都有隨機性,但其也有共性,智元的做法是最大限度地將共性部分提取和共享,對差異化部分則通過真機強化學習進行優(yōu)化,最終達到工廠要求的百分百成功率、接近人的節(jié)拍數(shù),以及極致的魯棒性(指系統(tǒng)在面對不確定性、變化和干擾時,能夠維持其性能和穩(wěn)定性的能力)。
此次智元機器人真機強化學習落地工業(yè)產(chǎn)線,或為具身智能工業(yè)化開啟新紀元。智元機器人表示,智元與龍旗科技雙方將基于本次成果持續(xù)推進技術(shù)迭代,推動真機強化學習在消費電子、汽車電子等更多精密制造場景的應用與復制,加速構(gòu)建具身智能驅(qū)動的 AI 制造生態(tài),助力工業(yè)智能化的普及化與標準化進程。