黃利飛 湖南日報·新湖南客戶端 2025-04-22 22:06:38
湖南日報4月22日訊(通訊員 許可亮)日前,科大訊飛深度推理大模型——訊飛星火X1全新升級。作為業(yè)界唯一基于全國產(chǎn)算力訓(xùn)練的深度推理大模型,升級后的星火X1在數(shù)學(xué)、代碼、邏輯推理、文本生成、語言理解、知識問答等通用任務(wù)上效果提升。
面向企業(yè)和廣大開發(fā)者,訊飛星火X1首發(fā)“快思考、慢思考統(tǒng)一模型”,升級模型定制優(yōu)化工具鏈,進(jìn)一步降低企業(yè)大模型私有化部署和定制門檻。同時,增強(qiáng)面向行業(yè)的解決方案能力,助力教育、醫(yī)療、司法等產(chǎn)業(yè)智能化轉(zhuǎn)型。
例如,在數(shù)學(xué)答題和復(fù)雜的數(shù)理邏輯推理方面,星火X1能夠準(zhǔn)確識別出復(fù)雜的數(shù)學(xué)公式,不僅給出完整的解題思路,輸出結(jié)果也嚴(yán)謹(jǐn)清晰;在邏輯推理時全方位思考,思考可能出現(xiàn)的每一種假設(shè),表現(xiàn)出更強(qiáng)嚴(yán)謹(jǐn)性和準(zhǔn)確性;代碼能力上,星火X1不僅提高了代碼生成的準(zhǔn)確率,生成代碼邏輯理解也進(jìn)一步提升;語言理解方面,模型輸出內(nèi)容、格式更符合用戶指令要求。
科大訊飛相關(guān)負(fù)責(zé)人介紹,此次升級背后,是一系列技術(shù)創(chuàng)新與理念突破。比如,團(tuán)隊提出基于問題難度的大規(guī)模多階段強(qiáng)化學(xué)習(xí)方法,采取統(tǒng)一模型下的快慢思考混合訓(xùn)練方法,實現(xiàn)多項工程技術(shù)創(chuàng)新,實現(xiàn)國產(chǎn)算力平臺上高效和穩(wěn)定的強(qiáng)化學(xué)習(xí)訓(xùn)練全流程。
責(zé)編:劉樂
一審:劉樂
二審:張尚武
三審:李偉鋒
來源:湖南日報·新湖南客戶端
我要問