2026-03-16 23:35:31
每經(jīng)北京3月16日電(記者 李宇彤)3月16日,月之暗面Kimi發(fā)布技術報告,對大模型的核心結構殘差連接行重新設計,使每一層能夠選擇性地關注此前各層輸出,而非統(tǒng)一求和,48B模型訓練效率提升1.25倍。該報告的發(fā)布被行業(yè)解讀為提前預告了下一代模型的關鍵模塊。
《每日經(jīng)濟新聞》記者注意到,報告結尾處顯示,月之暗面三位聯(lián)合創(chuàng)始人楊植麟、吳育昕、周昕宇帶領數(shù)十名研究員完成了這項研究。報告發(fā)布后,馬斯克評價Kimi的研究令人印象深刻(Impressive work from Kimi),OpenAI的“推理模型之父”、前OpenAI研究副總裁Jerry Tworek則表示“深度學習2.0要來了”。
如需轉載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關注每日經(jīng)濟新聞APP