足球比分回查|球探比分足球即时比分新版体|欧赔官网|足球500比分实时,竞彩网,足球足球真时比分比分,竞彩足球赛果网

每日經(jīng)濟新聞
首發(fā)快訊

每經(jīng)網(wǎng)首頁 > 首發(fā)快訊 > 正文

騰訊混元AI Infra核心技術(shù)開源:推理吞吐提升30%

每日經(jīng)濟新聞 2026-02-04 18:49:11

每經(jīng)AI快訊,2月4日,騰訊混元AI Infra團隊正式推出開源生產(chǎn)級高性能LLM推理核心算子庫 HPC-Ops。在真實場景下,基于HPC-Ops,混元模型推理 QPM 提升30%,DeepSeek模型 QPM 提升17%。同時,在單算子性能方面,HPC-Ops實現(xiàn)Attention相比 FlashInfer/FlashAttention 最高提升2.22倍;GroupGEMM 相比 DeepGEMM 最高提升1.88倍;FusedMoE 相比 TensorRT-LLM 最高提升1.49倍。

如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴禁轉(zhuǎn)載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

歡迎關(guān)注每日經(jīng)濟新聞APP

每經(jīng)經(jīng)濟新聞官方APP

0

0