算力的競(jìng)爭(zhēng):從暴力計(jì)算到效率覺(jué)醒

打開文本圖片集
算法、算力、數(shù)據(jù)是AI發(fā)展的三駕馬車。當(dāng)開源的算法和公開的數(shù)據(jù)都不再神秘時(shí),算力的擴(kuò)張就成為AI競(jìng)爭(zhēng)的必由之路。
當(dāng)ChatGPT掀起全球AI競(jìng)賽時(shí),硅谷巨頭們?cè)鴶嘌浴八懔礄?quán)力”,認(rèn)為千億參數(shù)模型必須依賴海量GPU的堆砌,大模型的訓(xùn)練動(dòng)輒就萬(wàn)卡集群,英偉達(dá)的H100芯片被炒至4.5萬(wàn)美元的天價(jià)。然而,DeepSeek以行業(yè)十分之一的訓(xùn)練成本打造的MoE模型,卻在多個(gè)基準(zhǔn)測(cè)試中超越眾多主流AI模型。(剩余1180字)