阿聯酋MBZUAI與G42合作推出低成本推理模型K2 Think

阿聯酋穆罕默德·本·扎耶德人工智能大學(MBZUAI)與G42合作,於9月9日宣佈推出一款名爲“K2 Think”的低成本推理模型。該模型僅使用320億個參數,卻能超越其他公司規模大20倍的推理模型。K2 Think基於阿里巴巴开源的Qwen 2.5模型構建,並在Cerebras提供的硬件上運行和測試。

MBZUAI基礎模型研究所所長Hector Liu表示,團隊通過多種方法實現了高性能表現,包括長鏈式思維監督微調(CoT)和推理階段擴展(test-time scaling)。Liu強調,他們將模型視爲一個系統,而不僅僅是一個模型,會實際部署並觀察如何隨着時間的推移改進模型。

技術成就與地緣政治意義

新聞稿指出,“K2 Think不僅僅是一項技術成就,更是阿聯酋人工智能領域的一個決定性時刻。”近年來,阿聯酋試圖將自己定位爲AI全球領導者,以提升地緣政治影響力,並減少對原油的依賴。

阿聯酋的AI企業G42是其突圍的例子,但面臨鄰國沙特的競爭,後者通過主權基金成立Humain,致力於打造全棧AI能力。儘管K2 Think的表現可與OpenAI相媲美,開發者強調,他們的目標並不是打造另一個ChatGPT,而是爲數學、科學等特定應用領域而設計。

應用前景與資源效率

MBZUAI基礎模型研究所總經理Richard Morton解釋說,這個模型是爲數學、科學等特定應用領域而設計,能夠大大縮短原本需要1000到2000人耗費五年時間才能完成的問題思考或臨牀實驗的週期。此外,它還能讓缺乏美國那樣資本與基礎設施的地區,也能使用先進AI技術。Morton總結道:“我們正在發現,用更少的資源,其實可以做到更多。”

本文轉載自“財聯社”,FOREXBNB編輯:劉家殷。