阿联酋MBZUAI与G42合作推出低成本推理模型K2 Think

阿联酋穆罕默德·本·扎耶德人工智能大学(MBZUAI)与G42合作,于9月9日宣布推出一款名为“K2 Think”的低成本推理模型。该模型仅使用320亿个参数,却能超越其他公司规模大20倍的推理模型。K2 Think基于阿里巴巴开源的Qwen 2.5模型构建,并在Cerebras提供的硬件上运行和测试。

MBZUAI基础模型研究所所长Hector Liu表示,团队通过多种方法实现了高性能表现,包括长链式思维监督微调(CoT)和推理阶段扩展(test-time scaling)。Liu强调,他们将模型视为一个系统,而不仅仅是一个模型,会实际部署并观察如何随着时间的推移改进模型。

技术成就与地缘政治意义

新闻稿指出,“K2 Think不仅仅是一项技术成就,更是阿联酋人工智能领域的一个决定性时刻。”近年来,阿联酋试图将自己定位为AI全球领导者,以提升地缘政治影响力,并减少对原油的依赖。

阿联酋的AI企业G42是其突围的例子,但面临邻国沙特的竞争,后者通过主权基金成立Humain,致力于打造全栈AI能力。尽管K2 Think的表现可与OpenAI相媲美,开发者强调,他们的目标并不是打造另一个ChatGPT,而是为数学、科学等特定应用领域而设计。

应用前景与资源效率

MBZUAI基础模型研究所总经理Richard Morton解释说,这个模型是为数学、科学等特定应用领域而设计,能够大大缩短原本需要1000到2000人耗费五年时间才能完成的问题思考或临床实验的周期。此外,它还能让缺乏美国那样资本与基础设施的地区,也能使用先进AI技术。Morton总结道:“我们正在发现,用更少的资源,其实可以做到更多。”

本文转载自“财联社”,FOREXBNB编辑:刘家殷。