OpenAI發佈首批開放權重語言模型gpt-oss-120b和gpt-oss-20b

OpenAI於週二發佈了自2019年推出GPT-2以來的首批開放權重語言模型,分別爲gpt-oss-120b和gpt-oss-20b。這些模型旨在爲開發者、研究人員和企業提供更易運行和定製的低成本選項。

開放權重模型指的是當人工智能模型的參數公開可用時,該模型即被視爲開放權重。此類模型雖能提供透明度和控制權,但不同於開源模型——後者允許用戶完全獲取並修改源代碼。

近年來,包括Meta、微軟支持的Mistral AI以及中國初創企業DeepSeek等公司也相繼發佈了開放權重模型。

OpenAI總裁格雷格·布羅克曼表示:“見證這個生態系統的成長令人振奮,我們很榮幸能參與其中並推動技術邊界,進而觀察其發展軌跡。”該公司與英偉達、超威半導體、Cerebras及Groq合作,確保模型能在多種芯片上穩定運行。

英偉達CEO黃仁勳評價道:“OpenAI向世界展示了基于英偉達AI技術的可能性,如今他們正在開源軟件領域推動創新。”

此次發佈備受期待,部分原因是公司曾多次推遲上線。OpenAI CEO薩姆·奧爾特曼七月在X平臺發文稱需要更多時間"進行額外安全測試並審查高風險領域",此前六月他也明確表示模型不會當月發佈。

OpenAI週二聲明已對開放權重模型實施全面安全訓練與測試。在預訓練階段清除了有害的化學、生物、放射性與核武器相關數據,並模擬了惡意行爲者可能進行的模型微調。

測試結果 經惡意調優的模型無法達到其"準備框架"設定的高能力閾值——這是該公司衡量和防範危害的評估體系。

OpenAI還透露已邀請三個獨立專家團隊對惡意微調評估提供反饋。

用戶可通過Hugging Face和GitHub等平臺依據Apache 2.0許可證下載模型權重,並藉助LM Studio、Ollama等程序在個人電腦運行。亞馬遜雲、Baseten和微軟雲也將提供模型服務。

這兩款模型均具備高級推理、工具調用和思維鏈處理能力,適配從消費級硬件到雲端乃至終端設備的各種環境。例如gpt-oss-20b可在筆記本電腦運行,作爲能檢索文件和輔助寫作的個人助手。

奧爾特曼在週二的聲明中表示:“我們很榮幸將這項耗資數十億美元的研究成果開放給全世界,讓儘可能多的人掌握AI技術。”