21世紀經濟報道記者孔海麗 北京報道
OpenAI最新推理模型o3-mini緊急上線。
這是OpenAI目前成本效益最高的推理模型。與以往不同的是,OpenAI向所有用戶開放了o3-mini在ChatGPT和API中的使用權限。
很難否認OpenAI此舉沒有受到DeepSeek的壓力。
無論是編程能力還是知識水平,o3-mini都全面超越了前代推理模型。比如,在2024年美國數學邀請賽(AIME 2024)的測試中,在低努力下,o3-mini準確率(60%)與o1-mini差不多,但速率更快;而在中等努力水平下,o3-mini準確率能夠提升到79.6%,與o1模型相當;在最高努力水平時,o3-mini的準確率則能進一步提升至87.3%。
它不僅公開了推理過程(思考過程),還大幅下降了價格。o3-mini輸入每百萬tokens定價1.10美元(使用緩存輸入,費用減半),輸出每百萬tokens定價4.40美元。這比o1-mini低63%,比完整版o1低93%。
OpenAI可謂下了血本,不得不加入DeepSeek發動的價格戰,但即便如此,與DeepSeek R1相比,價格還是太高了。后者的定價是:輸入每百萬tokens/0.14美元,輸出每百萬tokens/0.55美元。
也難怪DeepSeek繼續占據各大應用商店下載榜頭名位置。最近,連一些國際頂尖大學的研究員都首選DeepSeek了。
當天o3-mini發布會后,OpenAI首席執行官薩姆·奧特曼(Sam Altman)攜眾高管,在社交平臺Reddit回答了網友們的提問。
奧特曼在回答是否會公開一些大模型權重的問題時說,“我個人認為在(開閉源)這個問題上我們站在了歷史的錯誤一方,需要找出一個不同的開源策略。不過不是所有OpenAI的人都同意這個觀點,而且目前這也不是我們最高優先級。”
OpenAI剛創立時,如其公司名稱所示,它的研究應該是開放的。但隨著商業化進程逐漸深入,這家公司卻選擇了閉源。這也是馬斯克與奧特曼分道揚鑣并一直詬病OpenAI的重要原因。
“正確的解讀是:‘開源模型正在超越專有模型’。”Meta首席AI科學家楊立昆(Yann LeCun)最近表示,“他們(DeepSeek)提出了新想法,并在其他人的工作基礎上進行了構建。由于他們的工作是公開且開源的,因此每個人都可以從中受益,這就是開放研究和開源的力量。”
2024年,關于大模型是開源好還是閉源好,國內外科技界曾經有過激烈的爭論。如今,開源的DeepSeek,引領了全球AI的重要研究方向,幾乎宣告終結了這個話題。
而在創新、安全與商業化之間謹慎行走的OpenAI,也不得不重新考慮它的閉源策略。
在回答網民有關DeepSeek對OpenAI未來模型發展計劃有何影響時,奧特曼坦陳,DeepSeek R1是“非常好的模型”。雖然OpenAI未來仍將開發出更好的模型,但其領先優勢將比往年有所減少。
接著,奧特曼透露了幾項產品的進展:完整版o3最快將于幾周內發布,最晚則是幾個月內發布。語音模式更新即將到來,但大家關注的大模型GPT-5目前還沒有時間表。首席產品官Kevin Weil稱,將推出基于4o的圖像生成器。工程副總裁Srinivas Narayanan稱,公司推理模型未來將能夠使用包括檢索在內的不同工具。
OpenAI大幅降低新模型價格,反思閉源策略并可能選擇部分開源,這些都是DeepSeek壓力之下的動作。而DeepSeek在人工智能領域引發的振動效應還在擴散。
微軟、英偉達、亞馬遜等巨頭此前已宣布上線搭載了DeepSeek-R1的軟件服務。2月1日晚間,華為云宣布,與硅基流動聯合首發并上線基于華為云昇騰云服務的DeepSeek R1/V3推理服務。
但振奮之余,有業內專家告訴本報記者,要澄清一個誤讀,就是認為DeepSeek繞開了英偉達的CUDA,從而降低了對后者芯片的依賴。他表示,DeepSeek通過架構革新、工程優化和訓練創新,低成本高質量地實現了模型性能的高效躍升,但它的框架本質上還是基于英偉達的CUDA。“DeepSeek現象”引領了大模型訓練和推理的一種技術方向,大幅降低了C端應用成本,促進了AI Ag-e-nt應用的爆發,某種程度上還重構了全球AI敘事,但生態的繁榮不是減少而是增加了算力需求。資本市場的情緒波動是暫時的,可見的將來算力方面仍無法擺脫對GPU芯片的依賴。所以,英偉達的聲明才會說,DeepSeek所取得的進展,顯示出其芯片在中國市場的實用價值,且未來為滿足DeepSeek的服務需求,將需要更多英偉達芯片。
任何具有重大革新意義的新事物的出現,不可能沒有爭議。但正如知名播客主持人萊克斯·弗里德曼(Lex Fridman)所說,盡管更好的模型還會繼續出現,但“DeepSeek 時刻”是真實存在的,“我認為 5年后它仍將作為科技史上的關鍵事件被人們銘記。”