
OpenAI 宣布推出具備推理能力的人工智能模型 o1,內(nèi)部代號(hào)為“草莓”。OpenAI o1 可以推理復(fù)雜的任務(wù),并解決比之前科學(xué)、編碼和數(shù)學(xué)模型更難的問(wèn)題。 在測(cè)試中,OpenAI o1 在物理、化學(xué)和生物學(xué)等具有挑戰(zhàn)性的基準(zhǔn)任務(wù)上的表現(xiàn)與博士生類似,其在數(shù)學(xué)和編碼方面表現(xiàn)出色。在國(guó)際數(shù)學(xué)奧林匹克(IMO)資格考試中,GPT-4o 只正確解決了 13%的問(wèn)題,而推理模型的得分為 83%,OpenAI o1 的編碼能力在 Codeforces 競(jìng)賽中達(dá)到了第 89 個(gè)百分點(diǎn)。 作為早期模型 OpenAI o1 尚不具備 ChatGPT 的許多有用功能,例如瀏覽網(wǎng)頁(yè)以獲取信息以及上傳文件和圖像,GPT-4o 在短期內(nèi)將更加強(qiáng)大。但對(duì)于復(fù)雜的推理任務(wù)來(lái)說(shuō),這是一個(gè)重大進(jìn)步,代表了人工智能能力的新水平。 鑒于此將計(jì)數(shù)器重置為 1,并將該系列命名為 OpenAI o1。醫(yī)療保健研究人員可以使用 o1 來(lái)注釋細(xì)胞測(cè)序數(shù)據(jù),物理學(xué)家可以使用 o1 生成量子光學(xué)所需的復(fù)雜數(shù)學(xué)公式,所有領(lǐng)域的開(kāi)發(fā)人員可以使用 o1 來(lái)構(gòu)建和執(zhí)行多步驟工作流程。 OpenAI 還發(fā)布了 OpenAI o1-mini,這是一種經(jīng)濟(jì)高效的推理模型。o1-mini 在 STEM 方面表現(xiàn)出色,尤其是數(shù)學(xué)和編碼——在 AIME 和 Codeforces 等評(píng)估基準(zhǔn)上的表現(xiàn)幾乎與 OpenAI o1 相當(dāng)。OpenAI 預(yù)計(jì),對(duì)于需要推理而無(wú)需廣泛世界知識(shí)的應(yīng)用程序,o1-mini 將是一種更快、經(jīng)濟(jì)高效的模型,比 o1-preview 便宜 80%。ChatGPT Plus、Team、Enterprise 和 Edu 用戶可以使用 o1-mini 作為 o1-preview 的替代方案,具有更高的速率限制和更低的延遲。
鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標(biāo)記有誤,請(qǐng)第一時(shí)間聯(lián)系我們修改或刪除,多謝。