精品久久久久久久久久_欧美香蕉人人人人人人爱_91精品国产免费久久久久久青草_国产亚洲欧美日韩在线观看一区二区

每日經(jīng)濟(jì)新聞
要聞

每經(jīng)網(wǎng)首頁 > 要聞 > 正文

重磅!會“思考解題邏輯”的OpenAI推理大模型登場,認(rèn)知將躍升至“理科博士生水準(zhǔn)”

每日經(jīng)濟(jì)新聞 2024-09-13 06:33:13

每經(jīng)編輯|杜宇

北京時間周五凌晨1時許,AI時代迎來嶄新的起點(diǎn)——能夠進(jìn)行通用復(fù)雜推理的大模型終于走到臺前。

CFF20LXzkOwy1K59ibfpWGHnIlAd2CaFqEO1dMHC44adMkaSD0XicA0MQvgqvROOY6jpHIhbnv0aMBtI6NumAr0g.jpg

圖片來源:視覺中國-VCG31N2008743681

OpenAI在官網(wǎng)發(fā)布公告稱,開始向全體訂閱用戶開始推送OpenAI o1預(yù)覽模型——也就是此前被廣泛期待的“草莓”大模型。OpenAI表示,對于復(fù)雜推理任務(wù)而言,新模型代表著人工智能能力的嶄新水平,因此值得將計(jì)數(shù)重置為1,給它一個有別于“GPT-4”系列的全新名號。

推理大模型的特點(diǎn),就是AI會在回答之前花更多時間進(jìn)行思考,就像人類思考解決問題的過程一樣。以往的大模型,背后的邏輯是通過學(xué)習(xí)大量數(shù)據(jù)集中的模式,來預(yù)測單詞生成的序列,嚴(yán)格來說并不是真正理解提問。

作為o1系列模型的首批版本,OpenAI僅推出了o1-preview預(yù)覽版和o1-mini迷你版,而且是分階段向付費(fèi)用戶、免費(fèi)用戶和開發(fā)者推出,且開發(fā)者的使用價(jià)格頗為昂貴。

o1模型使用成本至少是GPT-4o的3倍 采用全新方法訓(xùn)練

據(jù)介紹,o1新模型通過背后嶄新的訓(xùn)練方式,變得可以回答更復(fù)雜的編程、數(shù)學(xué)與科學(xué)難題,在給出答案前會先“思考”,而且速度比人類更快。更小、更便宜的迷你版聚焦在編程用例。

ChatGPT Plus和Team付費(fèi)用戶即刻起便能訪問這兩種模型,從用戶界面AI模型選擇器的下拉菜單中手動選擇。ChatGPT Enterprise和Edu用戶下周能使用這兩種模式,未來某個未知時刻還將向所有免費(fèi)用戶提供o1-mini的訪問權(quán)限。OpenAI希望以后能根據(jù)提示語自動選擇正確的模型。

 

不過,開發(fā)人員訪問o1非常昂貴,在API(應(yīng)用程序編程接口)中,o1-preview每100萬個輸入token收費(fèi)15美元,是GPT-4o成本的三倍,每100萬個輸出token收費(fèi)60美元,是GPT-4o成本的四倍。100萬個token即模型解析文字塊的規(guī)模大小,相當(dāng)于大約75萬個單詞。

OpenAI的研究負(fù)責(zé)人Jerry Tworek對媒體稱,o1背后的訓(xùn)練方式與之前的模型有著根本不同。

首先,o1“使用了一種全新的優(yōu)化算法和專門為其量身定制的新訓(xùn)練數(shù)據(jù)集進(jìn)行訓(xùn)練”,這個數(shù)據(jù)集中包含“推理數(shù)據(jù)”和專門為其量身定制的科學(xué)文獻(xiàn)。

其次,之前的GPT模型訓(xùn)練方法是模仿數(shù)據(jù)集的規(guī)律/范式(pattern),而o1采用“強(qiáng)化學(xué)習(xí)”的方式,通過獎勵和懲罰來教導(dǎo)模型自行解決問題,再通過“思路鏈”(chain of thoughts)來處理用戶查詢的問題,給出思路鏈的總結(jié)摘要版,類似于人類一步步來處理問題的方式。

右圖可以點(diǎn)開思路鏈看o1模型如何“思考”

對于一個復(fù)雜數(shù)學(xué)問題的思路鏈展示圖

OpenAI認(rèn)為,這種全新的訓(xùn)練方法會讓o1模型更加準(zhǔn)確,會減少瞎編回答的“幻覺”問題,但也無法完全杜絕出現(xiàn)“幻覺”。新模型與GPT-4o的主要區(qū)別在于能夠更好地解決編程和數(shù)學(xué)等復(fù)雜問題,同時還能完善其推理過程、嘗試不同策略,并識別和修正自身答案中的錯誤。

認(rèn)知將躍升至“理科博士生水準(zhǔn)”

OpenAI曾解釋過,2023年發(fā)布的GPT-4類似于高中生的智能水平,而GPT-5則是完成AI從“高中生躍升至博士”的成長。這個o1模型就是其中關(guān)鍵的一步。

相較于GPT-4o等現(xiàn)有的大模型,OpenAI o1能夠解決更加困難的推理問題,同時改善過往模型中存在的機(jī)制性缺陷。

舉例而言,這個新模型能夠數(shù)清楚strawberry里到底有幾個“r”。

同時AI在解答編程問題時也會更有條理,在著手寫代碼前,把整個回答的流程全部思考完一遍,再動手輸出代碼。

例如在預(yù)設(shè)條件的寫詩任務(wù)(例如第二句的最后一個單詞需要以i收尾)中,“拿起筆就寫”的GPT-4o的確給出了回答,但往往只會滿足了一部分條件,同時不會自我糾正。這意味著AI必須在第一次生成時就能碰上正確的答案,否則就一定會出錯。但在o1模型中,AI會不斷試錯并打磨答案,從而顯著提高生成結(jié)果的準(zhǔn)確率和質(zhì)量。

有趣的是,點(diǎn)開AI思考的過程,還會出現(xiàn)AI表示“我在思考這個事情這么做行不行”、“啊時間不夠了得盡快給出答案”等。OpenAI確認(rèn),這里展示的并不是原始的思維鏈,而是“模型生成的摘要”,公司也坦率承認(rèn)這里有保持“競爭優(yōu)勢”的因素。

OpenAI的研究負(fù)責(zé)人Jerry Tworek透露,o1模型背后的訓(xùn)練與之前的產(chǎn)品有著根本性的區(qū)別。之前的GPT模型旨在模仿其訓(xùn)練數(shù)據(jù)中的模式,而o1的訓(xùn)練旨在讓其獨(dú)立解決問題。在強(qiáng)化學(xué)習(xí)的過程中,使用獎勵和懲罰機(jī)制來“教育”AI使用“思維鏈”來處理問題,就像人類習(xí)得拆解、分析問題的方式一樣。

根據(jù)測試,o1模型在國際數(shù)學(xué)奧林匹克的資格考試中,能夠拿到83%的分?jǐn)?shù),而GPT-4o只能正確解決13%的問題。而在編程能力比賽Codeforces中,o1模型拿到89%百分位的成績,而GPT-4o只有11%。

OpenAI表示,根據(jù)測試,在下一個更新的版本中,AI在物理、化學(xué)和生物學(xué)的挑戰(zhàn)性基準(zhǔn)測試中,表現(xiàn)能夠與博士生水平類似

缺點(diǎn):無法瀏覽實(shí)時網(wǎng)頁、無法上傳文件和圖片、缺乏廣泛世界知識、或更易產(chǎn)生幻覺

但作為o1模型的最初始版本,今日發(fā)布的o1-預(yù)覽版也有明顯缺點(diǎn)。例如,只是一款“純文字版”,暫時無法瀏覽網(wǎng)頁信息以及上傳文件和圖片,也就是說不具備ChatGPT的許多使用功能,在許多常見用例中不如GPT-4o那么強(qiáng)大,而且還有用量限制,o1預(yù)覽版每周上限為30條消息,迷你版每周上限為50條。

其他被提及的局限性包括:o1模型在很多領(lǐng)域的能力不如GPT-4o,在關(guān)于世界的事實(shí)知識方面表現(xiàn)不佳;有的用例下推理能力較慢,可能需要更長的時間來回答問題;目前o1只是一個純文本模型,缺乏針對特定文檔進(jìn)行推理,或者從網(wǎng)絡(luò)收集實(shí)時信息的能力。

此外,讓AI模型玩井字棋(Tic-Tac-Toe)一直被認(rèn)為是個業(yè)界難題,擁有推理能力的o1新模型也還是會在這個游戲中出錯,即無法完全攻克技術(shù)難關(guān)。

OpenAI還在一篇技術(shù)論文中承認(rèn),其收到了一些“軼事反饋”,稱o1預(yù)覽版和迷你版比GPT-4o及其迷你版更容易產(chǎn)生“幻覺”,也就是AI仍在很自信地編造答案,而且o1很少會承認(rèn)它不知道問題的答案。

知名科技媒體Techcrunch指出,OpenAI在o1模型相關(guān)的博文中點(diǎn)明,其決定不向用戶展示這一新模型的原始“思維鏈”,而是選擇在答案中給出思維鏈的總結(jié)摘要,目的是為了維持“競爭優(yōu)勢”,為了彌補(bǔ)可能的缺點(diǎn),“我們努力教導(dǎo)模型在答案中重現(xiàn)思路鏈中的任何有用想法。”

每日經(jīng)濟(jì)新聞綜合公開資料

如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

模型 Ai OpenAI

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

0

0

精品久久久久久久久久_欧美香蕉人人人人人人爱_91精品国产免费久久久久久青草_国产亚洲欧美日韩在线观看一区二区

      精久久久久久久久久久| 五月婷婷另类国产| 99久久精品免费精品国产| 国产精品青草综合久久久久99| 成人在线视频一区| 亚洲欧洲精品一区二区三区不卡| 91免费小视频| 午夜视频一区二区| 欧美成人精品福利| 国产·精品毛片| 亚洲猫色日本管| 在线不卡欧美精品一区二区三区| 精品亚洲国内自在自线福利| 国产日韩欧美精品在线| 色综合久久99| 日韩不卡在线观看日韩不卡视频| 久久亚洲精华国产精华液| 波多野结衣91| 亚洲h在线观看| 久久综合色天天久久综合图片| 波多野结衣精品在线| 亚洲成人在线网站| 久久综合色8888| 色偷偷久久人人79超碰人人澡| 婷婷中文字幕一区三区| 国产亚洲欧美色| 91福利精品视频| 久久激五月天综合精品| 国产清纯美女被跳蛋高潮一区二区久久w | 爽好多水快深点欧美视频| 久久综合九色综合97婷婷女人 | www..com久久爱| 天天影视涩香欲综合网| 国产拍欧美日韩视频二区 | 日本电影欧美片| 久久9热精品视频| 日韩美女啊v在线免费观看| 欧美一卡二卡三卡| 成人黄页毛片网站| 日本不卡在线视频| 国产精品久久久久影视| 欧美一区二区在线看| 成人丝袜18视频在线观看| 婷婷中文字幕一区三区| 亚洲国产成人午夜在线一区| 欧美军同video69gay| 国产成人一区二区精品非洲| 亚洲成人av一区二区| 日本一区二区不卡视频| 欧美一区二区视频观看视频 | 欧美一区二区三区日韩| 色综合天天视频在线观看| 黄网站免费久久| 亚洲成av人片一区二区三区| 欧美激情一区二区三区四区| 欧美一区二区成人| 91久久一区二区| 国产91精品一区二区麻豆亚洲| 日韩在线卡一卡二| 亚洲免费在线看| 久久色在线观看| 欧美久久久久久久久| 91丝袜高跟美女视频| 国内久久精品视频| 无码av免费一区二区三区试看| 国产精品国产自产拍在线| 精品国产百合女同互慰| 欧美精品 日韩| 日本精品一区二区三区高清| 成人午夜在线免费| 韩国精品久久久| 秋霞电影一区二区| 尤物视频一区二区| 国产精品免费视频一区| 久久嫩草精品久久久精品| 欧美精品三级在线观看| 在线视频综合导航| 不卡的看片网站| 国产成人精品三级麻豆| 极品少妇xxxx精品少妇| 欧美aaa在线| 亚洲国产精品人人做人人爽| 亚洲欧美电影院| 国产精品国产自产拍在线| 久久九九99视频| 精品成人一区二区| 欧美一级日韩不卡播放免费| 欧美性猛交xxxx黑人交| 色女孩综合影院| 91女人视频在线观看| www.欧美亚洲| 成人国产精品免费观看视频| 国产精品1区二区.| 国产伦精一区二区三区| 国产综合色在线| 激情五月激情综合网| 极品销魂美女一区二区三区| 久久99国产精品成人| 久久国产精品色婷婷| 麻豆91在线观看| 裸体一区二区三区| 麻豆精品在线视频| 久久 天天综合| 狠狠狠色丁香婷婷综合久久五月| 精品一二三四区| 国精产品一区一区三区mba视频 | 欧美电视剧免费全集观看| 日韩欧美一二三| 欧美xingq一区二区| 精品国产成人在线影院| 国产日韩影视精品| 国产精品久久久久久久久免费丝袜| 国产精品久久毛片av大全日韩| 国产精品欧美久久久久无广告 | 日韩三级中文字幕| 欧美电视剧在线看免费| 久久女同精品一区二区| 中文字幕高清不卡| 自拍偷自拍亚洲精品播放| 亚洲欧美激情在线| 午夜影院久久久| 美腿丝袜亚洲三区| 国产麻豆成人精品| 99久久精品国产精品久久| 日本韩国欧美国产| 欧美一区二视频| 久久久欧美精品sm网站| 国产精品毛片无遮挡高清| 亚洲欧美aⅴ...| 视频一区在线播放| 国产一区二区在线观看视频| 成人免费视频app| 91黄视频在线| 日韩午夜在线播放| 欧美激情资源网| 亚洲综合图片区| 全部av―极品视觉盛宴亚洲| 国产一区欧美日韩| 91视视频在线直接观看在线看网页在线看| 日本韩国欧美国产| 日韩美女一区二区三区| 中文字幕乱码久久午夜不卡 | 久久综合久久综合久久| 国产精品久久久久久久岛一牛影视| 夜夜精品视频一区二区| 美女视频一区在线观看| 国产1区2区3区精品美女| 91国内精品野花午夜精品| 91精品国产麻豆| 日本一区二区三区电影| 亚洲欧美偷拍卡通变态| 蜜臀精品久久久久久蜜臀| 成人午夜精品一区二区三区| 欧美日韩精品欧美日韩精品一| 2欧美一区二区三区在线观看视频| 国产精品成人一区二区艾草 | 久久66热re国产| 99国产精品久久久| 欧美一区二区女人| 国产欧美精品在线观看| 一级日本不卡的影视| 韩国v欧美v亚洲v日本v| 色综合激情久久| 欧美r级在线观看| 亚洲丝袜另类动漫二区| 免费一区二区视频| 91丨porny丨国产| 日韩欧美中文字幕精品| 亚洲欧洲精品一区二区三区| 日韩av中文在线观看| av不卡一区二区三区| 欧美一级片免费看| 亚洲欧洲精品一区二区三区不卡| 美国毛片一区二区| 色婷婷亚洲精品| 精品91自产拍在线观看一区| 亚洲免费观看高清完整版在线观看 | 在线成人高清不卡| 成人欧美一区二区三区视频网页| 日日嗨av一区二区三区四区| a亚洲天堂av| 欧美成人一区二区三区片免费 | 最新高清无码专区| 国产乱码精品一区二区三区忘忧草 | 中文字幕不卡一区| 麻豆国产欧美日韩综合精品二区 | 青青草国产成人99久久| 色综合久久88色综合天天| 久久久久久久久岛国免费| 天堂成人国产精品一区| 97精品久久久久中文字幕| 久久久久97国产精华液好用吗| 亚洲a一区二区| 91麻豆国产福利在线观看| 国产婷婷一区二区| 天天色天天操综合| 色综合久久综合网97色综合| 欧美高清在线视频| 国产美女在线精品| 日韩美女视频在线|