頭條

考試中擊敗90%的人類！GPT升級了：更可靠、更有創造力

每日經濟新聞 2023-03-15 07:08:00

每經編輯｜畢陸名

憑借ChatGPT掀起人工智能（AI）應用熱潮的OpenAI發布了最新作品——GPT-4。得到這種新模型支持的ChatGPT將迎來升級。

當地時間周二（3月14日），人工智能研究公司OpenAI公布了其大型語言模型的最新版本——GPT-4。該公司表示，GPT-4在許多專業測試中表現出超過絕大多數人類的水平。OpenAI還稱，GPT-4參加了多種基準考試測試，包括美國律師資格考試Uniform Bar Exam、法學院入學考試LSAT、“美國高考”SAT數學部分和證據性閱讀與寫作部分的考試，在這些測試中，它的得分高于88%的應試者。

OpenAI推出GPT-4

OpenAI周二表示，在內部評估中，GPT-4產生正確回應的可能性要比GPT-3.5高出40%。而且GPT-4是多模態的，同時支持文本和圖像輸入功能。OpenAI稱，GPT-4比以前的版本“更大”，這意味著其已經在更多的數據上進行了訓練，并且在模型文件中有更多的權重，這使得它的運行成本更高。

據OpenAI介紹，在某些情況下，GPT-4比之前的GPT-3.5版本有了巨大改進，新模型將產生更少的錯誤答案，更少地偏離談話軌道，更少地談論禁忌話題，甚至在許多標準化測試中比人類表現得更好。

例如，GPT-4在模擬律師資格考試的成績在考生中排名前10%左右，在SAT閱讀考試中排名前7%左右，在SAT數學考試中排名前11%左右。

OpenAI表示，已經與多家公司合作，要將GPT-4結合到他們的產品中，包括Duolingo、Stripe和Khan Academy。GPT-4模型也將以API的形式，提供給付費版ChatGPT Plus的訂閱用戶。開發者可以注冊，用它打造應用。微軟此后表示，新款的必應（Bing）搜索引擎將運行于GPT-4系統之上。

OpenAI表示，雖然兩個版本在日常對話中看起來很相似，但當任務復雜到一定程度時，差異就表現出來了，GPT-4更可靠、更有創造力，能夠處理更微妙的指令。“在我們的內部評估中，它產生正確回應的可能性比GPT-3.5高40%。”

在上述示例中，可以看到GPT-4系統如何應答圖像輸入內容，比如像上述截圖那樣解釋圖片的不同尋常之處、圖片的幽默之處、一個搞怪圖片的用意

不過，OpenAI也警告稱，GPT-4還不完美，在許多情況下，它的能力不如人類。該公司表示：“GPT-4仍有許多已知的局限性，我們正在努力解決，比如社會偏見、幻覺和對抗性提示。”

OpenAI透露，摩根士丹利正在使用GPT-4來組織數據，而電子支付公司Stripe正在測試GPT-4是否有助于打擊欺詐。其他客戶還包括語言學習公司Duolingo、Khan Academy和冰島政府。

OpenAI合作伙伴微軟周二表示，新版必應搜索引擎將使用GPT-4。

OpenAI聯合創始人：未來AI將首先替代基于認知的工作

據每日經濟新聞3月14日報道，當地時間3月10日至19日，西南偏南多元創新大會和藝術節（SXSW）在美國得克薩斯州奧斯汀舉行。如果說去年SXSW的主題是關于Web3、NFT和元宇宙，那么今年的SXSW顯然展現出完全不同的景象，ChatGPT幾乎成為貫穿每場活動的話題。

圖片來源：視覺中國

3月10日，OpenAI聯合創始人兼總裁Greg Brockman在當天舉行的活動現場接受了外媒的專訪，在長達一小時的談話中，Brockman談到了許多與ChatGPT和人工智能（AI）的話題。當天，現場座無虛席，觀眾時不時因為Greg的發言而發出陣陣呼聲。

與許多人一樣，在Brockman的暢想中，未來的通用AI將給人類帶來顛覆性的影響。他認為，未來AI更像是一個全天候的助手，它能夠“放大”人們的能力，并幫助人類獲得新的想法。

“想想今天，每個人都在看同一個電視節目，也許人們都在看《權力的游戲》的最后一季，”他說，“但想象一下，如果你可以讓你的AI以不同的方式進行，甚至可能將自己作為主角置身其中，并進行互動體驗。”

在此之前，許多人——包括Brockman本人在內——都認為AI將從一些體力勞動開始替代人類的工作，但如今的事實恰好相反。Brockman在談話中表示，未來人類基于認知的工作將首先被機器取代，例如內容審核。因此，在AI浪潮中，人類需要更高級別的技能、判斷和認知。

每日經濟新聞綜合每經網（記者：文巧）、OpenAI官網

封面圖片來源：視覺中國

如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權，嚴禁轉載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯系索取稿酬。如您不希望作品出現在本站，可聯系我們要求撤下您的作品。

人工智能 ChatGPT

上一篇文章

穆迪下調美國簽名銀行債券至垃圾級

返回每經網首頁

下一篇文章

證券時報：不必擔憂硅谷銀行事件沖擊中國金融體系

熱文精選

點擊排行

歡迎關注每日經濟新聞APP