每日經濟新聞
      頭條

      每經網首頁 > 頭條 > 正文

      考試中擊敗90%的人類!GPT升級了:更可靠、更有創造力

      每日經濟新聞 2023-03-15 07:08:00

      每經編輯|畢陸名

      憑借ChatGPT掀起人工智能(AI)應用熱潮的OpenAI發布了最新作品——GPT-4。得到這種新模型支持的ChatGPT將迎來升級。

      當地時間周二(3月14日),人工智能研究公司OpenAI公布了其大型語言模型的最新版本——GPT-4。該公司表示,GPT-4在許多專業測試中表現出超過絕大多數人類的水平。OpenAI還稱,GPT-4參加了多種基準考試測試,包括美國律師資格考試Uniform Bar Exam、法學院入學考試LSAT、“美國高考”SAT數學部分和證據性閱讀與寫作部分的考試,在這些測試中,它的得分高于88%的應試者。

      OpenAI推出GPT-4

      OpenAI周二表示,在內部評估中,GPT-4產生正確回應的可能性要比GPT-3.5高出40%。而且GPT-4是多模態的,同時支持文本和圖像輸入功能。OpenAI稱,GPT-4比以前的版本“更大”,這意味著其已經在更多的數據上進行了訓練,并且在模型文件中有更多的權重,這使得它的運行成本更高。

      據OpenAI介紹,在某些情況下,GPT-4比之前的GPT-3.5版本有了巨大改進,新模型將產生更少的錯誤答案,更少地偏離談話軌道,更少地談論禁忌話題,甚至在許多標準化測試中比人類表現得更好。

      例如,GPT-4在模擬律師資格考試的成績在考生中排名前10%左右,在SAT閱讀考試中排名前7%左右,在SAT數學考試中排名前11%左右。

      OpenAI表示,已經與多家公司合作,要將GPT-4結合到他們的產品中,包括Duolingo、Stripe和Khan Academy。GPT-4模型也將以API的形式,提供給付費版ChatGPT Plus的訂閱用戶。開發者可以注冊,用它打造應用。微軟此后表示,新款的必應(Bing)搜索引擎將運行于GPT-4系統之上。

      OpenAI表示,雖然兩個版本在日常對話中看起來很相似,但當任務復雜到一定程度時,差異就表現出來了,GPT-4更可靠、更有創造力,能夠處理更微妙的指令。“在我們的內部評估中,它產生正確回應的可能性比GPT-3.5高40%。”


      在上述示例中,可以看到GPT-4系統如何應答圖像輸入內容,比如像上述截圖那樣解釋圖片的不同尋常之處、圖片的幽默之處、一個搞怪圖片的用意

      不過,OpenAI也警告稱,GPT-4還不完美,在許多情況下,它的能力不如人類。該公司表示:“GPT-4仍有許多已知的局限性,我們正在努力解決,比如社會偏見、幻覺和對抗性提示。”

      OpenAI透露,摩根士丹利正在使用GPT-4來組織數據,而電子支付公司Stripe正在測試GPT-4是否有助于打擊欺詐。其他客戶還包括語言學習公司Duolingo、Khan Academy和冰島政府。

      OpenAI合作伙伴微軟周二表示,新版必應搜索引擎將使用GPT-4。

      OpenAI聯合創始人:未來AI將首先替代基于認知的工作

      據每日經濟新聞3月14日報道,當地時間3月10日至19日,西南偏南多元創新大會和藝術節(SXSW)在美國得克薩斯州奧斯汀舉行。如果說去年SXSW的主題是關于Web3、NFT和元宇宙,那么今年的SXSW顯然展現出完全不同的景象,ChatGPT幾乎成為貫穿每場活動的話題。

      圖片來源:視覺中國

      3月10日,OpenAI聯合創始人兼總裁Greg Brockman在當天舉行的活動現場接受了外媒的專訪,在長達一小時的談話中,Brockman談到了許多與ChatGPT和人工智能(AI)的話題。當天,現場座無虛席,觀眾時不時因為Greg的發言而發出陣陣呼聲。

      與許多人一樣,在Brockman的暢想中,未來的通用AI將給人類帶來顛覆性的影響。他認為,未來AI更像是一個全天候的助手,它能夠“放大”人們的能力,并幫助人類獲得新的想法。

      “想想今天,每個人都在看同一個電視節目,也許人們都在看《權力的游戲》的最后一季,”他說,“但想象一下,如果你可以讓你的AI以不同的方式進行,甚至可能將自己作為主角置身其中,并進行互動體驗。”

      在此之前,許多人——包括Brockman本人在內——都認為AI將從一些體力勞動開始替代人類的工作,但如今的事實恰好相反。Brockman在談話中表示,未來人類基于認知的工作將首先被機器取代,例如內容審核。因此,在AI浪潮中,人類需要更高級別的技能、判斷和認知。

      每日經濟新聞綜合每經網(記者:文巧)、OpenAI官網

      封面圖片來源:視覺中國

      如需轉載請與《每日經濟新聞》報社聯系。
      未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。

      讀者熱線:4008890008

      特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。

      人工智能 ChatGPT

      歡迎關注每日經濟新聞APP

      每經經濟新聞官方APP

      0

      0

      亚洲午夜无码片在线观看影院猛 | 亚洲精品综合久久| 亚洲网站在线免费观看| 亚洲情侣偷拍精品| 亚洲乱理伦片在线观看中字| 亚洲av无码电影网| 亚洲综合图片小说区热久久| 久久精品国产亚洲夜色AV网站| 亚洲国产精品一区二区第四页 | 国产日韩亚洲大尺度高清| 国产亚洲午夜高清国产拍精品| 亚洲精品无码永久在线观看| 亚洲AV永久无码精品一区二区国产| 亚洲第一成年网站视频| 亚洲avav天堂av在线网毛片| 学生妹亚洲一区二区| 亚洲午夜理论片在线观看| 亚洲欧美日韩自偷自拍| 亚洲丰满熟女一区二区哦| 久久亚洲精品高潮综合色a片| 久久亚洲AV成人无码国产电影| 亚洲国产成人AV网站| 老司机亚洲精品影院在线观看| 国产成人综合久久精品亚洲| 亚洲av无码专区在线观看素人| 亚洲免费日韩无码系列 | 亚洲视频免费在线观看| 久久亚洲中文字幕精品有坂深雪 | 日本亚洲中午字幕乱码| 亚洲国产成人久久一区久久| 精品亚洲一区二区三区在线观看 | 国产91在线|亚洲| 国产亚洲中文日本不卡二区| 亚洲精品无码久久久久APP| 国产精品亚洲综合一区在线观看 | 久久亚洲AV成人无码国产电影 | 青青青国产色视频在线观看国产亚洲欧洲国产综合| 九九精品国产亚洲AV日韩| 亚洲成人国产精品| 亚洲人成伊人成综合网久久久| 无码乱人伦一区二区亚洲|