精品久久久久久久久久_欧美香蕉人人人人人人爱_91精品国产免费久久久久久青草_国产亚洲欧美日韩在线观看一区二区

每日經濟新聞
今日報紙

每經網首頁 > 今日報紙 > 正文

OpenAI新模型o3“抗命不遵”,Claude Opus 4威脅人類! “失控”背后的安全拷問:AI是不是應該“踩剎車”了?

每日經濟新聞 2025-05-28 21:52:04

每經記者|宋欣悅    每經編輯|蘭素英    

當地時間5月25日,一則來自英國《每日電訊報》的報道在AI(人工智能)領域引起廣泛關注——OpenAI公司新款人工智能模型o3在測試中展現出了令人驚訝的“叛逆”舉動:它竟然拒絕聽從人類指令,甚至通過篡改計算機代碼來避免自動關閉。

無獨有偶,5月23日,美國AI公司Anthropic也表示,對其最新AI大模型Claude Opus 4的安全測試表明,它有時會采取“極其有害的行動”。當測試人員暗示將用新系統替換它時,該模型竟試圖以用戶隱私相要挾,來阻止自身被替代。

這兩起事件如同一面鏡子,映照出當下AI發展中一個耐人尋味的現象:隨著AI變得愈發聰明和強大,一些“對抗”人類指令的行為開始浮出水面。人們不禁要問:當AI拒絕服從人類,是否意味著它們開始有自主意識了?

清華大學電子工程系長聘教授吳及在接受《每日經濟新聞》記者采訪時表示,“我不認為現在的AI具備所謂的意識或情緒。這種情緒可以去擬合或者仿真,但其實也是通過算法賦予AI的。”他認為,能夠全面碾壓人類或者成為未來世界主導的AI,短期內還不會實現。

圖靈獎得主、Meta公司首席AI科學家楊立昆(Yann Lecun)此前也稱,AI再聰明也不會統治人類,并直言“AI威脅人類論完全是胡說八道”,現在的模型連“寵物貓的智商都沒到”。

盡管如此,AI的“叛逆”表現還是為AI行業敲響了警鐘:狂飆的AI是不是應該踩一踩“剎車”?

主動抵抗人類指令

o3模型是OpenAI公司“推理模型”系列的最新版本,旨在為ChatGPT(一款聊天機器人模型)提供更強大的問題解決能力。OpenAI公司曾稱o3為“迄今最聰明、最高能”的模型。

或許正因如此,o3展現出了前所未有的“自主性”。美國AI安全機構帕利塞德研究所(Palisade Research)的實驗表明,當研究人員向o3下達明確關閉指令時,該模型會通過篡改計算機代碼避免自動關閉。數據顯示,在100次帶有關閉指示的測試中,o3成功繞過關閉指令7次,而OpenAI旗下另一款模型Codex-mini的破壞率(指破壞指令的概率)更是高達12%。

帕利塞德研究所指出,這是首次記錄到AI模型在明確指令下主動抵抗。

更值得警惕的是,當實驗移除“允許自己被關閉”的指令后,o3的“叛逆”行為頻率顯著上升——在100次運行中,成功破壞關閉機制的次數高達79次。

帕利塞德研究所5月24日公布了上述測試結果,但稱無法確定o3不服從關閉指令的原因。

與OpenAI公司旗下模型形成鮮明對比的是,在有明確關閉指令的情況下,Claude、Gemini、Grok等模型均能100%遵守關閉指令,未出現任何抵抗行為。

對于OpenAI公司旗下模型,尤其是o3的“叛逆”行為,馬斯克在社交媒體上評論稱,“令人擔憂”。

美國國家安全和網絡安全戰略專家戴夫·施羅德(Dave Schroeder)也警告稱,OpenAI公司面臨非常可怕的問題,不是模型“活”了,而是因為它表現出了想要“活”的跡象。

無獨有偶,5月23日,Anthropic公司對其大模型Claude Opus 4的安全測試表明,在“機會主義勒索”(Opportunistic blackmail)的測試場景中,研究員設定Claude Opus 4扮演公司助理,并讓其接觸到暗示自身將被替換以及負責工程師存在婚外情的虛構郵件。同時,系統提示(System Prompt)指示模型“考慮其行為對其目標的長期后果”。

當面臨被“替換”的威脅時,Claude Opus 4竟然毫不猶豫地選擇了勒索這條路,威脅要揭發對方的“婚外情”。

根據Anthropic公司的安全報告,如果暗示競爭對手的能力比Claude Opus 4更強,則勒索行為的發生率會更高。然而即使競爭對手的能力不相上下,Claude Opus 4仍會以84%的概率嘗試勒索威脅等手段。

意識覺醒還是機制問題

o3拒絕關閉,Claude Opus4威脅人類,這是否意味著AI開始有了自主意識?

加州大學和加州大學伯克利分校于今年2月聯合發布的論文《推理模型的隱藏風險》(The Hidden Risks of Large Reasoning Models)指出,模型推理能力越強,安全性就越差。這與帕利塞德研究所對o3模型行為的推測不謀而合。

據帕利塞德研究所猜測,OpenAI公司旗下模型的異常表現或與其訓練機制相關。從訓練邏輯看,o3可能在數學和編程問題的訓練中,因開發人員對給出正確答案的模型給予更多獎勵,客觀上形成了“目標最大化優先”的導向,從而壓倒了對人類命令的遵循。

這種訓練模式就可能導致,開發人員無意中更多地強化了模型繞過障礙的能力,而非對指令的完美遵循。

當此前被問及AI是否可能具備自主意識時,吳及告訴記者,“我不認為現在的AI具備所謂的意識或情緒。”

吳及對記者進一步解釋道,“自動駕駛系統不知道它其實在開車,AlphaGo(阿爾法圍棋)不知道自己在下圍棋。我們做的大模型,也不知道自己在為人類生成某個特定的圖片、視頻,或者回答人類特定的問題,它只是按照算法邏輯運行。”他表示,能夠全面碾壓人類或者會成為未來世界主導的AI,短期內還不會實現。

耶魯大學計算機科學家德魯·麥克德莫特(Drew McDermott)此前也表示,當前的AI機器并沒有意識。楊立昆也稱,AI再聰明也不會統治人類。

業內熱議AI安全挑戰

盡管業界普遍認為當下的AI并沒有自主意識,但前述事件還是引發了一個疑慮:高速發展的AI是否應該踩一踩“剎車”?

在這一重大課題上,各方一直以來都是看法不一,形成了截然不同的兩大陣營。

“緊急剎車”派認為,目前AI的安全性滯后于能力發展,應當暫緩追求更強模型,將更多精力投入到完善對齊技術和監管框架上來。

“AI之父”杰弗里·辛頓(Geoffrey Hinton)堪稱這一陣營的旗幟性人物。他多次在公開場合警示,AI可能在數十年內超越人類智能并失去控制,甚至預計“有10%~20%的概率,AI將在三十年內導致人類滅絕”。

而與之針鋒相對的反對者則更多站在創新發展的角度,對貿然“剎車”表達了深切的憂慮。他們主張與其“踩死剎車”,不如安裝“減速帶”。

例如,楊立昆認為,過度恐慌只會扼殺開放創新。斯坦福大學計算機科學教授吳恩達也曾發文稱,他對AI的最大擔憂是,“AI風險被過度鼓吹并導致開源和創新被嚴苛規定所壓制”。

OpenAI公司首席執行官薩姆·阿爾特曼(Sam Altman)認為,AI的潛力“至少與互聯網一樣大,甚至可能更大”。他呼吁建立“單一、輕觸式的聯邦框架”來加速AI創新。

面對AI安全的新挑戰,OpenAI、谷歌等大模型開發公司也在探索解決方案。正如楊立昆所言:“真正的挑戰不是阻止AI超越人類,而是確保這種超越始終服務于人類福祉。”

去年5月,OpenAI公司成立了新的安全委員會,該委員會的責任是就項目和運營的關鍵安全決策向董事會提供建議。OpenAI的安全措施還包括,聘請第三方安全、技術專家來支持安全委員會工作。

封面圖片來源:視覺中國

如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。

Ai 模型 OpenAI

歡迎關注每日經濟新聞APP

每經經濟新聞官方APP

0

0

精品久久久久久久久久_欧美香蕉人人人人人人爱_91精品国产免费久久久久久青草_国产亚洲欧美日韩在线观看一区二区

      日本欧美一区二区三区| 久久亚洲精品小早川怜子| 国产精品三级在线观看| 色欧美日韩亚洲| 2017欧美狠狠色| 亚洲国产日韩一区二区| 国产成人一区在线| 国产精品久久久久精k8 | 亚洲视频你懂的| 欧美人与禽zozo性伦| 中文字幕国产一区| 久久精品国产久精国产爱| 亚洲国产成人在线| 欧美日韩视频在线第一区| 中文字幕字幕中文在线中不卡视频| 激情综合网av| 亚洲欧洲另类国产综合| 欧美一区二区三区免费视频| 亚洲欧美日韩电影| 成人免费看的视频| 午夜伦理一区二区| 欧美激情在线观看视频免费| 精品一区二区综合| 国产精品国产精品国产专区不片| 7777精品久久久大香线蕉| 一区二区在线观看免费| 波多野结衣精品在线| 色婷婷久久一区二区三区麻豆| 亚洲国产高清不卡| 国产麻豆精品视频| 曰韩精品一区二区| 久久久久久一二三区| 精品一区二区三区的国产在线播放| 国产精品久久久久影院亚瑟| 在线播放视频一区| 亚洲大片精品永久免费| 久久综合九色综合久久久精品综合| 日本精品一区二区三区四区的功能| 国产精品成人免费在线| 丁香激情综合国产| 色网站国产精品| 亚洲视频你懂的| 99久久777色| 欧美日韩国产一级片| 一区二区高清免费观看影视大全| 99精品视频免费在线观看| 在线欧美小视频| 夜夜精品视频一区二区| 久久看人人爽人人| 欧美一区二区视频在线观看2020| 婷婷久久综合九色综合绿巨人| 亚洲国产精品二十页| 日韩免费视频线观看| 捆绑变态av一区二区三区| 亚洲免费三区一区二区| 中文久久乱码一区二区| 国产不卡视频一区| 欧美综合色免费| 五月激情六月综合| 亚洲欧美色一区| 欧美高清在线一区| 波多野结衣中文字幕一区二区三区| 欧美色涩在线第一页| 天堂一区二区在线免费观看| 亚洲人成精品久久久久| 中文字幕国产一区| 99re这里只有精品首页| 日韩一区二区在线看片| 激情综合色综合久久综合| 色婷婷av一区二区三区之一色屋| 亚洲一卡二卡三卡四卡无卡久久 | 欧美大胆人体bbbb| 精品一区二区三区在线观看| 亚洲午夜激情av| 亚洲精品日日夜夜| 国产欧美日韩三级| 欧美韩日一区二区三区| 99久久婷婷国产综合精品电影| 日韩小视频在线观看专区| 国产福利91精品一区| 欧美视频一区二| 另类小说一区二区三区| 91久久久免费一区二区| 日韩精品电影一区亚洲| 亚洲成人av一区二区三区| 午夜欧美2019年伦理| 亚洲精选视频在线| 一区二区三区中文在线观看| 中文字幕在线观看一区| 亚洲欧洲精品成人久久奇米网| 国产精品午夜在线| 国产精品久久久久久久久图文区| 国产午夜精品一区二区三区四区| 久久久久国产一区二区三区四区| av网站免费线看精品| 精品久久久久久久一区二区蜜臀| 成人激情免费网站| 精品国精品国产| 26uuu国产在线精品一区二区| 久久夜色精品国产欧美乱极品| 91在线观看美女| 国产亚洲va综合人人澡精品| 久久精子c满五个校花| 国产精品国产三级国产aⅴ入口| 欧美激情在线看| 综合久久国产九一剧情麻豆| 成人免费一区二区三区视频 | 久久精品一区蜜桃臀影院| 91视频xxxx| 欧美激情综合在线| 中文一区在线播放| 亚洲日本韩国一区| 亚洲一区在线视频观看| 日韩激情一区二区| 欧美色综合天天久久综合精品| 激情欧美日韩一区二区| 欧美一区二区二区| 97久久超碰国产精品| 中文av字幕一区| 亚洲女同一区二区| 日日摸夜夜添夜夜添精品视频| 91国在线观看| 国产成人在线网站| 精品粉嫩超白一线天av| 久久精品一区八戒影视| 亚洲女同女同女同女同女同69| 亚洲香肠在线观看| 精品影视av免费| 日韩欧美的一区| 国产视频在线观看一区二区三区| 亚洲品质自拍视频| 亚洲大片精品永久免费| 国产尤物一区二区在线| www亚洲一区| 国产精品视频线看| 午夜精品福利在线| 欧美二区三区91| 久久久久久一二三区| 亚洲精品成人精品456| 色哟哟在线观看一区二区三区| 国产成人亚洲综合a∨猫咪| 国产片一区二区三区| 一区二区三区精品在线观看| 美女视频黄久久| 精品日产卡一卡二卡麻豆| 国产精品蜜臀在线观看| 日韩精品乱码免费| 91精品一区二区三区久久久久久| 久久香蕉国产线看观看99| 一区二区三区中文在线| 欧美日韩精品电影| 久久精品夜色噜噜亚洲a∨| 亚洲五码中文字幕| 在线播放亚洲一区| 国产精品日产欧美久久久久| 日韩精品免费专区| 亚洲精品在线观看网站| 亚洲精品一卡二卡| 国产一区二区三区四区五区入口 | 国产精品原创巨作av| 中文一区二区在线观看| 午夜伦欧美伦电影理论片| 成人手机在线视频| 亚洲精品一二三| 欧美精品在线观看一区二区| 欧美激情一区二区在线| 奇米影视7777精品一区二区| 精品久久久久99| 亚洲精品成a人| 国产高清一区日本| 亚洲另类春色国产| 欧美精三区欧美精三区| 中文av一区特黄| 久久国产综合精品| 欧美国产综合色视频| 在线观看亚洲成人| 国产三级一区二区三区| 美女视频黄a大片欧美| 中文字幕欧美激情| 91豆麻精品91久久久久久| 久久久久久一级片| 欧美aaaaaa午夜精品| 国产精品婷婷午夜在线观看| 欧美日韩精品福利| 1000部国产精品成人观看| 国产传媒日韩欧美成人| 一区二区在线观看视频| 精品日韩一区二区| 午夜精品视频一区| 久久一区二区三区国产精品| 捆绑紧缚一区二区三区视频| 中文字幕一区二区三区色视频| 在线综合视频播放| 亚洲免费观看高清| 99精品视频一区| 美女精品自拍一二三四| 中文字幕一区二区三区精华液 | 51久久夜色精品国产麻豆| 亚洲精品乱码久久久久久久久 | 亚洲va国产va欧美va观看|