精品久久久久久久久久_欧美香蕉人人人人人人爱_91精品国产免费久久久久久青草_国产亚洲欧美日韩在线观看一区二区

每日經濟新聞
要聞

每經網首頁 > 要聞 > 正文

不只是統計機器!MIT研究人員重磅論文引圍觀:大型語言模型是“世界模型”,甚至有獨立的“時間和空間神經元”

每日經濟新聞 2023-10-06 23:06:38

◎ MIT研究人員發現,大語言模型內部有一個世界模型。

每經記者|蔡鼎    每經編輯|蘭素英    

近年來,大型語言模型(下稱LLMs)的能力不斷提高,引發了各界關于它們是否只是學習了表面的統計規律,還是形成了包含數據生成過程的內在模型(即世界模型)的爭論。近日,來自麻省理工(下稱MIT)的研究人員公布了他們的研究,就此給出了答案。

MIT研究人員Wes Gurnee和Max Tegmark于10月3日提交在預印本arXiv上的論文稱,他們通過分析三個空間數據集(世界、美國、紐約市的地點)和三個時間數據集(歷史人物、藝術作品、新聞標題)在Llama-2系列模型中的學習表征,發現了世界模型的證據。

研究人員發現,LLMs學習了空間和時間的線性表征,并且這些表征在不同的尺度和實體類型(如城市和地標)之間是統一的。此外,作者還識別出了單個的“空間神經元”和“時間神經元”,它們可靠地編碼了空間和時間坐標。論文稱,現代LLMs獲取了關于空間和時間這些基本維度的結構化知識,證明LLMs學習的不僅僅是表面統計規律,而是真正的世界模型。

LLMs中存在“時間和空間神經元”

在空間和時間數據集層面,研究人員在實驗中構建了六個數據集,包含有對應空間或時間坐標的地點或事件的名稱,分別涵蓋了不同的空間或時間尺度,包括全球范圍內的地點、美國國內的地點,以及紐約市范圍內的地點;過去3000年內去世的歷史人物;1950年以來發布的歌曲、電影和書籍;以及2010年至2020年發布的新聞標題。

圖片來源:arXiv網站論文

對于每個數據集,研究人員納入了多種類型的實體,例如城市等人口密集場所和湖泊等自然地標,以研究不同對象類型的統一表征情況。此外,研究人員還維護并豐富了相關的元數據,以便通過更詳細的分類分析數據。

研究人員使用標準的探測技術,即在LLMs的內部激活上擬合一個簡單的模型來預測與輸入數據相關聯的目標標簽。具體來說,給定一個激活數據集A和一個目標Y,包含時間或二維經緯度坐標,作者擬合線性回歸探測器得到一個線性預測器。在未提示過的數據上強大的預測性表明,LLMs中有可被線性解碼出來的空間和時間信息。

作者首先探測了Llama-2-{7B, 13B, 70B}每一層對每個空間和時間數據集的預測性能。結果顯示,在所有數據集上,空間和時間特征都可以被線性探測器恢復,而且這些表達隨著模型規模增大而變得更準確,并且在達到穩定狀態之前,模型前半層的表達質量會平穩提高。例如,他們發現,Llama-2-70B竟然能夠描繪出真實世界的文字地圖。

總結來說,MIT研究人員的研究顯示:LLMs不僅僅是隨機的模型——Llama-2已經是包含世界的詳細模型,甚至包含獨立的“時間神經元”和“空間神經元”!

論文作者之一、MIT研究大模型優化的博士生Wes Gurnee的論文一經arXiv和推特(現X)發布,便引發廣泛關注。其推文概述了論文的內容,截至發稿,已經有近300萬次閱讀。

LLMs學習的空間和時間線性表征在不同實體類型間是統一的

此外,作者還研究了Llama-2的這些空間或時間表征是否對提示詞敏感,即是否可以通過上下文來引發或抑制這些事實回憶。直覺上,對于任何實體詞,自回歸模型都有動機產生一個適合應對任何未來可能的上下文或問題的表達。

為了研究這一點,研究人員創建了新的激活數據集,其中在每個實體詞前加上不同的提示。在所有情況下,作者都包括了一個“空”提示,只包含實體詞(和一個序列開始符號)。然后,作者包括了一個詢問模型回憶相關事實的提示,例如“<地點>的經緯度是多少”或“<作者>的<書籍>發布于何時”。對于美國和紐約市數據集,作者還包括了詢問這個地點在美國或紐約市哪里的提示,試圖消除一些地點名稱的歧義(例如City Hall)。

作為基準的模型,作者囊括了10個隨機提示詞作為提示。為了確定是否可以模糊主題,對于一些數據集,作者將所有實體名稱全部大寫。最后,對于標題數據集,作者嘗試在最后一個詞和在標題后面加上句號兩種情況下進行測試。研究人員發現,顯式地提示模型信息,或者給出消除歧義的提示,對Llama-2的輸出結果幾乎沒有影響。然而,作者驚訝地發現隨機干擾詞和將實體大寫會降低其輸出內容的質量。唯一明顯改善性能的修改是在標題后面加上句號進行探測,這表明句號被用來包含句子結束。

圖片來源:arXiv

Wes Gurnee和Max Tegmark在論文的“討論”章節指出,他們提供的證據表明,LLMs學習的空間和時間線性表征在不同實體類型之間是統一的,并且對提示詞具有相當敏感的反應,而且存在對這些特征高度敏感的單個神經元。由此推論,在模型和數據量足夠大的情況下,LLMs僅靠下一個標記的預測就足以學習世界的文字地圖。

“我們的分析為今后的工作提出了許多有趣的問題。雖然我們表明可以線性地重建樣本在空間或時間中的絕對位置,而且一些神經元使用了這些探測方向,但空間和時間表征的真正范圍和結構仍不清楚。特別是,我們推測這種結構的最典型形式是離散化的分層網狀結構,其中任何樣本都被表示為其最近基點的線性組合。此外,LLMs可以也確實在使用這種坐標系,以線性探針(linear probe)的方式使用正確的基點方向線性組合來表示絕對位置。我們預計,隨著LLMs規模的擴大,這一坐標系將通過更多的基點、更多的粒度以及更精確的實體到模型坐標的映射而得到增強。”研究人員寫道。

Wes Gurnee和Max Tegmark的論文標題 圖片來源:arXiv 

作者還指出,在他們的分析以及更廣泛的研究中,另一個干擾因素是他們的數據集中存在許多模型本身并不知道的“實體”,從而“污染”了他們的激活數據集。

“我們對這些了解空間和時間維度的世界模型是如何學習或使用的理解也僅僅觸及了其表面。在初步的實驗中,我們發現我們的模型在不依賴多步推理的情況下難以回答基本的時空關系問題,這使得因果干預分析變得復雜,但我們認為這是理解何時以及如何使用這些特征的關鍵步驟。”論文作者補充道。

封面圖片來源:視覺中國-VCG111421248465

如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。

美國 大模型

歡迎關注每日經濟新聞APP

每經經濟新聞官方APP

0

0

精品久久久久久久久久_欧美香蕉人人人人人人爱_91精品国产免费久久久久久青草_国产亚洲欧美日韩在线观看一区二区

      国产精品久久久久精k8| 欧美最新大片在线看| 欧美日韩成人在线| 欧美极品xxx| 美女视频第一区二区三区免费观看网站| 懂色av一区二区三区免费观看| 国产精品国产精品国产专区不蜜| 欧美综合亚洲图片综合区| 国产欧美一区二区三区在线老狼| 亚洲国产精品久久不卡毛片| 99这里只有精品| 亚洲国产视频直播| 精品久久一二三区| 五月婷婷激情综合网| 91老司机福利 在线| 色欧美片视频在线观看在线视频| 国产性做久久久久久| 免费av网站大全久久| 中文字幕高清不卡| 777亚洲妇女| 一区二区三区日韩精品视频| 成人小视频免费在线观看| 亚洲图片欧美视频| 亚洲国产精品高清| 国产毛片精品一区| 亚洲精品老司机| 久久综合久久鬼色| 老司机精品视频线观看86| 国产精品久久久久7777按摩| 欧美一区二区三区播放老司机| 亚洲一区二区成人在线观看| 91同城在线观看| 欧美日韩精品一区二区三区蜜桃 | 日日夜夜一区二区| 国产人伦精品一区二区| 欧美挠脚心视频网站| 亚洲一区视频在线| 久久久久亚洲蜜桃| 欧美一三区三区四区免费在线看| 亚洲国产aⅴ天堂久久| 久久精品亚洲麻豆av一区二区| 欧美日韩在线免费视频| 亚洲国产成人porn| 欧美国产一区在线| 欧美tickling网站挠脚心| 男男gaygay亚洲| 亚洲蜜臀av乱码久久精品| 国产日韩欧美a| 国产成人福利片| 天天综合天天做天天综合| 亚洲美女一区二区三区| 久久婷婷综合激情| 欧美一级高清片| 久久99久国产精品黄毛片色诱| 亚洲男同1069视频| 国产精品丝袜在线| 春色校园综合激情亚洲| 欧美日韩精品欧美日韩精品一| 亚洲国产va精品久久久不卡综合| 国产精品麻豆一区二区| 久久久久久影视| 成熟亚洲日本毛茸茸凸凹| 欧美天天综合网| 青青青伊人色综合久久| 一区二区三区自拍| 亚洲精品乱码久久久久久黑人| 国产欧美一区二区三区沐欲 | 日本不卡一区二区三区高清视频| 国产精品国产三级国产aⅴ入口 | 精品剧情在线观看| 国产精品99久| 欧美日韩国产综合一区二区| 全国精品久久少妇| 亚洲午夜私人影院| 亚洲一区二区三区视频在线 | 中文字幕精品—区二区四季| 久久久久久亚洲综合| 成人手机在线视频| 日韩欧美国产电影| 国产精品一区二区无线| 欧美日韩国产天堂| 激情图片小说一区| 欧美性大战久久久久久久蜜臀| 免费在线观看一区二区三区| 色婷婷久久久久swag精品| 日日摸夜夜添夜夜添精品视频| 亚洲综合免费观看高清完整版在线| 1区2区3区精品视频| 国产精品水嫩水嫩| 日韩一区中文字幕| 国产精品久久久久天堂| 国产精品夫妻自拍| 国产精品成人免费在线| 亚洲视频在线一区二区| 亚洲欧洲av色图| 亚洲乱码国产乱码精品精98午夜| 中文字幕一区不卡| 亚洲女与黑人做爰| 一区二区三区免费网站| 亚洲6080在线| 色婷婷久久久亚洲一区二区三区 | 日本一区二区三区国色天香 | 亚洲6080在线| 日韩av一级电影| 欧美在线不卡一区| 国产河南妇女毛片精品久久久| 7777精品伊人久久久大香线蕉经典版下载 | 日本一区二区三区在线观看| 国产精品电影一区二区| 亚洲日本在线天堂| 婷婷六月综合网| 91精彩视频在线| 国产一区二区精品久久99| 91精品国产色综合久久不卡电影| 丰满放荡岳乱妇91ww| 久久久精品一品道一区| 国产日韩欧美综合在线| 亚洲人成人一区二区在线观看| 亚洲男人天堂av网| 日本不卡1234视频| 在线成人免费观看| av不卡免费在线观看| 国产精品拍天天在线| 亚洲欧美另类图片小说| 日韩精品视频网| 宅男噜噜噜66一区二区66| 99久久精品免费看国产免费软件| 中文字幕第一页久久| 亚洲免费伊人电影| 蜜桃视频一区二区三区| 欧美一区二区三区视频在线 | 欧美日本视频在线| fc2成人免费人成在线观看播放| 国产农村妇女精品| 亚洲综合色在线| 精品一区二区三区在线观看| 欧美大胆一级视频| 国产精品夫妻自拍| 日韩电影在线看| 日韩精品一区二区三区在线观看| 国产欧美一区二区在线| 亚洲国产精品人人做人人爽| 欧美午夜精品一区二区三区 | 亚洲成人777| 国产一区在线观看麻豆| 久久久国产一区二区三区四区小说| 国产精品美女久久久久久久网站| 午夜a成v人精品| 日韩一区二区电影| 国产精品夫妻自拍| 久久99久久久久| 国产视频亚洲色图| 亚洲成av人片一区二区三区| 国产成人av一区二区三区在线| 中文av一区二区| 色婷婷久久99综合精品jk白丝| av成人老司机| 亚洲综合一区二区| 欧美精品九九99久久| 欧美经典三级视频一区二区三区| 五月天一区二区| 精品久久一区二区| 一区二区三区成人| 国产69精品久久777的优势| 中文字幕一区二区三区在线不卡 | 亚洲欧美日本韩国| 国内精品自线一区二区三区视频| 国产欧美视频一区二区三区| 亚洲成人在线免费| 99久久久久久99| 婷婷综合五月天| 久久午夜羞羞影院免费观看| 亚洲一区二区三区四区在线| 东方欧美亚洲色图在线| 亚洲一区在线观看网站| 日韩午夜精品视频| 亚洲免费在线播放| 成人动漫在线一区| 五月天久久比比资源色| 久久精品在线观看| 色婷婷久久99综合精品jk白丝| 久久免费的精品国产v∧| 日本成人在线视频网站| 中文字幕精品一区二区三区精品| 欧美在线不卡一区| 中文字幕中文在线不卡住| 久久99久久精品欧美| 亚洲欧美电影一区二区| 91精品麻豆日日躁夜夜躁| 亚洲精品一二三| proumb性欧美在线观看| 天堂在线亚洲视频| 国产日韩一级二级三级| 欧美亚洲日本国产| 1区2区3区国产精品| 成人黄色av电影| 视频在线观看国产精品| 国产精品久久久久久久午夜片| 欧美精品v国产精品v日韩精品| 亚洲婷婷综合久久一本伊一区|