国产一区二区三区不卡免费,人妻无码直播在线a,日韩亚洲欧美中文字幕影音

搜索

大語言模型中的涌現現象是不是偽科學？

2023-06-10 18:20:09 來源：程序員客棧

Datawhale干貨

作者：平凡@知乎，諾桑比亞大學，在讀博士

今天晚上，花了一點兒時間看了兩篇文章：

(相關資料圖)

《Emergent Abilities of Large Language Models》[1]

《PROGRESS MEASURES FOR GROKKING VIA MECHANISTIC INTERPRETABILITY》[2]

這兩篇講的都是emergent behavior，即涌現現象。

大規(guī)模神經網絡下的涌現現象

在機器學習中使用大規(guī)模神經網絡時，由于增加了參數數量、訓練數據或訓練步驟等因素，出現了定性上的新能力和性質，這些能力和性質在小規(guī)模神經網絡中往往是不存在的。

第一篇文章舉了這個例子，每個圖都可以理解為一個任務，橫軸是神經網絡的規(guī)模，而縱軸是準確率，可以理解為模型的性能。

我們拿圖一來看，在10的22次方前，這些模型基本上的性能基本上都很穩(wěn)定在0附近，而在10的22以后，突然在10的24次方上獲得了很大的性能提升，在其他的幾個任務上都表現出類似的特征。

意想不到的效果

第二篇文章更是有趣，我直接把推特一位博主的評論引用在這里：

作者發(fā)現，當我們訓練用網絡計算同余加法 a+b = ? (mod c) 時，網絡在某個時間突然獲得了 100% 準確率。分析發(fā)現，神經網絡實際上“頓悟”了使用傅立葉變換來計算同余加法！這個算法可以證明是正確的，反人類直覺的。

從這倆例子里面我的感受是，只要數據量足夠且真實，且模型沒有硬錯誤的前提下，不斷的訓練說不定真的能夠產生一些意想不到的效果。

還有就是我覺得人類現在積累的知識并不少，但是系統的少，零星的多，如果類似ChatGPT這樣的大模型可以拿所有的人類已有知識進行不斷學習的話，我覺得有很大概率會讓它涌現出意想不到的能力。

甚至可能把人類的生產力解放提前很多。

參考

1.https://arxiv.org/pdf/2206.07682.pdf2.https://arxiv.org/pdf/2301.05217.pdf

標簽：

推薦

大語言模型中的涌現現象是不是偽科學？

Datawhale干貨作者：平凡@知乎，諾桑比亞大學，在讀博士今天晚上，花了

來源： 2023-06-10
全球要聞：曹建南（關于曹建南介紹）

來為大家解答以上的問題。曹建南，建南介紹這個很多人還不知道,現在讓

來源： 2023-06-10
淄川、章丘兩地簽署“審批服務一體化”備忘錄“省會經濟圈”商事登記同城化邁上新臺階世界觀熱點

魯中網淄博6月9日訊(記者車金通訊員孫運芬李文玉)6月8日，濟淄商事登記

來源： 2023-06-10
綜合應用能力a類技巧綜合應用能力a類考什么_全球快消息

1、讀書生活或許正因為哭過笑過才精彩。2、人生也由于這段日子而變的更

來源： 2023-06-10
世界觀速訊丨toto智能馬桶質量怎么樣_toto馬桶怎么樣

1、toto的馬桶的優(yōu)點有：2、TOTO馬桶使用了高級PP材質，因此需要有效地

來源： 2023-06-10
大語言模型中的涌現現象是不是偽科學？

Datawhale干貨作者：平凡@知乎，諾桑比亞大學，在讀博士今天晚上，花了

來源： 2023-06-10
我發(fā)現互聯網工作的性價比還在持續(xù)走低，沒看到好轉的跡象世界快播報

互聯網行業(yè)工作的性價比，越來越低，里面的工作也會變得越來越普通，這

來源： 2023-06-10
誰知道烹土豆片做法?

烹pēng，是在煎或炸的基礎上，烹上清汁入味成菜的一種烹調技法。使用

來源： 2023-06-10
紅酒最佳伴侶是指什么?-天天播報

國內唇齒留香“赤霞珠”搭配伴侶：多種食物和菜系只要留意一下酒瓶上的

來源： 2023-06-10
焦點簡訊:原油

昨日原油開盤反彈上探71 9附近，在回落下探70 2附近，在收盤70 5附近，原

來源： 2023-06-10
淄川、章丘兩地簽署“審批服務一體化”備忘錄“省會經濟圈”商事登記同城化邁上新臺階世界觀熱點

魯中網淄博6月9日訊(記者車金通訊員孫運芬李文玉)6月8日，濟淄商事登記

來源： 2023-06-10
全球要聞：曹建南（關于曹建南介紹）

來為大家解答以上的問題。曹建南，建南介紹這個很多人還不知道,現在讓

來源： 2023-06-10
淄川區(qū)羅村衛(wèi)生院召開“四送四進四提升”健康促進行動部署推進會

魯中網淄博6月9日訊(記者車金通訊員李玲玲)為讓群眾享有更加便利、有效

來源： 2023-06-10
或將6月15日上市領克09大五座版預告圖發(fā)布-環(huán)球簡訊

日前，我們從官方渠道獲取到了領克09大五座版的預告圖，新車預計將在6

來源： 2023-06-10
環(huán)球觀察：淮南市曉勇商貿有限責任公司（關于淮南市曉勇商貿有限責任公司介紹）

來為大家講解以上的問題?；茨鲜袝杂律藤Q有限責任公司，南市曉勇商貿有

來源： 2023-06-10
老款標致2008怎么樣（老款標致307時間怎么調）_每日熱文

來為大家解答以上問題。老款標致2008怎么樣，老款標致307時間怎么調這

來源： 2023-06-10
山東省住建系統 2023 年“安全生產月”活動啟動

2023年6月是全國第二十二個“安全生產月”，近日，山東省住建系統2023

來源： 2023-06-10
周村區(qū)東門路小學：以文學土壤滋養(yǎng)“文明之花”_聚看點

（導語）昨天下午，周村區(qū)東門路小學的校園內熱鬧非凡。伴隨著朗朗讀書

來源： 2023-06-10
31歲歌手古家齊車禍去世，現場曝光車輛嚴重變形，同行女性也身亡|全球新消息

6月9日，據臺媒報道，臺灣知名男歌手古家齊因車禍意外去世，年僅31歲，

來源： 2023-06-10
綜合應用能力a類技巧綜合應用能力a類考什么_全球快消息

1、讀書生活或許正因為哭過笑過才精彩。2、人生也由于這段日子而變的更

來源： 2023-06-10
周村區(qū)東門路小學：以文學土壤滋養(yǎng)“文明之花”

（導語）昨天下午，周村區(qū)東門路小學的校園內熱鬧非凡。伴隨著朗朗讀書

來源： 2023-06-10
馬斯克：推特將向認證創(chuàng)作者支付在評論中投放廣告的收益-信息

月10日消息，推特（Twitter）老板埃隆?馬斯克（Elon Musk）剛剛表示，

來源： 2023-06-10
天天速讀：博納董事長于冬：劇集的崛起是對電影真正的沖擊，不是拼特效的時代了

搜狐娛樂訊（哈麥文）6月10日，第二十五屆上海國際電影節(jié)開幕論壇舉辦

來源： 2023-06-10
【世界新要聞】mathtype怎么用到word2019中 mathtype怎么用

1、打開MathType軟件。2、如果大家電腦上沒有的話，可以先下載一個。3

來源： 2023-06-10
古代公主封號等級劃分古代公主封號等級

1、古代公主是在秦朝時期有封號。2、但是正式記載公主封號的是在漢代以

來源： 2023-06-10
幻燈片母版設置可以起到的作用是什么意思幻燈片母版設置可以起到的作用是_世界快播報

1、WPS演示的母版功能實現幻燈片的背景怎么設置　　新建一個WPS演示文

來源： 2023-06-10
山東開展“露營+”工程讓露營經濟從“網紅”變“長紅”_環(huán)球快訊

“2023好客山東露營季”啟動儀式現場?！±蠲鬈恰z聽蟬鳴、聞清風、觀

來源： 2023-06-10
山東省住建系統 2023 年“安全生產月”活動啟動|最新消息

2023年6月是全國第二十二個“安全生產月”，近日，山東省住建系統2023

來源： 2023-06-10
招商銀行定期存款利率2022最新招商銀行定期存款利率

1、招行智能定期存款利率和整存整取同檔次利率相同，智能定期存款目前

來源： 2023-06-10
夢見別人穿新鞋是什么意思夢見別人穿新鞋是什么意思周公解夢

1、夢見別人穿新鞋這個夢中的鞋子，也很可能是代表了社會地位，或者是

來源： 2023-06-10
世界觀速訊丨toto智能馬桶質量怎么樣_toto馬桶怎么樣

1、toto的馬桶的優(yōu)點有：2、TOTO馬桶使用了高級PP材質，因此需要有效地

來源： 2023-06-10
東北電視劇大全_東北電視劇

1、東北抗戰(zhàn)片電視劇大全，東北抗日聯軍是由李文岐導演王洛勇劉巍巍等

來源： 2023-06-10
禮樂制度的含義_禮樂制度當前速看

1、禮樂制度起源于西周時期，相傳為周公所創(chuàng)建。它和封建制度、宗法制

來源： 2023-06-10
潤際新材過會：今年IPO過關第144家長江保薦過4單

潤際新材過會：今年IPO過關第144家長江保薦過4單---中國經濟網北京6月1

來源： 2023-06-10
面積最大的國家是哪個_面積最大的國家

1、國土面積是國家的土地面積與水域面積之和，每個國家的國土面積都不

來源： 2023-06-10
【快播報】馬斯克：推特將向創(chuàng)作者支付回復中的廣告費用

6月10日，馬斯克發(fā)文表示，推特將很快開始向經過認證的內容創(chuàng)作者支付

來源： 2023-06-10
手握60億元人參卻發(fā)不出工資，“人參之王”咋啦？

手握60億元人參卻發(fā)不出工資，“人參之王”咋啦？---中新網6月10日電曾

來源： 2023-06-10
天天快資訊：上午9點，球王來了！梅西抵達北京，第7次來中國，卻無緣交手國足

賽事主辦方原本讓阿根廷跟國足在北京的工人體育場交手，因沒有得到中國

來源： 2023-06-10
世界消息！正恒動力過會：今年IPO過關第145家東吳證券過5單

正恒動力過會：今年IPO過關第145家東吳證券過5單---中國經濟網北京6月1

來源： 2023-06-10
四川一中學不讓學生帶書離校售賣，“校內3毛/斤，校外6毛/斤”，縣教育局回應世界視訊

據猛犸新聞報道，6月9日，在四川廣安，有網友發(fā)視頻稱，高考結束，鄰水

來源： 2023-06-10
遇見尼山之美｜在尼山，傳統文化超有趣！

金聲玉振、鼓瑟吹笙、煮茶聽雪……這么多傳統文化的“小心思”，真是藏

來源： 2023-06-10
“標準化”賦能綠色低碳發(fā)展 2023青島國際標準化大會啟幕

2023青島國際標準化大會9日在青島國際會議中心開幕。各界人士圍繞“標

來源： 2023-06-10
前5個月我國完成水利建設投資逾4100億元同比增長32.1%_焦點信息

記者9日從水利部了解到，今年1月至5月，我國完成水利建設投資4106億元

來源： 2023-06-10
觀察：電影《天空之城》重映票房破1億

據燈塔專業(yè)版實時數據，截至6月10日13時52分，影片《天空之城》票房突

來源： 2023-06-10
被蚊子咬后第一件事做什么？99%的人都搞錯了......

才六月初就有不少小伙伴被蚊子逼瘋：蚊子你別太離譜！大部分人都急著拍

來源： 2023-06-10
社區(qū)課堂學會手機導航、預約看病

“一共上了6節(jié)課，我學會了用手機導航、付費、預約看病。”最近，家住

來源： 2023-06-10
逛山東預制菜精品展需要帶著什么？

6月9日，第七屆中華老字號（山東）博覽會在濟南在山東國際會展中心開幕

來源： 2023-06-10
全球焦點！劉國梁提拔8人入圍國家隊，15歲小張怡寧入選，陳幸同王一迪師妹

就目前的情況來看，中國乒乓球隊已經成為了世界乒壇的獨一檔了！中國乒

來源： 2023-06-10
熱威電熱過會：今年IPO過第143家海通證券過11.5單_當前速訊

熱威電熱過會：今年IPO過第143家海通證券過11 5單---中國經濟網北京6月

來源： 2023-06-10
夢想中的同事！乒乓球選手陳夢在海信新風空調正式入職？

在青島，陳夢沉浸式體驗“海信人的一天”，與產品經理一起解讀更多更豐

來源： 2023-06-10
法網綜合 | 阿爾卡拉斯意外抽筋焦科維奇晉級決賽

新華社巴黎6月9日電（記者陳毓珊、肖亞卓）2023法國網球公開賽9日進行

來源： 2023-06-10
觀點：青龍圖騰淮上講的什么(青龍圖騰誰先喜歡誰)

青龍圖騰誰先喜歡誰1、第十八章在一起的。《青龍圖騰》主要講述了單超

來源： 2023-06-10
得不到就毀掉！租客拿到6萬補償后“毀壞式”退房被判賠償9萬元！

此后，陳某與張某協商一致，雙方同意解除租賃合同，在陳某向張某支付6

來源： 2023-06-10
全球今亮點！追光 | 明晨，看18年后的伊斯坦布爾續(xù)寫歐冠決賽傳奇

就讓我們屏氣凝神拭目以待記者：韋驊編輯：鄭昕、王沁鷗。

來源： 2023-06-10
22歲女孩拿快遞失聯已第9天她是家里頂梁柱！此前地毯式搜尋無果！

6月9日，河南安陽林州市石板巖鎮(zhèn)22歲女孩郭滿星，于6月1日走山路前往鎮(zhèn)

來源： 2023-06-10

財富更多》

手握60億元人參卻發(fā)不出工資，“人參之王”咋啦？

手握60億元人參卻發(fā)不出工資，“人參之...
熱威電熱過會：今年IPO過第143家海通證券過11.5單_當前速訊

熱威電熱過會：今年IPO過第143家海通證...
世界消息！正恒動力過會：今年IPO過關第145家東吳證券過5單

正恒動力過會：今年IPO過關第145家東吳...
潤際新材過會：今年IPO過關第144家長江保薦過4單

潤際新材過會：今年IPO過關第144家長江...
環(huán)球動態(tài):斗魚美股跌6.48%

斗魚美股跌6 48%---中國經濟網北京6月1...

動態(tài)更多》

熱點