国产一区二区美女诱惑_国产精品免费播放_91精品国产综合久久香蕉麻豆 _久久精品30_久久综合88_国产精品亚洲成人_黑人极品videos精品欧美裸_亚洲色图欧美激情

原創生活

國內 商業 滾動

基金 金融 股票

期貨金融

科技 行業 房產

銀行 公司 消費

生活滾動

保險 海外 觀察

財經 生活 期貨

當前位置:科技 >

通曉萬物的GPT,能理解它自己嗎?-全球球精選

文章來源:鈦媒體APP  發布時間: 2023-06-21 10:18:37  責任編輯:cfenews.com
+|-

ChatGPT的橫空出世讓人們認識到了語言模型的強大,其功能也會隨著版本的迭代而進一步完善,也必將更深入地參與到人們的工作與生活之中。然而,我們并不能完全理解這些模型是如何運作的。最近一些研究讓人們厘清了小規模模型的機理,但要完全理解語言模型,則需要分析數百萬個神經元。

OpenAI的研究團隊嘗試使用GPT-4自動編寫大型語言模型中神經元行為的解釋,并對這些解釋進行評分。他們研究的對象是早一代模型GPT-2,研究為GPT-2中的每個神經元給出了(或許不完美的)解釋和評分。

?圖源:OpenAI官網


(資料圖片)

運作過程

在這項研究中,科學家旨在解釋文本中的哪些模式會導致神經元激活。這具體包括解釋、仿真、評分三個步驟。

1. 解釋:使用GPT-4解釋神經元的激活

給出一個GPT-2神經元,通過向GPT-4展示相關文本序列和GPT-2神經元的激活來生成對其行為的解釋。

?在這個例子中,研究者研究了神經元“Marvel comics vibes”。研究者將其展示給GPT-4,GPT-4對此給出的解釋是“references to movies, characters, and entertainment.”

2. 仿真:以上一步的解釋為條件,使用GPT-4模擬神經元激活

再次使用GPT-4進行仿真模擬,以解釋被激活的神經元會做什么。

3. 評分:通過對比神經元的仿真激活和真實激活來對第一步解釋進行評分

?比較仿真激活(左)和真實激活(右)以查看二者的匹配程度,上面例子的“解釋得分”為0.34

上述方法讓研究者可以利用GPT-4來定義定量描述可解釋性的指標(即“解釋得分”)并自動測算,藉此研究者就可以衡量語言模型使用自然語言壓縮和重建神經元激活的能力。使用上述定量評分框架,研究者可以衡量其方法在神經網絡不同部分的工作情況,并針對目前無法充分解釋的部分的方法進行改進。例如,研究者發現現有技術對于較大的模型效果不佳,可能是因為難以對更深層神經網絡進行解釋。

盡管研究中絕大多數解釋的得分很低,但研究者相信現在可以利用機器學習技術來進一步提高其產生解釋的能力。例如,他們發現可以通過以下方式提高解釋分數:

· 迭代解釋。研究者要求GPT-4提出可能的反例,然后據此修改解釋。

· 使用更有效的模型來給出解釋。解釋得分的平均值隨著解釋器模型能力的提高而上升,其中GPT-4獲得的分數最高。然而,即使是GPT-4給出的解釋尚不及人類的表現,這也說明模型還有改進的余地。

· 更改已解釋模型的架構。訓練具有不同激活函數的模型可以提高解釋得分。

研究者們將開源他們的數據集和可視化工具,這些工具可以利用GPT-4對GPT-2中所有的307200個神經元給出解釋,同時將開源解釋和評分所使用的代碼,這些部分使用的是OpenAI API上公開的模型。研究者希望學界能夠開發出新的技術來生成得分更高的解釋,以及可以更好地利用對神經元的解釋來探索GPT-2。

研究人員還發現,超過1000個神經元的解釋得分至少為0.8,這意味著根據GPT-4,它們解釋了神經元的大部分上層激活行為。大多數能被上述方法很好解釋的神經元都不是很有趣。然而,研究人員們也發現了許多GPT-4不理解的有趣神經元。他們希望隨著解釋工作的進一步改進,能夠快速發現對模型計算而言更為有趣的定性理解。

不過值得一提的是,上面的方法目前還有很多局限性:

首先,當前的研究專注于簡短的自然語言解釋,但神經元可能具有非常復雜的行為,無法進行簡潔的描述。例如,神經元可能是高度多義的(代表許多不同的概念),或者可以代表人類不理解或無法用語言表達的某一概念。

其次,研究者希望最終可以實現自動找尋并解釋包括神經元和多頭注意力機制*在內的實現復雜行為的整個神經回路。當前的方法僅僅是將神經元行為解釋為原始文本輸入的函數,而沒有說明其下游影響。例如,一個在句號上激活的神經元可能指示下一個單詞應該以大寫字母開頭,或者遞增某個語句計數器。

*注意力機制是一種模仿人類視覺和認知系統的方法,可幫助神經網絡集中注意力于相關的部分,從而提高模型的性能和泛化能力。多頭注意力機制使用多個獨立的注意力頭,分別計算注意力權重,并將它們的結果進行拼接或加權求和,從而獲得更豐富的表示。

第三,上述研究解釋了神經元的行為,但沒有試圖解釋產生這種行為的機制。這意味著即使是高分解釋在分布外的文本上也可能表現得很差,因為得分本質上只是一種相關性的描述。

此外,整個過程是計算密集型的,需要有強大的算力作為支撐。

未來展望

雖然有以上所述的種種局限性,但研究人員仍然相信這項工作可以大大改進并與其他現有方法進行有效的集成。比如,將常見可解釋性技術(例如多頭注意力機制、消融實驗*等)集成到上述自動化方法中。

*消融實驗類似于“控制變量法”,通過破壞或消除某個特定的組織或結構,以研究其功能、作用或重要性。

從長遠來看,研究者設想解釋器模型可以生成、測試和迭代素材豐富的有關主題模型的假設空間,其作用類似于今天進行可解釋性研究的科研人員所做的工作。這種模型將包括關于神經網絡回路功能和分布外行為的假設。解釋器模型的工作環境可能包括訪問代碼執行、主題模型可視化以及與研究人員交互等。

研究人員相信,上述研究有助于我們建立起高層次的視角,來理解轉換器語言模型內部正在發生的一切。通過可訪問解釋性數據庫的用戶界面,我們可以開啟一種更宏觀的方法,幫助研究人員可視化成千上萬個神經元,進而查看它們之間相互作用的高級模式。

總而言之,科學家希望從使用較小且可信賴的輔助工具出發,擴展到實現完整的可解釋性審核;或者在將這些輔助工具用于可解釋性研究的過程中充分了解模型的工作原理,從而幫助我們開發更強大的審核方法。畢竟,如果我們不知道輔助工具本身是否值得信賴,那么使用強大的輔助工具也可能會使問題變得更加復雜。

參考資料:

[1] Chughtai, B., Chan, L., & Nanda, N. (2023). A toy model of universality: Reverse engineering how networks learn group operations. arXiv preprint arXiv:2302.03025.[2] Wang, K., Variengien, A., Conmy, A., Shlegeris, B., & Steinhardt, J. (2022). Interpretability in the Wild: a Circuit for Indirect Object Identification in GPT-2 small. arXiv preprint arXiv:2211.00593.[3] Bills, et al. (2023). Language models can explain neurons in language models. https://openaipublic.blob.core.windows.net/neuron-explainer/paper/index.html.[4] Zhong, R., Snell, C., Klein, D., & Steinhardt, J. (2022, June). Describing differences between text distributions with natural language. In International Conference on Machine Learning (pp. 27099-27116). PMLR.[5] Singh, C., Morris, J. X., Aneja, J., Rush, A. M., & Gao, J. (2022). Explaining patterns in data with language models via interpretable autoprompting. arXiv preprint arXiv:2210.01848.[6] OpenAI (2023). GPT-4 Technical Report. arXiv preprint arXiv:2303.08774.[7] Bau, D., Zhou, B., Khosla, A., Oliva, A., & Torralba, A. (2017). Network dissection: Quantifying interpretability of deep visual representations. In Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 6541-6549).[8] Chan, L., Garriga-Alonso, A., Goldowsky-Dill, N., Greenblatt, R., Nitishinskaya, J., Radhakrishnan, A., ... & Thomas, N. (2022, December). Causal scrubbing: A method for rigorously testing interpretability hypotheses. In Alignment Forum.[9] Hernandez, E., Schwettmann, S., Bau, D., Bagashvili, T., Torralba, A., & Andreas, J. (2022, January). Natural language descriptions of deep visual features. In International Conference on Learning Representations.[10] Hubinger, E. (2021). Automating auditing: An ambitious concrete technical research proposal.[11] Shah, R., Varma, V., Kumar, R., Phuong, M., Krakovna, V., Uesato, J., & Kenton, Z. (2022). Goal misgeneralization: Why correct specifications aren"t enough for correct goals. arXiv preprint arXiv:2210.01790.[12] Ngo, R. (2022). The alignment problem from a deep learning perspective. arXiv preprint arXiv:2209.00626.[13] Hubinger, E., van Merwijk, C., Mikulik, V., Skalse, J., & Garrabrant, S. (2019). Risks from learned optimization in advanced machine learning systems. arXiv preprint arXiv:1906.01820.

關鍵詞:

專題首頁|財金網首頁

投資
探索

精彩
互動

獨家
觀察

京ICP備2021034106號-38   營業執照公示信息  聯系我們:55 16 53 8 @qq.com 關于我們 財金網  版權所有  cfenews.com
国产一区二区三区在线观看免费视频| 国产毛片一区二区三区| 曰本一区二区| 少妇精品久久久一区二区三区| 91视频精品| 日本不卡一区二区| 91视频在线观看免费| 亚洲在线观看免费视频| 91麻豆精品国产91久久久久| 亚洲久久久久久久久久久| 天天av综合网| 欧美hdxxxxx| 国产精品白浆| 韩日精品视频| av不卡在线观看| 五月婷婷激情综合网| 精品日产卡一卡二卡麻豆| 在线观看h网址| 成人性教育av免费网址| 奇米色欧美一区二区三区| 蜜臀av国产精品久久久久 | 精品1区2区3区4区| 国产不卡一区视频| 欧美日韩国产综合新一区| 日韩精品免费在线视频观看| 国产人成网在线播放va免费| 欧美高清一级片| 一区免费视频| 亚洲国产精品99久久久久久久久| 在线不卡a资源高清| 久草视频视频在线播放| 亚洲精品伊人| 久久综合激情| 亚洲 欧美综合在线网络| 蜜桃视频网站www| 欧美日韩精品免费观看视完整| 大片网站久久| 2024国产精品视频| 精品久久久久av影院| 1区2区在线观看| 国产一区二区三区电影在线观看 | 国产亚洲自拍一区| 91精品国产综合久久久久久久久久| 九色蝌蚪在线| 欧美亚洲色图校园春色| 国产91露脸合集magnet| 91久久精品网| 在线观看免费黄色| 国产精品片aa在线观看| 99视频在线观看一区三区| 欧美一级日韩一级| 女人天堂av在线播放| 欧美有码视频| 悠悠色在线精品| 另类av导航| 国内精品国产成人国产三级粉色| 国产一区二区久久| 欧美日韩国产成人在线免费| av网址在线看| 中文精品电影| 亚洲午夜国产一区99re久久| 久久经典视频| 欧美精选一区二区三区| 国产网站一区二区三区| 久草.com| 欧美美女在线直播| 国产欧美视频在线观看| 美日韩在线观看| 欧美黄色网视频| 久久精品夜色噜噜亚洲a∨| 亚洲欧美日韩精品久久亚洲区| 国产一区一一区高清不卡| 麻豆国产91在线播放| 欧美日韩亚洲综合在线 欧美亚洲特黄一级 | 羞羞视频在线观看免费| 亚洲久色影视| 欧美特级限制片免费在线观看| 伊人电影在线观看| 国产欧美精品久久| 欧美性三三影院| 欧美gay视频| 韩国成人精品a∨在线观看| 日本伊人色综合网| 波波电影院一区二区三区| 日韩高清国产一区在线| 久久亚洲精华国产精华液| 一本色道a无线码一区v| 美女日批视频在线观看| 国产精品久久久免费| 欧美精品xxxxbbbb| 99精品在线免费观看| 成人国产精品免费| 午夜免费性福利| 四虎成人av| 欧美性videosxxxxx| 日日夜夜亚洲精品| 国产亚洲欧美日韩在线一区| 久久视频www| 久久久国产精品一区二区中文| 欧美xxxxx牲另类人与| 日韩免费高清视频网站| 国产精品成人免费| 国产精品—色呦呦| 美女国产精品| 久久久久久99精品| 日本综合在线| 久久国产精品色| 偷偷要色偷偷| 亚洲高清自拍| 精品视频久久久| 国产精品久久久久久麻豆一区软件 | 深夜福利视频一区| 中国女人久久久| 亚洲国产欧美一区二区三区同亚洲| 亚洲人挤奶视频| 色94色欧美sute亚洲13| 激情不卡一区二区三区视频在线| 中文字幕一区二区三区在线不卡| 羞羞污视频在线观看| gogo大胆日本视频一区| 欧美天天影院| www..com久久爱| 超碰在线免费播放| 久久久久久99久久久精品网站| www视频在线看| 91看片淫黄大片一级在线观看| 超碰在线免费播放| 久久久亚洲精品一区二区三区| 日本色护士高潮视频在线观看| 91一区二区三区在线播放| а天堂中文在线官网| 久久综合av免费| 日本黄色免费在线| 亚洲天堂精品在线观看| 丁香婷婷久久| 欧美日韩国产综合新一区| 国内精品国产成人国产三级粉色| 欧美制服丝袜第一页| 精品国产美女| 亚洲二区中文字幕| 国产精品美女久久久浪潮软件| 宅男午夜电影| 国产福利一区在线| 不卡av免费观看| 亚洲一区二区三区在线看| 免费成人高清在线视频| 色狠狠综合天天综合综合| 精品国产精品久久一区免费式| 亚洲精品一区二区在线| 久久久噜噜噜| a√资源在线| 中文字幕中文字幕一区二区| 国产一精品一av一免费爽爽| 欧美午夜在线一二页| 你懂的视频一区二区| 天天影视色香欲综合| 狠狠色狠狠色综合系列| 草美女在线观看| 亚洲v中文字幕| 成人嘿咻视频免费看| 激情乱色小说视频| 成人综合婷婷国产精品久久免费| 嗯啊主人调教在线播放视频| 亚洲18女电影在线观看| 日韩国产一区二区三区| 色佬视频在线观看| 久久久久亚洲蜜桃| 97超碰成人| av一卡二卡| 91看片淫黄大片一级在线观看| 国产一区二区av在线| 亚洲精品福利免费在线观看| 激情伊人五月天久久综合| 日韩影片中文字幕| 欧美一卡在线观看| 日本vs亚洲vs韩国一区三区二区| 欧美78videosex性欧美| 在线观看亚洲精品| 久久精品日产第一区二区| 欧美男体视频| 国产高潮av| 在线播放欧美女士性生活| 美女视频免费一区| 午夜视频一区二区在线观看| 成人性爱视频在线观看| 久久久久久**毛片大全| 亚洲国产伊人| 一个人看的www一区| 91黄色免费网站| 国产成a人亚洲精| 国语一区二区三区| 男人的天堂在线视频免费观看 | 风间由美一区二区av101| 欧美v日韩v国产v| 丁香激情综合五月| 麻豆精品99| 国产网友自拍电影在线| 亚洲中国最大av网站| 日韩天堂av| 色综合久久久|