国产一区二区美女诱惑_国产精品免费播放_91精品国产综合久久香蕉麻豆 _久久精品30_久久综合88_国产精品亚洲成人_黑人极品videos精品欧美裸_亚洲色图欧美激情

原創(chuàng)生活

國內(nèi) 商業(yè) 滾動

基金 金融 股票

期貨金融

科技 行業(yè) 房產(chǎn)

銀行 公司 消費

生活滾動

保險 海外 觀察

財經(jīng) 生活 期貨

當(dāng)前位置:科技 >

透過ChatGPT的進化足跡,OpenAI傳達(dá)了哪些信號?_當(dāng)前熱點

文章來源:鈦媒體APP  發(fā)布時間: 2022-12-14 19:16:18  責(zé)任編輯:cfenews.com
+|-


(資料圖片)

古希臘神話中,一位名叫赫爾墨斯的神,會充當(dāng)人神之間的信使,穿著帶有雙翼的飛鞋,行走在神明與人類之間。

根據(jù)《荷馬史詩》的記載:“在天神中,赫爾墨斯是最喜歡引導(dǎo)凡人前行的。”這句話用來形容OpenAI與AI的關(guān)系,雖不中亦不遠(yuǎn)矣。

上一周,OpenAI打造的ChatGPT出盡風(fēng)頭,成為國內(nèi)外AI領(lǐng)域的頭號熱門話題。關(guān)于ChatGPT的對話能力,大家可能已經(jīng)通過很多文章感受過了。簡單總結(jié),就是對答如流,無所不能,可替程序員寫代碼,可替商務(wù)人士出方案,還能替作家編故事。一度讓久違的 “谷歌已死”“XX職業(yè)又要被AI取代了”之類的AI威脅論說辭,開始大量出現(xiàn)了。

關(guān)于ChatGPT的神奇之處,看多了也有點審美疲勞了,冷靜下來思考一下:

為什么同樣是AIGC,問答、對話這類NLP領(lǐng)域應(yīng)用更容易引起轟動,激發(fā)人們對通用人工智能的希望?

為什么同樣是預(yù)訓(xùn)練模型,相比BERT、GPT3等前輩,ChatGPT的對話能力產(chǎn)生了質(zhì)的飛躍?

為什么同樣是做AI,OpenAI要死磕NLP,從GPT1到 ChatGPT不斷迭代?

OpenAI的CEO、聯(lián)合創(chuàng)始人 Sam Altman曾說過一句話:“Trust the exponential,F(xiàn)lat looking backwards,vertical looking forwards”,相信指數(shù)的力量,平行地向后看,垂直地向前看。ChatGPT出現(xiàn)代表著,AI似乎已經(jīng)站到了指數(shù)級飛躍的關(guān)鍵點上。但起飛的ChatGPT,并不是一蹴而就的。

從GPT到ChatGPT,恰好代表了OpenAI在大模型領(lǐng)域切實走過的歷程,從中可以看到,OpenAI在AI大模型競爭中,已經(jīng)探索出了一條屬于自己的道路,就如同赫爾墨斯一樣,成為引領(lǐng)AI技術(shù)前進的使者。

如果OpenAI是傳遞AI前沿進展的赫爾墨斯,ChatGPT就是那雙帶著雙翼的金絲鞋。我們既要關(guān)注ChatGPT這雙鞋究竟有多神奇,更有必要搞懂,OpenAI選擇的這條大模型道路有何玄機。

今天,中國科技企業(yè)與研究機構(gòu)都在積極投布局大模型,求術(shù)不如問道,我們不妨從GPT這一系列模型的演變歷程,望向OpenAI關(guān)于AI與大模型的戰(zhàn)略思考與發(fā)展脈絡(luò)。

從GPT-1到ChatGPT,超神模型的演化足跡

OpenAI在博客中寫道,ChatGPT 是從 GPT3.5 系列中的模型進行微調(diào)而誕生的。

正如名稱中所暗示的那樣,GPT- 3.5是OpenAI設(shè)計的一系列NLP模型中的第四個,此前還出現(xiàn)了GPT - 1、GPT - 2 和 GPT - 3。

在 GPT 出現(xiàn)之前,NLP 模型主要是基于針對特定任務(wù)的大量標(biāo)注數(shù)據(jù)進行訓(xùn)練。這會導(dǎo)致一些限制:

大規(guī)模高質(zhì)量的標(biāo)注數(shù)據(jù)不易獲得;

模型僅限于所接受的訓(xùn)練,泛化能力不足;

無法執(zhí)行開箱即用的任務(wù),限制了模型的落地應(yīng)用。

為了克服這些問題,OpenAI走上了預(yù)訓(xùn)練大模型的道路。從GPT1到ChatGPT,就是一個預(yù)訓(xùn)練模型越來越大、效果越來越強的過程。當(dāng)然,OpenAI的實現(xiàn)方式并不只是“大力出奇跡”那么簡單。

第一代:從有監(jiān)督到無監(jiān)督GPT-1。2018年,OpenAI推出了第一代生成式預(yù)訓(xùn)練模型GPT-1,此前,NLP任務(wù)需要通過大規(guī)模數(shù)據(jù)集來進行有監(jiān)督的學(xué)習(xí),需要成本高昂的數(shù)據(jù)標(biāo)注工作,GPT-1的關(guān)鍵特征是:半監(jiān)督學(xué)習(xí)。先用無監(jiān)督學(xué)習(xí)的預(yù)訓(xùn)練,在 8 個 GPU 上花費 了1 個月的時間,從大量未標(biāo)注數(shù)據(jù)中增強AI系統(tǒng)的語言能力,獲得大量知識,然后進行有監(jiān)督的微調(diào),與大型數(shù)據(jù)集集成來提高系統(tǒng)在NLP任務(wù)中的性能。

GPT-1的效果明顯,只需要極少的微調(diào),就可以增強NLP模型的能力,減少對資源和數(shù)據(jù)的需求。同時,GPT-1也存在明顯的問題,一是數(shù)據(jù)局限性,GPT-1 是在互聯(lián)網(wǎng)上的書籍和文本上訓(xùn)練的,對世界的認(rèn)識不夠完整和準(zhǔn)確;二是泛化性依然不足,在一些任務(wù)上性能表現(xiàn)就會下降。

第二代:更大更高更強的GPT-2。2019年推出的GPT-2,與GPT-1并沒有本質(zhì)上的不同(注意這一點),架構(gòu)相同,使用了更大的數(shù)據(jù)集WebText,大約有40 GB的文本數(shù)據(jù)、800萬個文檔,并為模型添加了更多參數(shù)(達(dá)到驚人的 15 億個參數(shù)),來提高模型的準(zhǔn)確性,可以說是加強版或臃腫版的GPT-1。

GPT-2的出現(xiàn),進一步證明了無監(jiān)督學(xué)習(xí)的價值,以及預(yù)訓(xùn)練模型在下游NLP任務(wù)中的廣泛成功,已經(jīng)開始達(dá)到圖靈測試的要求,有研究表示,GPT-2生成的文本幾乎與《紐約時報》的真實文章(83%)一樣令人信服。

(GPT-2表現(xiàn))

第三代:跨越式進步的GPT-3。2020年,GPT-3的這次迭代,出現(xiàn)了重大的飛躍,成為與GPT-2迥然不同的物種。

首先,GPT-3的體量空前龐大,擁有超過 1750 億個參數(shù),是GPT-2的 117 倍;其次,GPT-3不需要微調(diào),它可以識別到數(shù)據(jù)中隱藏的含義,并運用此前訓(xùn)練獲得的知識,來執(zhí)行下游任務(wù)。這意味著,哪怕從來沒有接觸過的示例,GPT-3就能理解并提供不錯的表現(xiàn)。因此,GPT-3也在商業(yè)應(yīng)用上表現(xiàn)出了極高的穩(wěn)定性和實用性,通過云上的 API訪問來實現(xiàn)商業(yè)化。這種入得了實驗室、下得了車間的能力,使得GPT-3成為2020年AI領(lǐng)域最驚艷的模型之一。

當(dāng)然,GPT-3也并不完美。正如聯(lián)合創(chuàng)始人 Sam Altman所說,GPT-3的水平仍處于早期階段,有時候也會犯非常愚蠢的錯誤,我們距離真正的人工智能世界還有很長的距離。另外,GPT-3 API 的很多基礎(chǔ)模型非常龐大,需要大量的專業(yè)知識和性能優(yōu)異的機器,這使得中小企業(yè)或個人開發(fā)者使用起來比較困難。

第四代:基于理解而生成的ChatGPT。終于在2022年,OpenAI的預(yù)訓(xùn)練語言模型之路,又出現(xiàn)了顛覆式的迭代,產(chǎn)生了技術(shù)路線上的又一次方向性變化:基于人工標(biāo)注數(shù)據(jù)+強化學(xué)習(xí)的推理和生成。

前面提到,一開始預(yù)訓(xùn)練模型的出現(xiàn),是為了減少監(jiān)督學(xué)習(xí)對高質(zhì)量標(biāo)注數(shù)據(jù)的依賴。而ChatGPT在GPT -3.5大規(guī)模語言模型的基礎(chǔ)上,又開始依托大量人工標(biāo)注數(shù)據(jù)(據(jù)說OpenAI找了40個博士來標(biāo)數(shù)據(jù)),這怎么又走回監(jiān)督學(xué)習(xí)的“老路”了呢?

原因是,GPT 3.5雖然很強,但無法理解人類指令的含義(比如寫一段博文、改一段代碼),無法判斷輸入,自然也就很難給出高質(zhì)量的輸出答案。所以O(shè)penAI通過專業(yè)的標(biāo)注人員(據(jù)說是40個博士)來寫詞條,給出相應(yīng)指令/問題的高質(zhì)量答案,在基于這些數(shù)據(jù)來調(diào)整GPT -3.5的參數(shù),從而讓GPT -3.5具備了理解人類指令的能力。

在人工標(biāo)注訓(xùn)練數(shù)據(jù)的基礎(chǔ)上,再使用強化學(xué)習(xí)來增強預(yù)訓(xùn)練模型的能力。強化學(xué)習(xí),簡單理解就是做對了獎勵、做錯了懲罰,不斷根據(jù)系統(tǒng)的打分來更新參數(shù),從而產(chǎn)生越來越高質(zhì)量的回答。所以這幾天很多人在互動中發(fā)現(xiàn),ChatGPT會承認(rèn)錯誤、會修改自己的答復(fù),這正是因為它具備從人類的反饋中強化學(xué)習(xí)并重新思考的能力。

因為ChatGPT具備了理解能力,所以才被看作是通向通用人工智能AGI的路徑。

當(dāng)然,ChatGPT也并不是完美進化體。OpenAI的官網(wǎng)明確提示,ChatGPT“可能偶爾會生成不正確的信息”,并且“對2021年之后的世界和事件的了解有限”。一些比較難的知識,比如“紅樓夢講了什么”,ChatGPT會一本正經(jīng)地胡說八道。

從GPT模型的演進和迭代中,可以看到OpenAI是不斷朝著自然語言理解這一目標(biāo)前進,用更大的模型、更先進的架構(gòu),最終為通用人工智能找到了一條路徑。

從GPT-1到ChatGPT的縱向演變,會看到OpenAI對大模型的獨特理解與技術(shù)脈絡(luò)——通過模型預(yù)訓(xùn)練提升NLP指標(biāo),抵達(dá)強人工智能。NLP領(lǐng)域究竟特殊在哪里,值得OpenAI如此執(zhí)著?

OpenAI的大模型差異化之路

前文中不難看出,OpenAI對于文本生成模型的執(zhí)著,因為做夠得久、投入夠多,所以能夠做得更好,是非常有長期戰(zhàn)略定力的。

與之相比,和GPT-1同年推出的預(yù)訓(xùn)練模型,還有谷歌發(fā)布的BERT,但后者在火爆一段時間之后影響力明顯減弱;而NLP問答領(lǐng)域一向由Meta引領(lǐng),Meta AI 的 OPT 模型和GPT-3 達(dá)到了同等的參數(shù)量,但效果就不如OpenAI。同期選手中,OpenAI對于語言模型的用心顯然是更多的。

一方面是資源投入,無論是越來越大的模型,需要消耗龐大的算力資源,ChatGPT所需要的高質(zhì)量標(biāo)注數(shù)據(jù),依靠博士級別的專業(yè)人士來完成,比起將數(shù)據(jù)標(biāo)注任務(wù)分發(fā)給眾包平臺,顯然會消耗更多的人力和財力。

另一方面,是技術(shù)投入,大規(guī)模預(yù)訓(xùn)練、增強學(xué)習(xí)等技術(shù)都用在提升NLP對話系統(tǒng)在開放通用領(lǐng)域上的理解和推理能力。NLP是認(rèn)知智能,要提升就必須解決知識依賴,而知識又是非常離散且難以表示的,要解決帶標(biāo)數(shù)據(jù)不足、常識知識不足等問題,是非常具有技術(shù)挑戰(zhàn)的。多年前IBM的Frederick Jelinek就說過:“每當(dāng)我開除一個語言學(xué)家,語音識別系統(tǒng)的性能就會改善一些?!鳖H有種“解決不了問題,就解決提出問題的人”的既視感。所以也可以說,OpenAI選擇了一條更難走的路,去解決真正困難的問題。

此外,聚焦NLP領(lǐng)域也意味著OpenAI會承擔(dān)隱形的機會成本。

今年AIGC(AI生成內(nèi)容)在資本市場和應(yīng)用市場都有很大的進展,與AI作畫、音視頻生成、AlphaFold2所解決的蛋白質(zhì)結(jié)構(gòu)預(yù)測等生成任務(wù)相比,NLP任務(wù)都是直接用詞匯和符號來表達(dá)概念,此類模型通過“API+云服務(wù)”來完成商業(yè)化服務(wù),無論是云資源的消耗量還是接口調(diào)用服務(wù)收費,所獲得的收益也是遠(yuǎn)不及圖像音視頻或科學(xué)計算的。拿同樣的精力做十個八個Dalle模型,肯定能賺得更多。

科技博主王詠剛在博客中分享了一個故事,稱與OpenAI的兩位聯(lián)合創(chuàng)始人交流,發(fā)現(xiàn)這二人甚至不知道AIGC是什么意思!

說到這里,或許可以得出結(jié)論,OpenAI作為一個旨在“實現(xiàn)安全的通用人工智能(AGI)”的公司,就是在不計投入、不計商業(yè)回報,專心致志地通過過預(yù)訓(xùn)練大模型來提升NLP任務(wù)的各項指標(biāo),從而接近AGI的愿景。

為什么OpenAI能夠走出這條引領(lǐng)潮流的大模型差異化之路呢?

一方面是NLP的特殊之處。

NLP 不是魔術(shù),但是,其結(jié)果有時幾乎就是魔術(shù)一般神奇。通用人工智能必須具備認(rèn)知智能,這也是目前制約人工智能取得更大突破和更廣泛應(yīng)用的關(guān)鍵瓶頸,而NLP正是認(rèn)知智能的核心。Geoffrey Hinton、Yann LeCun都曾說過類似的觀點,深度學(xué)習(xí)的下一個大的進展,應(yīng)該是讓神經(jīng)網(wǎng)絡(luò)真正理解文檔的內(nèi)容。

也就是說,當(dāng)AI能理解自然語言了,AGI可能就實現(xiàn)了。

另外,OpenAI的運行模式也起到了關(guān)鍵的影響。

突破性創(chuàng)新早期需要大量的投入,大模型的開發(fā)需要大量的基礎(chǔ)設(shè)施投入,而ChatGPT的對話系統(tǒng)短期內(nèi)很難靠調(diào)用量的規(guī)?;瘉頂偲窖邪l(fā)成本。因此,OpenAI是一個非營利性研究機構(gòu),沒有迫切的商業(yè)化壓力,因此可以更專注于NLP領(lǐng)域的基礎(chǔ)研究,這是商業(yè)型AI公司所很難實現(xiàn)的。

2011年,自然語言領(lǐng)域的泰斗肯尼斯·丘吉(Kenneth Church)發(fā)表了一篇長文《鐘擺擺得太遠(yuǎn)》(A Pendulum Swung Too Far),其中提到:我們這一代學(xué)者趕上了經(jīng)驗主義的黃金時代,把唾手可得的低枝果實采摘下來,留給下一代的都是“難啃的硬骨頭”。

深度學(xué)習(xí)是經(jīng)驗主義的一個新高峰,而這個領(lǐng)域的低枝果實也總有摘完的一天,近年來有大量AI科學(xué)家發(fā)出警告,深度學(xué)習(xí)面臨很多局限性,單純用深度學(xué)習(xí)很難解決一些復(fù)雜任務(wù),或許不用太久,基礎(chǔ)性突破就會成為AI產(chǎn)業(yè)的重要支撐。

GPT的演進也說明了,AI的突破需要循序漸進、從小到大地一步步實現(xiàn),今天,每家AI企業(yè)和研究機構(gòu)都在做大模型,相比CV計算機視覺、數(shù)字人、元宇宙等AI應(yīng)用,NLP要顯得暗淡很多。而如果一窩蜂去摘容易的果實,最終會制約AI深入產(chǎn)業(yè)的腳步。

ChatGPT的出現(xiàn)提醒我們,唯有啃下基礎(chǔ)領(lǐng)域的硬骨頭,才能真正為AI帶來質(zhì)變。

關(guān)鍵詞: 人工智能 深度學(xué)習(xí) 進化足跡 openai chatgpt

專題首頁|財金網(wǎng)首頁

原創(chuàng)
新聞

精彩
互動

獨家
觀察

京ICP備2021034106號-38   營業(yè)執(zhí)照公示信息  聯(lián)系我們:55 16 53 8 @qq.com  財金網(wǎng)  版權(quán)所有  cfenews.com
亚洲女人的天堂| 国产日产精品一区二区三区四区的观看方式 | 又黄又www| 久久伊人蜜桃av一区二区| 丁香花在线电影| 欧美丰满嫩嫩电影| 国产精品毛片在线看| 国产在线69| 欧美亚洲愉拍一区二区| 国产91对白在线观看九色| 美女一区二区在线观看| 国产露出视频在线观看| 91福利在线观看| 99久久99久久综合| 99精品中文字幕在线不卡| 黄色片在线播放| 午夜久久久久久久久| 黄网站免费久久| 91精品一区二区三区综合在线爱| av资源在线看片| 精品一区二区亚洲| 欧美色道久久88综合亚洲精品| 国产精品久久久久无码av| 91p九色成人| 91精彩视频在线播放| 欧美日韩国产在线观看| 亚洲一区二区四区蜜桃| 母乳一区在线观看| 国产欧美日韩免费观看| 先锋影音一区二区| 免费观看亚洲| 51xtv成人影院| 成人在线观看一区| 日韩你懂的在线播放| 精品久久香蕉国产线看观看亚洲| 亚洲大黄网站| 波多野结衣一区| 久久国产成人午夜av影院宅| 四虎影院观看视频在线观看| 亚洲欧美精品一区二区| 欧美一卡二卡三卡四卡| 日韩在线看片| 国产一区二区三区四区五区传媒 | 国产人成精品一区二区三| 欧美日韩网站| 激情文学一区| 欧美在线不卡| 免费在线看一区| 欧美va亚洲va日韩∨a综合色| 日韩精品欧美| 欧美日韩一区二区国产| 欧美区国产区| 日本系列欧美系列| 国产一区二区福利| 91亚洲国产成人精品一区二区三| 91玉足脚交白嫩脚丫在线播放| 成人免费av网站| 中文字幕制服丝袜一区二区三区 | 美女日韩在线中文字幕| 久久久久欧美精品| a亚洲天堂av| 成人av资源站| 精品成人久久av| 欧美成人精品福利| 在线免费国产| 第一福利在线| 久久xxx视频| 成人噜噜噜噜| 加勒比色老久久爱综合网| 亚洲激情亚洲| 久久国产精品区| 亚洲欧美aⅴ...| 精品国产免费视频| 国产午夜在线观看| 91国产精品| 久久成人在线| 亚洲三级在线免费观看| 日韩欧美一级二级三级| 亚洲日韩欧美视频一区| 三级资源在线| 天天做夜夜做人人爱精品| 蜜臀91精品一区二区三区| 亚洲色图欧洲色图| videoxxxx另类日本极品| 欧美xxxx做受欧美护士| 亚洲天堂激情| 91麻豆国产福利精品| 日韩一区二区三区四区五区六区 | 久久中文字幕av一区二区不卡| av动漫一区二区| 亚洲黄色免费三级| 欧美色网在线| 亚洲茄子视频| 国产亚洲精品免费| 视频在线国产| 女人让男人操自己视频在线观看| 亚洲激情偷拍| 亚洲一二三区视频在线观看| 最近中文字幕mv第三季歌词| 成人乱码手机视频| 在线免费高清一区二区三区| 91蝌蚪porny成人天涯| 免费国产视频| 亚洲三级网页| 成人性色生活片| 亚洲日本欧美中文幕| av成人亚洲| 国产视频一区二区在线观看| 亚洲综合色视频在线观看| 欧美在线高清| 国产一区在线看| 日韩美女视频在线| 成人羞羞网站入口| 欧美日韩www| 亚洲调教一区| 欧美一区二区三区啪啪| 天天躁日日躁成人字幕aⅴ| 日本丶国产丶欧美色综合| 一区二区三区国产好| 欧美性xxxxx极品娇小| av不卡一区| 欧美性受xxxx黑人xyx| 色天下一区二区三区| 国产视频青青| 日韩精品久久理论片| 成年人视频在线免费观看| 99精品一区二区| 亚洲精品国产第一综合99久久 | 欧美一区二区在线播放| 久久成人福利| 亚洲电影av在线| 国内精品免费在线观看| 亚洲奶水xxxx哺乳期| 一区二区高清免费观看影视大全 | 亚洲欧美日韩中文字幕一区二区三区| 僵尸再翻生在线观看| 亚洲国产一区二区在线播放| 色老板在线视频一区二区| 日韩欧美在线观看一区二区三区| 中文字幕一区二区三区久久网站| 一级在线观看| 国产精品久久久久久久久动漫| 精品国内亚洲2022精品成人| 亚洲精品久久在线| 91论坛在线播放| 欧美日韩播放| 福利小视频在线观看| 黑人精品xxx一区一二区| 鲁大师成人一区二区三区| 国产美女高潮在线观看| 91精品国产综合久久婷婷香蕉 | 成人看片免费| 国产精品久久久久9999高清| 黄a在线观看| 欧美三级三级三级| 黑人精品欧美一区二区蜜桃| 激情久久一区二区| 人成网站免费观看| 一区二区三区四区在线免费观看| 色男人天堂综合再现| av中文在线资源| 丁香婷婷激情| 一本大道av一区二区在线播放| 国产最新精品免费| 欧美成人首页| 亚洲大奶少妇| 国产资源在线观看入口av| 日本ー区在线视频| 久久99在线观看| 国产日本亚洲| 日韩精品系列| 国产精品久久综合| 在线日本成人| 麻豆福利在线观看| 黄色av免费| 欧美色播在线播放| 懂色一区二区三区免费观看| 免费黄色成人| 国产精品扒开腿做爽爽爽视频软件| 裸体网站视频| 欧美精品1区2区| 亚洲日本va在线观看| 美女精品在线观看| 3d欧美精品动漫xxxx无尽| 免费在线超碰| 亚洲欧洲美洲在线综合| 色综合天天在线| 精品无人区卡一卡二卡三乱码免费卡 | 亚洲视频国产视频| 欧美日韩一区二区三区视频| 欧美激情一区二区三区| 国产精品毛片一区二区三区| 色婷婷综合久久久中字幕精品久久| 中文av在线播放| 色8久久精品久久久久久蜜 | 亚洲成人网久久久| 欧美午夜不卡视频| 图片区小说区区亚洲影院| 国产农村妇女毛片精品久久麻豆| 日韩亚洲国产精品|