當地時間 2023 年 3 月 14 日,北京時間 3 月 15 日凌晨,OpenAI 發布了新一代大模型 GPT-4。
大模型就是在 ChatGPT 背后最重要的存在,大模型的性能,直接決定了表現在外、呈現給用戶答案的聰慧程度,因此本次 GPT-4 的發布在數周之前就已經是讓人津津樂道的話題。
【資料圖】
如今,這個能再一次掀起 AI 浪潮的重磅炸彈終于落地,同時帶著三個方向的新改進,試圖進一步加固 OpenAI 在這一領域的統治地位。
長內容識別
首先是 GPT-4 的長內容識別能力:更新迭代之后的 GPT-4 能快速理解最高 2.5萬字輸入內容,同時并整合總結。同時在內容推理能力方面,GPT-4 也遠強于 ChatGPT:在你發送一篇長文或是財報給 GPT-4 后,它不僅能更快的生成梗概總結,同時還能以更加精煉的語言,幫你「抓重點」,簡直是學生黨復習以及分析師看財報的利器。
之前網絡上熱衷于讓 ChatGPT 參加的各種人類考試,現在 OpenAI 也親自下場,帶著 GPT-4 來到了做題家們的主場挑戰:按照 OpenAI 公布的結果,讓 GPT-4 與 ChatGPT 同時參加律師資格考試,前者能拿到前 90% 的成績,而后者雖然能通過測試,但也只能拿到倒數 10% 的排名。 如果參加的是生物奧林匹克競賽,兩者的差距還能被進一步拉大。同理,參加人類類似托福、LSAT、GRE 等語言考試也能得到類似的結果。
圖像識別
本次 OpenAI 宣布另一個 GPT-4 升級重點是加入了對輸入圖像內容的支持:GPT-4 能自行理解輸入圖像的內容以及寓意,同時給出準確的回復。比如給衣柜拍張照片,然后要求 GPT-4 生成一份旅行衣物單。或者把你準備好的食材放在桌子上,拍照發給 GPT-4,問問它這些材料能做出什么食物。
GPT-4 能自動識別圖中的食材究竟是什么,并自動根據這些內容給出適當的組合答案。
在官方演示中,GPT-4 甚至還能幫你翻譯梗圖其中的意思:或許下次你在上網沖浪時,如果網友再給你發一些看不懂的梗圖,可以先拿來問問 GPT-4。
但最能展現 GPT-4 圖像識別性能的橋段,可能還是發布視頻中演示的場景:主持人在筆記本上畫出了一個網頁的草稿,然后用手機拍下來,發送給 GPT-4,要求其生成這個網頁的代碼。
緊接著,一個網頁的代碼就出現在 GPT-4 的回復中:這是一個可以直接完整運行的網頁代碼,這一過程僅用了不到兩分鐘,生成網站代碼更是只用了不到十秒鐘。
這場演示,不僅讓人看到 GPT-4 在代碼生成方面的巨大潛力,更會讓人不由得產生一種「人的溝通才是拖慢 GPT-4 運行效率的原因」的感覺。
更安全,更可靠
之前在 ChatGPT 中,一個飽受詬病的問題是它經常會「不懂裝懂」:在涉及到事實性的提問對話中,ChatGPT 有時會一本正經地給出完全錯誤的答案。更嚴重的問題是 ChatGPT 經常還能「引經據典」地佐證自己完全錯誤的結論,甚至回答縝密到能把很多專業作者誤導。這一現象毫無疑問加劇了很多用戶對于 AI 大模型的不信任。
到了 GPT-4 發布時,OpenAI 將回答內容的事實核查作為了本次升級的重點,同時宣稱 ChatGPT 4 更安全,也更加可靠:
換言之,GPT-4 在回復內容的事實核查以及有害內容的阻斷上做出了明顯的改善。OpenAI 也公開承認這要得益于過去 ChatGPT 海量的用戶數據給大模型優化帶來的助力,用越來越多的數據來創建更加強大的語言模型。但 OpenAI 仍然在公告中強調:「我們正在與第三方研究團隊合作,對錯誤答案的潛在影響作出評估」。
以及最重要的是 GPT-4 也與之前發布的 ChatGPT 3.5 相同的問題:GPT-4 儲存的數據截止至 2021 年 9 月,與之前的 GPT 3.5 相同。這仍會在一定程度上限制 GPT-4 的應用場景:比如上面提到的「解釋梗圖」功能,如果 GPT-4 本身不能跟上當前熱點的話,或許也很難準確把握其中的精髓所在。
應用
雖然今天是 OpenAI 的正式發布日,但在此之前作為大股東的微軟已經按耐不住很久了:不僅微軟德國 CTO 在一周前「說漏嘴」表示 GPT-4 即將發布,今天 GPT-4 終于正式發布后,微軟也迫不及待地宣布 New Bing 早已經用上了 GPT-4:并表示「如果你在過去五周內用過(New Bing),那么你其實已經體驗過 GPT-4 的早期版本了」。
不過很多用戶之所以在 New Bing 的使用中沒有感受到和 ChatGPT 明顯的區別,OpenAI 解釋的原因「對話復雜度不夠」,換言之就是日常閑聊提問并不能快速區分出 GPT-4 與 GPT-3.5 的區別,只有當問題足夠復雜、需要同時處理的信息足夠多時,GPT-4 能更好地區分細枝末節的優勢才能體現出來。
除了早早就「走關系」用上 GPT-4 的 Bing,其他與 OpenAI 有合作關系的、首批使用的應用服務與機構也在今天被一并公開:例如語言學習服務多鄰國于今天宣布推出整合 GPT-4 能力的 Duolingo Max 服務,在現有的付費訂閱功能基礎之上還提供問題解答以及錯誤解釋功能。
為視障人士提供服務的公司 Be My Eyes,也宣布將使用 GPT-4,來改變現有的視覺輔助識別服務:他們開始在應用程序中加入基于 GPT-4 開發而來的視覺驅動模塊,測試結果「能產生與人類志愿者相同水平的理解內容」。
按照 OpenAI 的說法,從去年 11 月延續至今的 ChatGPT 全球爆火,他們也「完全沒有預料到」。
他們或許更加沒有預料到,伴隨著 ChatGPT 爆火而來的,是席卷全球的一次 AI 產業革命。今天 GPT-4 的發布無疑是在這堆火焰之上添加了新的燃料。
目前,訂閱 ChatGPT Plus 的用戶已經能先期體驗到 GPT-4,幾乎沒有人會懷疑之后 ChatGPT 的迭代速度會越來越快。
關鍵詞: