當前位置：科技 >

環球熱資訊！上能考托福、下能玩梗圖的 GPT-4 發布，還有哪些新內容？

文章來源：鈦媒體APP　發布時間： 2023-03-16 06:18:11　責任編輯：cfenews.com

+|-

當地時間 2023 年 3 月 14 日，北京時間 3 月 15 日凌晨，OpenAI 發布了新一代大模型 GPT-4。

大模型就是在 ChatGPT 背后最重要的存在，大模型的性能，直接決定了表現在外、呈現給用戶答案的聰慧程度，因此本次 GPT-4 的發布在數周之前就已經是讓人津津樂道的話題。

【資料圖】

如今，這個能再一次掀起 AI 浪潮的重磅炸彈終于落地，同時帶著三個方向的新改進，試圖進一步加固 OpenAI 在這一領域的統治地位。

長內容識別

首先是 GPT-4 的長內容識別能力：更新迭代之后的 GPT-4 能快速理解最高 2.5萬字輸入內容，同時并整合總結。同時在內容推理能力方面，GPT-4 也遠強于 ChatGPT：在你發送一篇長文或是財報給 GPT-4 后，它不僅能更快的生成梗概總結，同時還能以更加精煉的語言，幫你「抓重點」，簡直是學生黨復習以及分析師看財報的利器。

之前網絡上熱衷于讓 ChatGPT 參加的各種人類考試，現在 OpenAI 也親自下場，帶著 GPT-4 來到了做題家們的主場挑戰：按照 OpenAI 公布的結果，讓 GPT-4 與 ChatGPT 同時參加律師資格考試，前者能拿到前 90% 的成績，而后者雖然能通過測試，但也只能拿到倒數 10% 的排名。如果參加的是生物奧林匹克競賽，兩者的差距還能被進一步拉大。同理，參加人類類似托福、LSAT、GRE 等語言考試也能得到類似的結果。

圖像識別

本次 OpenAI 宣布另一個 GPT-4 升級重點是加入了對輸入圖像內容的支持：GPT-4 能自行理解輸入圖像的內容以及寓意，同時給出準確的回復。比如給衣柜拍張照片，然后要求 GPT-4 生成一份旅行衣物單。或者把你準備好的食材放在桌子上，拍照發給 GPT-4，問問它這些材料能做出什么食物。

GPT-4 能自動識別圖中的食材究竟是什么，并自動根據這些內容給出適當的組合答案。

在官方演示中，GPT-4 甚至還能幫你翻譯梗圖其中的意思：或許下次你在上網沖浪時，如果網友再給你發一些看不懂的梗圖，可以先拿來問問 GPT-4。

但最能展現 GPT-4 圖像識別性能的橋段，可能還是發布視頻中演示的場景：主持人在筆記本上畫出了一個網頁的草稿，然后用手機拍下來，發送給 GPT-4，要求其生成這個網頁的代碼。

緊接著，一個網頁的代碼就出現在 GPT-4 的回復中：這是一個可以直接完整運行的網頁代碼，這一過程僅用了不到兩分鐘，生成網站代碼更是只用了不到十秒鐘。

這場演示，不僅讓人看到 GPT-4 在代碼生成方面的巨大潛力，更會讓人不由得產生一種「人的溝通才是拖慢 GPT-4 運行效率的原因」的感覺。

更安全，更可靠

之前在 ChatGPT 中，一個飽受詬病的問題是它經常會「不懂裝懂」：在涉及到事實性的提問對話中，ChatGPT 有時會一本正經地給出完全錯誤的答案。更嚴重的問題是 ChatGPT 經常還能「引經據典」地佐證自己完全錯誤的結論，甚至回答縝密到能把很多專業作者誤導。這一現象毫無疑問加劇了很多用戶對于 AI 大模型的不信任。

到了 GPT-4 發布時，OpenAI 將回答內容的事實核查作為了本次升級的重點，同時宣稱 ChatGPT 4 更安全，也更加可靠：

換言之，GPT-4 在回復內容的事實核查以及有害內容的阻斷上做出了明顯的改善。OpenAI 也公開承認這要得益于過去 ChatGPT 海量的用戶數據給大模型優化帶來的助力，用越來越多的數據來創建更加強大的語言模型。但 OpenAI 仍然在公告中強調：「我們正在與第三方研究團隊合作，對錯誤答案的潛在影響作出評估」。

以及最重要的是 GPT-4 也與之前發布的 ChatGPT 3.5 相同的問題：GPT-4 儲存的數據截止至 2021 年 9 月，與之前的 GPT 3.5 相同。這仍會在一定程度上限制 GPT-4 的應用場景：比如上面提到的「解釋梗圖」功能，如果 GPT-4 本身不能跟上當前熱點的話，或許也很難準確把握其中的精髓所在。

應用

雖然今天是 OpenAI 的正式發布日，但在此之前作為大股東的微軟已經按耐不住很久了：不僅微軟德國 CTO 在一周前「說漏嘴」表示 GPT-4 即將發布，今天 GPT-4 終于正式發布后，微軟也迫不及待地宣布 New Bing 早已經用上了 GPT-4：并表示「如果你在過去五周內用過（New Bing），那么你其實已經體驗過 GPT-4 的早期版本了」。

不過很多用戶之所以在 New Bing 的使用中沒有感受到和 ChatGPT 明顯的區別，OpenAI 解釋的原因「對話復雜度不夠」，換言之就是日常閑聊提問并不能快速區分出 GPT-4 與 GPT-3.5 的區別，只有當問題足夠復雜、需要同時處理的信息足夠多時，GPT-4 能更好地區分細枝末節的優勢才能體現出來。

除了早早就「走關系」用上 GPT-4 的 Bing，其他與 OpenAI 有合作關系的、首批使用的應用服務與機構也在今天被一并公開：例如語言學習服務多鄰國于今天宣布推出整合 GPT-4 能力的 Duolingo Max 服務，在現有的付費訂閱功能基礎之上還提供問題解答以及錯誤解釋功能。

為視障人士提供服務的公司 Be My Eyes，也宣布將使用 GPT-4，來改變現有的視覺輔助識別服務：他們開始在應用程序中加入基于 GPT-4 開發而來的視覺驅動模塊，測試結果「能產生與人類志愿者相同水平的理解內容」。

按照 OpenAI 的說法，從去年 11 月延續至今的 ChatGPT 全球爆火，他們也「完全沒有預料到」。

他們或許更加沒有預料到，伴隨著 ChatGPT 爆火而來的，是席卷全球的一次 AI 產業革命。今天 GPT-4 的發布無疑是在這堆火焰之上添加了新的燃料。

目前，訂閱 ChatGPT Plus 的用戶已經能先期體驗到 GPT-4，幾乎沒有人會懷疑之后 ChatGPT 的迭代速度會越來越快。

關鍵詞：

更多資訊>>