上線不到一周日活躍用戶破百萬,2個月破億……
【資料圖】
OpenAI的AI聊天機器人ChatGPT火爆全球,成為現象級消費類AI應用,并由此引發新一輪的AI競賽。
率先卷起來地,當屬搜索賽道:
谷歌發布基于谷歌LaMDA大模型的下一代對話AI系統Bard;
百度官宣了正在研發的文心一言(ERNIE Bot)項目計劃在3月完成內測;
微軟推出由ChatGPT支持的最新版本Bing(必應)搜索引擎和Edge瀏覽器。
ChatGPT為什么會如此出圈?應用在搜索領域乃至其他領域又有哪些壁壘和挑戰?
ChatGPT“出圈”源自底層技術突破
受益于長年AI技術研發積累、深度學習技術突破、算力提升、大數據積累等因素,ChatGPT的出現讓所有搜索巨頭倍感壓力:
一方面是因為搜索的產品模式多年來的變化不大;另一方面則是因為ChatGPT展現出的對話能力讓人心驚,畢竟“聊天機器人+搜索引擎+文本生成器”太像一場降維式打擊。
Google Gmail的創始人Paul Buchheit也說:ChatGPT將像搜索引擎殺死黃頁一樣摧毀谷歌。
面對可能的未來,微軟打出的牌是“新必應”。
由OpenAI提供技術支持的新必應在吸取了 ChatGPT 和 GPT-3.5 的重要經驗和進步上,開發了名為Prometheus(普羅米修斯)的新模型,讓回答結果更相關、更及時和更有針對性,同時提高安全性。
同時,新必應加入了基于實時信息的最新結果(此前ChatGPT的模型訓練僅涵蓋到2021年)。在功能體驗上的升級則主要包含,“問答搜索”功能被直接嵌入搜索引擎,以及人工智能聊天模式的切換。
目前來看ChatGPT之于搜索引擎的技術價值,更多是“加持”和“增強”,幫助人們從搜索和網絡中更快速地獲取更為準確的結果,至于“摧毀谷歌”的言論則更像是一種產品方向,而非具體結果。
甚至,陷入焦慮的并不止“谷歌們”,越來越多的普通人開始擔心自己的工作會不會被人工智能取代,畢竟,隨著技術發展的加速,它將持續應用于社會經濟與行業的更多實際場景,一時間,程序員、設計師、市場研究分析師、廣告媒體行業、新聞行業等似乎都成了“高危職業”。
真的如此嗎?
為預訓練大模型引入更多模態
ChatGPT的出現意味著自然語言理解技術邁上了新臺階,理解能力、語言組織能力、持續學習能力更強,其驚艷的用戶體驗源自于背后強大基座模型,技術層面上,Chat不是重點,GPT(Generative Pre-training Transformer,預訓練生成模型)才是。
特別是預訓練大模型表現出的理解能力、語言組織能力以及持續學習能力,已經開始顯示出它成為社會智能基礎設施的趨勢,即少量企業通過預訓練大模型的能力與產品為大量企業基于提供基于此的個人消費及行業應用。
具體來說,絕大多數B端企業及研究機構對人工智能的使用需要遵循算法、算力和數據三位一體的研究范式,即以一定的算力和數據為基礎,使用開源算法框架訓練智能模型,這直接產生了高昂的技術成本和應用門檻,而面對千行百業中碎片化、多樣化、長尾化的下游應用需求,模型通用性、泛化性差的問題更加突出。
AI 預訓練大模型模式通過“預訓練大模型+下游任務微調”的方式,可以有效地從大量標記和未標記的數據中捕獲知識,極大地擴展了模型的泛化能力。
應用視角下,“大規模”和“預訓練”的兩種屬性意味著預訓練大模型可以通過非常低成本的微調快速適應新的產業、領域、行業,實現跨模態、全鏈路的知識積累、沉淀、傳播、復用。
特別是行業級應用意味著將有更專業、更復雜、更多變的應用場景,需求的呈現可能包括畫面、聲音、視頻等多樣的形態,僅僅基于自然語言的大模型并不能夠滿足各種行業場景中的個性化需求。那么,在語言理解之上引入圖像、音頻和視頻等模態,讓“ChatGPT”擁有語言思維的同時,還能夠被賦予眼睛,那將會是什么樣的新物種?
甚至有點《流浪地球2》的MOSS那味了。
聯匯科技自2019年已經將預訓練大模型的創新要點錨定在跨模態領域。
自研OmModel多模態預訓練大模型是業界最早的語言增強視覺識別模型之一,基于大規模自監督學習的多模態人工智能算法,融合語言和視覺模態理解,實現下一代認知域人工智能應用場景落地。
已完成基于行業的億級圖片、萬級視頻、十億級圖文大規模預訓練,用更小的標注樣本數量,融合更多的模態信息,獲得更為準確的AI模型。
OmModel是百億級參數大模型,識別精準度大幅度提高,訓練數據成本降低90%,開發周期由平均3個月縮短為10天,可有效覆蓋大量長尾應用場景。實現億級多模態數據秒級匹配,匹配速度在GPU環境提高5倍以上、在CPU環境提高300倍以上,推理速度提高5倍以上,大幅度降低多模態大模型部署成本。
OmModel不僅是國內首個通過工信部信通院大規模預訓練模型系統檢驗的大模型項目,在多模態技術能力和平臺能力方面表現優異,并作為技術平臺提供方參與工業和信息化部、科學技術部共同主辦的首屆“興智杯”全國人工智能創新應用大賽,更為運營商、電力能源等各行業參賽企業應用提供技術及平臺保障。
在ECCV 2022挑戰賽中斬獲Full-Shot(全量數據學習)賽道與Few-Shot(小樣本數據學習)賽道雙料冠軍,更被國際知名市場調研機構IDC評為多模態AI大模型領域領先代表。
更簡單的理解是,同為預訓練大模型,ChatGPT的能力是在自然語言層面,而OmModel則完成了文字、畫面、音視頻等多模態的擴展與融合,這意味著OmModel可以以更為多樣、豐富的產品及應用形態賦能千行百業。
場景驅動AI下的創新應用已經開始
聯匯針對運營商、視頻云、能源電力、智聯網等各類企業客戶及需求,通過建設視頻AI業務平臺、SaaS平臺服務等多樣的服務方案,加速OmModel與OmVision已經在眾多行業和領域完成落地應用,圍繞客戶需求及應用場景,幫助用戶形成自主的AI技術框架與算法能力,產出不同的算法與技術方案。
例如擁有大量視頻數據的運營商,在他們的視頻云平臺建設中如何實現不同場景的智慧管理?
聯匯科技通過預訓練大模型技術,實現一個模型應對N個場景,算法建模實現大規模復制調整與創新,形成具有運營商特色的預訓練大模型,為其視頻云業務的拓展提供預訓練大模型技術支撐。
內置預訓練大模型的視頻云平臺有著顯著的平臺優勢:
●視覺算法操作系統內置預訓練大模型,可以通過一個大模型支撐所有的應用算法能力服務;
●基于算法運行平臺能夠快速適配視頻云用戶應用場景,實現根據每路視頻流進行單獨算法管理和調優,增強算法抗干擾能力;
●通過運行平臺充分利用算力資源減低應用成本;
●可以靈活選擇所需要的能力,并且快速建立新的落地場景,提升視頻云的靈活性和競爭力。
針對智慧化升級的電力企業,在基層無人機電路巡檢的業務場景下,存在輸電線路小部件典型缺陷識別準確率不高、識別系統運行速度慢、識別結果依賴人工復核等棘手問題,聯匯科技推出針對輸電線路多模態數據的人工智能預訓練算法,以及針對小部件缺陷的圖像分析模型,提升輸電線路小部件典型缺陷檢出率和識別精度,并通過蒸餾算法,實現缺陷檢測模型的參數壓縮,提高模型的運行速度,提升輸電線路缺陷檢測的整體效率,為電網公司在輸電線路無人機巡檢缺陷精準識別領域提供應用示范。
面向智慧安防、智慧城市、智慧電力、工業視覺、機器人+、智能制造等不同行業與領域場景,聯匯科技通過OmModel建設OmVision開放平臺產品、智能硬件以及定制化實施方案,為不同行業提供智能的算法模型生成與應用能力,降低AI技術使用門檻。
未來AI走向與趨勢
預訓練大模型無疑是人工智能進化中的一個重要里程碑,它極大地降低了人工智能技術應用的成本和門檻。ChatGPT、OmVision類的應用產品以極高的示范效應豐富了人工智能應用市場的生態版圖。不論是同賽道的差異化內卷,還是引入更多技術加速探索新產品,人工智能最大價滌胍庖迨賈帳俏慫?,讓人從底層的、基礎性的、簡單重復性的勞動中解放出來,聚焦于真正的創新、創造。
聯匯科技首席科學家趙天成表示:新一代 AI 大模型不會僅停留在語言模型,更可能的形態是處理語言、視覺、聲音等多任務的多模態 AI 模型,這是通往強人工智能更可能的通道,出現知識提煉能力和復雜推理能力更強的工具都將是時間問題。
正如之前多次的科技革命,人工智能正處于從“可以用”走向“更好用”的爆發階段,人們將在越來越多的行業與領域中感受到它的存在與價值。不論是“谷歌”,還是普通人,科技的進步,必然會淘汰一部分基礎性工作,而在汽車出現后的最好辦法只有一個,那就是學會開車。
未來將有更多領域出現智能化加速。或許是更多游戲里的虛擬數字人,或許是每個家庭都能擁有的智能管家機器人,或許是新聞里的數字主播,又或是無所不有的數字孿生……隨著多模態預訓練大模型的持續迭代,聯匯科技也將于今年發布性能更強的OmModel V3版本,科技進步與創新讓這些看起來科幻的場景一步步實現,未來不是未來,未來是當下。
【廣告】
(免責聲明:此文內容為廣告,相關素材由廣告主提供,廣告主對本廣告內容的真實性負責。本網發布目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責,請自行核實相關內容。廣告內容僅供讀者參考。)