(資料圖)
去年7月,人工智能又一次進入社會大眾的視野:
Midjourney發布后,普通用戶能通過自己的提示生成非常有創意、高質量的圖片,持續迭代修改后,最終生成復合甚至超出用戶預期的圖片;
StabilityAI開源了Stable Diffusion模型, 隨即迅速傳播,讓開發者生態能定制開發和訓練滿足特定需求、場景、迭代速度的提示生成圖片產品。
隨后的11月,人工智能知名企業Open AI發布ChatGPT,ChatGPT第一次以類人類的語言模式,具備了和人對話、問答、語言理解、翻譯等語言處理能力,這又一次超出了普通用戶對認知智能能力的預期。這標志著人類在通向通用人工智能的路上又邁進了一大步。
Midjourney和ChatGPT的爆發背后孕育著什么更大的趨勢。對于信息革命、人類數字文明,是否存在比移動互聯網、云計算更大的海嘯級別(tsunami)變革和價值創造的機會?可能是會什么呢?
認知智能是AI發展的下一個前沿何為認知智能
認知人工智能(Cognitive AI),是一種旨在模擬人類認知智能的人工智能,人類的認知智能包括學習、理解、分析、問答、交流、記憶、生成、推理等能力。認知人工智能使用先進的模型、算法和機器學習技術,分析、推理、理解和學習大量數據,包括結構化和非結構化數據。這些系統可以學習、識別、生成、或做出預測并生成類似于人類推理的見解。
人工智能下一個前沿
人工智能已經存在了幾十年了,中國開始探索人工智能并在各種場景落地也經歷了至少十余年;主流的人工智能還是在結構化數據的基礎上,通過傳統機器學習算法做分析和預測、基于特征工程做分析和推薦、或基于深度神經網絡對圖像分類識別。
但由于最近大語言預訓練模型和生成模型的進展,數字世界中人工智能對于人類語言文本的理解、對話、生成,第一次達到了類人類的水平,人工智能的發展進入了認知智能的時代。
認知智能的時代已經開啟????
底層架構、算法、模型的創新和快速發展,從量變到質變推動著認知智能時代開啟。推動認知智能起飛的核心因素包括AI OS、大語言模型(large language foundation model)、檢索模型(retrieval model)和預訓練、微調、Prompt 工程及各種反饋的強化學習技術。
AI OS
操作系統(OS)具有如下特征:(1)強抽象能力;(2)行業de facto標準;(3)基于OS建立行業基礎設施和應用生態。OS是行業生態和應用發展的最基礎的底座,PC的發展得益于windows OS,互聯網的發展得益于Linux,云的發展由于虛擬化OS和K8S。AI的高速發展也需要有類似特征的OS底座。
AI在大語言模型(Large language model,LLM)上是基于transformer&attention的架構,這個架構對于人類的知識及其多種表現形式有極強的抽象和表達能力,人類第一次在數字世界用同一個架構來表達人類各種模態的知識。
由于其強大的抽象和表達能力,這一架構已經開始成為行業最主流的AI模型架構,除了LLM被廣泛使用外,圖片和其他模態的場景也在發展或探索中,成為基礎模型的de facto標準勢頭出眾。
這個de facto標準開始推動了基于transformer的LLM的基礎設施和行業生態的發展,而且越來越多人意識到,transformer架構與大語言模型的結合,使得基于語言的認知智能的迭代迅猛。
Large Language&retrieval models
什么是foundation model(基礎模型)?任何一個在廣泛數據上進行訓練(通常使用規?;淖员O督)的模型,都可以被調整(如微調)以適用于各種下游任務。
Large Language Model(LLM)可以理解為一個數據庫,人類第一次把歷史上所有知識,最大規模地通過高效壓縮的方式保存到這個“數據庫”里?;贚LM衍生的ChatGPT模型用人類最熟悉的自然語言對話方式,來理解用戶的意圖,用遞進式的、極其高效、開放模式去獲取知識。生成式的大模型還能通過理解人類的意圖遞進式地去生成優質的內容。
預訓練、微調、Prompt 工程及“X”反饋的強化學習技術
認知智能基礎模型不僅是通用、開放式的智能,而且通過微調和提示工程等各種技術,讓通用認知智能模型有能力更好服務到各行各業——如金融、醫療、教育、信息科技、媒體等;各種場景——如研發、銷售、客服等。
通過各種Live使用反饋機制加上強化學習能力,知識數據庫在擴展的同時,模型和使用者(無論是人類、系統、還是機器)的意圖更好地對齊,在被使用過程中,模型也持續在升華。
認知智能的類人類語言處理能力、de facto技術架構、開放和通用的場景、快速的迭代進化,且能服務到專業、特定場景,這些都標志著認知智能開始進入了人工智能的主流賽道。
智能計算和AI-First SaaS將引領計算世界下一波浪潮???????信息計算時代
人類數字文明的發展依賴于計算范式的創新和發展。從50年的mainframe、80年代的PC、2000年的互聯網、2010年的移動互聯網,到還在持續發展的云計算,這些計算范式的演進推動個人和企業的數字文明發展,而且每次變革都會帶動全球經濟效率和規模的提升。
從mainframe到云計算是信息計算時代,把信息在數字世界中進行結構化,在數據世界中進行計算、模擬、甚至預測。信息計算的特征除了數字化、結構化外,還有確定性(deterministic)的特征,也就是同樣的數據輸入情況下,輸出的結果總是一致的,在一個已知的環境下相當確定性符合人類的預期。
何為智能計算?
智能計算是一種基于自然語言能力,以具有學習、理解、分析、問答、交流、記憶、生成、推理等類人類認知智能能力的認知模型為核心的計算范式,智能計算有如下特征:(1)具有探索性 (2)非確定性(non-deterministic,or probabilistic) (3)更高效理解人類意圖(4)認知能力至少超出人類的平均水平。智能計算時代的到來是自然語言處理技術的創新、發展、沉淀從量變到質變的結果。最近5年出現的大語言預訓練模型、對話模型、生成模型等自然語言的處理技術的創新,觸發了智能計算時代的到來。智能計算的核心是認知智能的能力。
何為AI-First 應用
以認知智能為核心能力開發的應用為AI-First應用,AI-First應用使得應用本身有類人類認知智能的能力,能通過智能助手應用,增強普通人的認知智能能力到更高的水平,讓機器、系統、人之間的交互從信息智能提升到認知智能的更高維度。人類數字文明第一次進入到認知智能,發展進入一個嶄新的階段。
AI-First 應用的出色樣板:New Bing&Edge Browser
微軟發布的New Bing和Edge Browser為未來AI-First應用展示了非常好的樣板。
AI-powered copilot -- Edge Browser’s chat&answer
在Edge Browser,AI-powered copilot能與用戶持續聊天、咨詢、問答、翻譯、改寫、生成、簡單推理;而且copilot在持續關注用戶使用網站的交互、返回內容和歷史,根據這個上下文自動和用戶做智能交互,給用戶嶄新的體驗。
New AI-Native search -- New Bing Search
New Bing的搜索基于下一代LLM、為搜索定制、比ChatGPT更強大,這個模型叫做Prometheus模型。這是一個由下一代AI大模型驅動的 AI-native搜索平臺,它提升搜索的相關性、能對答案做注解、提供最新的搜索結果、并提升安全性。
智能計算時代的應用
幾乎所有的應用都應該增加copilot或in-place的智能助手,通過人和智能助手的交互,在軟件中更高效、更高質量完成目標任務。
應用開發者可以更向前邁一大步,用大模型作為應用的底座,使其成為AI-native的應用,其核心能力提升至認知智能的程度。
認知智能在重新定義軟件構建的方式
人類數字文明構建的核心工具是軟件開發工具,核心承載平臺是軟件。軟件工業也需要應對變化做變革和升級。每次計算平臺發生重大變革和發展,其依賴的軟件開發模式、框架、工具鏈、計算平臺的基礎設施都會被重構。我們相信,為了更好適應智能計算時代,軟件開發的范式也會被重構,可能這次重構的幅度比預期的更大。具體會是什么形態能沉淀下來,還需要讓子彈再飛一下。
人工智能下一個前沿
RPA(robotics process automation)、低代碼工具、PaaS平臺的出現,讓軟件開發變得更為定制化、普惠化。由于AI 生成模型的發展,像copilot之類的人工智能代碼開發輔助工具,今后能夠為軟件開發工程師提供注釋、代碼補全生成、語法建議和錯誤修復等功能,使得開發者能夠更加高效地編寫代碼。
AI-First 應用開發
在開發下一代AI-First應用的過程中所涉及的——在邏輯和交互的開發框架、工具、自動化、數據和認知模型,以及更優化的面向AI-first的runtime,以及關聯的基礎設施,都有機會被升級和變革。
AI-First cognitive AI架構
即便人類對大腦的認知也是非常原始,不少行業從業者從理論、和工程視角探索下一代的Cognitive AI的架構,更好的支持AI-First應用。
AI-First應用的核心支柱是“認知智能模型”
AI-First應用最核心變化是什么呢?我認為其核心支柱是“認知智能模型”。
脆弱、固化的軟件
軟件是人類數字文明的平臺。但軟件是非常脆弱的,軟件的業務邏輯和數據模型根據當時的業務需求開發的,隨著每次業務需求的變化,軟件還需要修改、甚至重構;軟件同時又是非常固化的,比如在用戶交互層幾乎是固化的,不管你是第一次使用、初級用戶還是資深用戶,都只有一種交互界面,用戶有口皆碑優秀體驗的軟件很少,在2B場景可能更稀缺。
認知智能模型是軟件的核心支柱
我認為“認知智能”模型是AI-First應用的back-bone(核心支柱),應用會從數據驅動(Data-Driven)向模型驅動(AI Model-Driven)發展。先假設軟件還是3層架構(可能這個也會發生變化):數據層、業務邏輯層、和交互層。
(1)Knowledge Layer
在數字世界中,企業業務的核心資產是數據和知識,這些企業獨特的知識和全方位收集的數據都會被聚合并被認知模型捕捉,這個模型是驅動企業業務場景和各種交互場景的核心模型。
(2)Business Layer
未來企業的業務層也會被認知模型所驅動,實現業務邏輯由認知智能驅動,企業邏輯才能更動態自適應、更好適應多變業務需求和多樣的用戶(包括員工、生態伙伴、最終用戶或客戶)需求,而不是目前現在的hard-coded、規則定義、甚至只依賴結構化數據的機器學習能力來實現業務邏輯。
(3)Interaction Layer
ChatGPT給我們展示了一個類人類智能的交互界面,智能能力非常驚艷。但交互能力還是非?;A,下一代智能交互會有很多新的想象空間。在認知智能模型驅動下,交互界面、內容、結構更是會從用戶意圖理解的基礎上,動態地、個性化地、智能地去生成和互動。
如果大家認同這個趨勢,AI-First應用的軟件架構和軟件開發的模式和stack發生變革是必然。
認知智能模型也是業務全環節視角的核心支柱
從業務視角,認知智能模型也能賦能甚至作為核心支柱驅動業務全環節,從產品定義設計、生產、營銷、服務等全環節用認知智能去提升效率、提升體驗、甚至創造新價值。
智能計算時代企業核心競爭是企業獨特的認知智能模型
在大數據時代,行業對企業核心競爭力的共識是數據。在智能計算時代,企業的核心差異化競爭力將會是基于企業內部數據的認知智能模型。
AI-First企業應用的核心支柱是認知智能模型,未來企業應用如電商、CRM、EPR、service、HCM等,幾乎所有場景都有機會被認知智能模型賦能驅動、甚至重構。
從產品開發、生產、市場、銷售、內部管理、產品交付到售后服務、上游供應鏈,來自于企業經營全環節的信息時代沉淀的所有結構化和非結構化數據,以及從認知智能時代開始積累的企業獨特的知識都將成為企業特有的認知智能模型的訓練數據。而且企業數字系統、公司內部、與用戶和合作伙伴互動過程中產生的反饋數據,也能通過強化學習讓企業自有的認知智能模型持續的迭代、升級,模型和使用者或系統的意圖更好的對齊。
企業獨特的認知智能模型將會是企業品牌、定位、文化、知識、核心能力的完整數字化表達和保存。這可能是一個系列模型,代表了企業各個部門、角色、崗位的認知能力,去賦能甚至代替企業內部各個角色之間的交流、企業和客戶、企業和生態合作伙伴的交流和服務;也許是一系列信息系統核心支柱模型,能更好地服務信息系統的認知智能維度的決策能力;也許是個企業培訓的虛擬培訓師,能持續地in-context、在工作場景中持續培訓、指導、能力增強企業員工的模型。
Salesforce最近發布了Salesforce EinsteinGPT,EinsteinGPT是第一個生成AI的CRM模型,AI生成的內容會超級高效地覆蓋銷售、市場、服務、電商、IT等企業環節。相信任何有競爭力的企業都必須有自己企業獨特的認知智能模型,驅動企業方方面面的環節,為員工、客戶、合作伙伴提供無以倫比的體驗、效率和價值創造。
智能世界和信息世界的融合
從50年代人類發明了第一臺電腦起,信息科技的創新并賦能著各行各業,不僅為企業降本增效,而且為企業開拓了新的revenue stream和商業模式,在此發展過程中,信息數字世界創造和沉淀了大量的信息科技基礎設施、開發工具、行業應用、數字能力等, 如云計算的各種彈性計算的能力編排能力;企業管理軟件如CRM、ERP、Service Cloud;各種企業內部和個人的效率、協同辦公軟件;基于大數據的各種BI、報表、洞察分析軟件,企業內部集成和工作流引擎和可視化的編排能力。為了企業內部系統之間、以及和外部生態更高效、更實時的協同,甚至構建了企業數字生態以更好服務其客戶,企業內部能力以各種API形式開放給第三方。 企業為此投了大量的人力和財力構建這些非常寶貴、極具價值的企業核心競爭力。
隨著以認知智能為更高維度的智能計算時代到來,智能世界和信息世界會各取所長并相互融合:
(1)基于認知智能提供了下一代更自然、更智能、更平民化的人-系統智能交互界面
以LLM為基礎的對話模型,對語言的理解和生成能力已經具備類人類智能的水平,使得人機進行類似人類自然語言水準和質量的對話變成了可能,這個對話不僅能滿足人類更高效挖掘新知識的需求,還可能通過下一代的對話智能模型,以人類最自然的語言交互模式,使得人類和信息世界的各種數字系統和應用自由交流和交互。
(2)更靈活、更開放、更動態、更個性化地去實現企業內部流程和工作方式的重構
數字世界的信息系統接口和界面相對是固化的,但是企業內部流程和工作方式會隨著業務、效率的需求在持續變化,企業員工在合適的權限下通過自然語言互動的方式,未來將能夠根據業務和個性的需求對企業內部系統、工作流程、數據流進行更靈活、更動態的重構。是未來企業integration、RPA在AI-first理念下的變革。
智能世界類似人的大腦,信息世界類似的人的肢體去和物理世界感知、執行和反饋,智能世界和信息世界是相互想成,才構成一個完整的人類數字文明世界。這兩個世界的融合不僅能為企業員工開拓新的體驗和價值。這個融合也會發生在個人日常生活、溝通、社交等開放社會的生活場景中,人類的日常生活由此也有嶄新的體驗和新高度的生命幸福感。
誰會是智能計算時代的英雄豪杰??
PC計算時代造就了微軟,互聯網計算時代時代造就了谷歌、淘寶,移動互聯網時代造就了tiktok/抖音、美團、Uber,云計算時代造就了AWS、salesforce;智能計算時代未來,誰會成為引領這個時代新的英雄豪杰?我們都非常期待。雖然我們現在沒法預判是誰,但是我們相信所有的2C和2B的場景在智能計算時代都值得重新被思考、探索、加強甚至重新被打造。
關鍵詞: