![]()
9月20日,百度首次發布“2022十大科技前沿發明”。據數據顯示,截至2022年,百度已在人工智能領域發展了十年,累計研發投入超1000億元,連續四年在AI專利申請量和授權量上保持國內第一。其中,跨模態通用可控AIGC(基于人工智能的內容生成)發明,首次在全球范圍內實現語言與視覺大一統的理解與生成;無人車多傳感器融合處理系統,也提升百度Robotaxi應對各種城市復雜道路的能力;知識增強大模型鵬城-百度·文心成全球最大中文單體模型,具備了語言理解能力和文學創作的能力等。
AIGC被認為是顛覆現有內容生產方式的新一代技術。在不久前的世界人工智能大會上,百度總裁李彥宏表示,AI作畫就是AIGC的一種,它可以以十分之一的成本,千百倍的生產速度,創造出有獨特價值和獨立視角的內容。而在AIGC的背后則是預訓練大模型的發展。百度最早在2019年3月發布了首個開源預訓練模型文心ERNIE 1.0。目前已升級成產業級的知識增強大模型家族,涵蓋語言大模型、計算機視覺、跨模態、生物計算大模型,以及電力、金融、航天行業大模型等,可從大規模的知識和海量數據中融合學習,具備相應的理解與生成能力。
在自動駕駛領域,百度無人車多傳感器融合處理系統的感知技術已在自動駕駛車輛上得到了推廣應用,其漏檢率總計減少60%,低矮障礙物漏檢率減少83%。在活動現場,“基于人工智能的人機交互方法和系統”,榮獲第二十二屆中國專利金獎,該專利技術主要以深度語義理解為基礎,運用知識圖譜及深度學習等技術,實現了跨越語言、語音、圖像等模態的智能人機交互。此外,“基于弱監督的字符檢測器訓練方法”榮獲第二十三屆中國專利銀獎,該專利實現了全場景覆蓋、超高精度的光學字符檢測。
百度CTO王海峰對此表示,百度一方面要在科技前沿領域加緊創新和探索,攻關核心關鍵技術,把發展主動權掌握在自己手里;另一方面,也要將創新成果與產業融合,促進產業發展,助力高水平科技自立自強。
2022十大科技前沿發明,具體如下:
1.跨模態通用可控AIGC:該發明提出語言與視覺統一的理解與生成模型,創新提出融合知識的生成,實現了文本生成、圖像生成、視頻生成、數字人生成的實用化跨越。可應用于圖文轉視頻、高精度數字人生成、文生圖等創新領域,大幅提升內容生產效率。
2.無人車多傳感器融合處理系統:該項發明以多傳感器融合為核心,完善激光雷達感知能力,構建了環視視覺的獨立閉環能力,已經在自動駕駛車輛上得到大規模應用,實測效果漏檢率總計減少60%,低矮障礙物漏檢率減少83%。
3.知識增強大模型:該發明是百度文心大模型的核心技術,其從大規模知識和海量數據中融合學習,具備領先的理解和生成能力。包括以全球首個千億級知識增強大模型鵬城-百度·文心為代表的語言大模型、計算機視覺、跨模態等大模型,以及電力、金融、航天等行業大模型,目前已大規模應用于百度的各類產品,并通過飛槳和百度智能云支持各產業的智能化升級。
4.深度學習通用異構參數服務器架構:該項發明通過可擴展的架構設計,可支持基于CPU、GPU、XPU等不同類型硬件的參數服務器架構單獨訓練,還可以通過強化學習算法將同一深度學習模型訓練任務分配到不同類型硬件的計算節點上進行混合硬件異構訓練,從而可減少50%以上的深度學習模型訓練成本,提升深度學習模型的訓練效率。
5.基于AI的生物計算平臺PaddleHelix:該發明提出了一系列基于AI的生物計算創新技術,包括自主研發的mRNA疫苗設計LinearDesign算法,基于幾何空間構象的化合物表征模型HelixGEM,端到端的單序列蛋白結構預測模型HelixFold-Single等,可大幅提升新藥研發和疫苗設計效率,助力科技抗疫。
6.面向自動駕駛的車路協同關鍵技術:該項發明構建了車路協同自動駕駛的復雜技術體系與融合協同機制,通過協同感知,解決自動駕駛動靜態盲區、超視距、遮擋等一系列感知長尾問題,通過協同決策規劃和協同控制解決混行狀態下的現實變更、博弈、阻塞和極端場景等問題,降低自動駕駛的接管次數和安全事故風險,保障自動駕駛安全連續運行。
7.全平臺量子軟硬一體:該發明圍繞“量羲”布局,“量羲”是百度推出的基于“乾始”研發的全平臺量子軟硬一體化解決方案,提供私有化部署、云服務、硬件接入等一系列服務,最大程度上簡化量子硬件部署到量子服務的全流程。“量羲”具備適配超導、離子阱等多類型主流量子芯片,可實現量子芯片“即插即用”。
8.數字人智能化生產:該發明基于語音、語義和視覺等AI技術,以智能終端為載體,實現人機可視化語音交互服務。借助百度智能云曦靈平臺,打通數字人生產、人設管理、內容創作到業務編排的全流程。結合UNIT7.0跨模態對話引擎及AIGC技術,支持服務型和演藝型數字人多種人像(2D、3D、卡通)高效生產及運營。
9.智慧城市全要素雙總線技術:該發明的全要素雙總線包含“智慧總線”與“知識總線”,“智慧總線”構建城市服務的全資源協同開發與運行環境,統一納管調度城市中的各類數據、算法、算力,為智能化應用開發提供綜合技術供應;“知識總線”依托文心增強的城市多模態大模型及知識圖譜、NLP等AI技術,搭建城市全要素融合知識圖譜,支撐跨部門、跨應用、跨數據間的知識體系打通和資源共用。
10.自動駕駛多模態行人運動預測:該發明提出一種融合“多模態輸入特征”以及“多維度交互模式”的深度學習模型,用于預測行人未來6s的運動軌跡,已在Robotaxi業務中落地應用,行人預測準召提升30%,VRU碰撞風險問題解決率95%。