南京新聞動態(tài) INFORMATION 行業(yè)要聞 行業(yè)技術(shù) 全國服務(wù)熱線 021-54949066 “十大科技前沿發(fā)明”發(fā)布,跨模態(tài)AIGC、數(shù)字人智能化生產(chǎn)、自動駕駛等上榜
發(fā)布時間:2022-09-13 10:30:01 作者: 瀏覽量:9338
9月20日,百度首次發(fā)布“2022十大科技前沿發(fā)明”,包括跨模態(tài)通用可控AIGC、無人車多傳感器融合處理系統(tǒng)、知識增強大模型、深度學習通用異構(gòu)參數(shù)服務(wù)器架構(gòu)、基于AI的生物計算平臺、面向自動駕駛的車路協(xié)同關(guān)鍵技術(shù)等。
AIGC被認為是顛覆現(xiàn)有內(nèi)容生產(chǎn)方式的新一代技術(shù)。據(jù)了解,“十大科技前沿發(fā)明”中的跨模態(tài)通用可控AIGC,在通用性上提出了跨模態(tài)、跨任務(wù)的統(tǒng)一建模技術(shù),是首次實現(xiàn)語言與視覺大一統(tǒng)的理解與生成。
有專家表示,近年來,我國把科技創(chuàng)新作為引領(lǐng)發(fā)展的第一動力,深入實施創(chuàng)新驅(qū)動發(fā)展戰(zhàn)略,開啟了建設(shè)世界科技強國的新征程。關(guān)鍵核心技術(shù)專利是國之重器,“十大科技前沿發(fā)明”成果體現(xiàn)了多項國際前沿核心技術(shù)的實現(xiàn)與突破,對推動經(jīng)濟發(fā)展和技術(shù)進步有著十分重要的意義。
2022十大科技前沿發(fā)明,具體如下:
1.跨模態(tài)通用可控AIGC:該發(fā)明在業(yè)界首次提出語言與視覺統(tǒng)一的理解與生成模型,創(chuàng)新提出融合知識的生成,突破了通用可控內(nèi)容生成技術(shù)瓶頸,實現(xiàn)了文本生成、圖像生成、視頻生成、數(shù)字人生成的實用化跨越。
2.無人車多傳感器融合處理系統(tǒng):該項發(fā)明以多傳感器融合為核心,完善激光雷達感知能力,構(gòu)建了環(huán)視視覺的獨立閉環(huán)能力,已經(jīng)在自動駕駛車輛上得到大規(guī)模應(yīng)用,實測效果漏檢率總計減少60%,低矮障礙物漏檢率減少83%,有效支撐百度Robotaxi在各種城市復雜道路和場景上無人駕駛能力的構(gòu)建。
3.知識增強大模型:該發(fā)明是百度文心大模型的核心技術(shù),其從大規(guī)模知識和海量數(shù)據(jù)中融合學習,具備領(lǐng)先的理解和生成能力。包括了以全球首個千億級知識增強大模型鵬城-百度·文心為代表的語言大模型、計算機視覺、跨模態(tài)等大模型,以及電力、金融、航天等行業(yè)大模型。
4.深度學習通用異構(gòu)參數(shù)服務(wù)器架構(gòu):該項發(fā)明通過可擴展的架構(gòu)設(shè)計,不僅可以支持基于CPU、GPU、XPU等不同類型硬件的參數(shù)服務(wù)器架構(gòu)單獨訓練,還可以通過強化學習算法將同一深度學習模型訓練任務(wù)分配到不同類型硬件的計算節(jié)點上進行混合硬件異構(gòu)訓練,實現(xiàn)計算資源最優(yōu)搭配。
5.基于AI的生物計算平臺PaddleHelix:該發(fā)明提出了一系列基于AI的生物計算創(chuàng)新技術(shù),包括自主研發(fā)的高效mRNA疫苗設(shè)計LinearDesign算法,首個基于幾何空間構(gòu)象的化合物表征模型HelixGEM,端到端的單序列蛋白結(jié)構(gòu)預測模型HelixFold-Single等。
6.面向自動駕駛的車路協(xié)同關(guān)鍵技術(shù):該項發(fā)明構(gòu)建了車路協(xié)同自動駕駛的復雜技術(shù)體系與融合協(xié)同機制,通過協(xié)同感知,解決自動駕駛動靜態(tài)盲區(qū)、超視距、遮擋等一系列感知長尾問題,通過協(xié)同決策規(guī)劃和協(xié)同控制解決混行狀態(tài)下的現(xiàn)實變更、博弈、阻塞和極端場景等問題,降低自動駕駛的接管次數(shù)和安全事故風險,保障自動駕駛安全連續(xù)運行。
7.全平臺量子軟硬一體:該發(fā)明圍繞“量羲”布局,“量羲”是百度推出的基于“乾始”研發(fā)的全球首個全平臺量子軟硬一體化解決方案,提供私有化部署、云服務(wù)、硬件接入等一系列服務(wù),最大程度上簡化了量子硬件部署到量子服務(wù)的全流程。
8.數(shù)字人智能化生產(chǎn):該發(fā)明基于語音、語義和視覺等AI技術(shù),以智能終端為載體,實現(xiàn)人機可視化語音交互服務(wù)。借助百度智能云曦靈平臺,打通數(shù)字人生產(chǎn)、人設(shè)管理、內(nèi)容創(chuàng)作到業(yè)務(wù)編排全流程。
9.智慧城市全要素雙總線技術(shù):該發(fā)明的全要素雙總線包含智慧總線與知識總線,智慧總線構(gòu)建城市服務(wù)的全資源協(xié)同開發(fā)與運行環(huán)境,統(tǒng)一納管調(diào)度城市中的各類數(shù)據(jù)、算法、算力,為智能化應(yīng)用開發(fā)提供綜合技術(shù)供應(yīng);知識總線依托文心增強的城市多模態(tài)大模型及知識圖譜、NLP等AI技術(shù),搭建城市全要素融合知識圖譜,支撐跨部門、跨應(yīng)用、跨數(shù)據(jù)間的知識體系打通和資源共用。
10.自動駕駛多模態(tài)行人運動預測:該發(fā)明提出一種融合多模態(tài)輸入特征以及多維度交互模式的深度學習模型,用于預測行人未來6s的運動軌跡,已在Robotaxi業(yè)務(wù)中落地應(yīng)用,行人預測準召提升30%,VRU碰撞風險問題解決率95%。