第一屆空天信息技術(shù)大會(huì)9月21日開幕。大會(huì)期間,中國科學(xué)院空天信息創(chuàng)新研究院付琨研究員團(tuán)隊(duì)聯(lián)合鵬城實(shí)驗(yàn)室,正式發(fā)布自主研制的百億級遙感解譯基礎(chǔ)模型——“空天·靈眸”3.0版。這是迄今為止全球首個(gè)百億參數(shù)級空天一體遙感解譯基礎(chǔ)模型。
近年來,我國遙感數(shù)據(jù)獲取能力不斷增強(qiáng),已進(jìn)入遙感大數(shù)據(jù)時(shí)代,人工智能等新型數(shù)據(jù)處理方式也為數(shù)據(jù)服務(wù)模式的變革提供了可能。“空天·靈眸”是我國首個(gè)面向多模態(tài)遙感數(shù)據(jù)生成式基礎(chǔ)模型,也是首個(gè)專為遙感領(lǐng)域打造的專業(yè)基礎(chǔ)模型。自2022年首次推出后,中國科學(xué)院空天信息創(chuàng)新研究院研究團(tuán)隊(duì)在“基礎(chǔ)模型+下游任務(wù)”計(jì)算范式積累上持續(xù)探索。今年3月起,研究團(tuán)隊(duì)與鵬城實(shí)驗(yàn)室深度合作,基于中國算力網(wǎng)“鵬城云腦II”樞紐節(jié)點(diǎn),采用512張昇騰910顯卡,歷時(shí)數(shù)月攻關(guān)完成了在4億張國產(chǎn)化多模態(tài)空天遙感數(shù)據(jù)樣本上的預(yù)訓(xùn)練,基礎(chǔ)模型參數(shù)規(guī)模首次超過百億。
中國科學(xué)院空天信息創(chuàng)新研究院研究員孫顯介紹,如果把基礎(chǔ)模型看作是一個(gè)機(jī)器人,那么,“參數(shù)”就相當(dāng)于它的“記憶細(xì)胞”和“知識細(xì)胞”。如果參數(shù)規(guī)模小,則它能記住和處理的信息就相對有限,只能做一些比較簡單的任務(wù)。參數(shù)規(guī)模越大,這兩種“細(xì)胞”就越多,它就能捕捉、記憶和處理更復(fù)雜的信息,從而更加準(zhǔn)確、精細(xì)地完成更困難、更復(fù)雜的任務(wù)。
“空天·靈眸”3.0版內(nèi)核工作架構(gòu)是基于熱傳導(dǎo),這是聯(lián)合團(tuán)隊(duì)自主研發(fā)的一套小而精的原創(chuàng)性架構(gòu)。受傳熱學(xué)物理思想啟發(fā),聯(lián)合團(tuán)隊(duì)將場景目標(biāo)間視覺語義傳播建模為熱能擴(kuò)散過程,從而使該架構(gòu)有效突破了遙感模型推理的性能和速度瓶頸,計(jì)算速度較傳統(tǒng)結(jié)構(gòu)模型提升2.4倍以上。
“空天·靈眸”3.0版目前已表現(xiàn)出極為優(yōu)秀的泛化解譯性能,在可見光、合成孔徑雷達(dá)、熱紅外、多光譜等多傳感器衛(wèi)星數(shù)據(jù)基礎(chǔ)上,拓展至航空遙感飛機(jī)、無人機(jī)等不同航空平臺觀測數(shù)據(jù)的自動(dòng)化、高精度解譯處理。尤其是航空大傾角成像過程中,極易出現(xiàn)畸變、遮擋、缺失等干擾,模型對此依然可以保持高精度的識別能力。
目前,“空天·靈眸”3.0版在覆蓋場景分類、目標(biāo)檢測、語義分割、變化檢測等六大類任務(wù)的23個(gè)國際基準(zhǔn)數(shù)據(jù)集上測試,比當(dāng)前的主流模型,精度平均提升4%至10%,指標(biāo)均達(dá)到領(lǐng)先水平,并已在應(yīng)急、國土、海洋、住建等多個(gè)行業(yè)部署試運(yùn)行,特別是在最具挑戰(zhàn)性的復(fù)雜要素精細(xì)分類、運(yùn)動(dòng)小目標(biāo)連續(xù)跟蹤等任務(wù)上性能卓越,為天臨空地一體化應(yīng)用提供了一套行之有效的解決方案。未來,研究團(tuán)隊(duì)將持續(xù)推動(dòng)“空天·靈眸”3.0版在國民經(jīng)濟(jì)各個(gè)行業(yè)的落地應(yīng)用。