0
本文作者: nebula | 2023-09-22 14:18 |
2019年,農(nóng)業(yè)農(nóng)村部提出數(shù)字農(nóng)業(yè)農(nóng)村發(fā)展規(guī)劃(2019-2025),明確提出以農(nóng)業(yè)數(shù)字化為重點(diǎn)發(fā)展主線,全面提升農(nóng)業(yè)農(nóng)村生產(chǎn)智能化、經(jīng)營網(wǎng)絡(luò)化、管理高效化、服務(wù)便捷化水平,以數(shù)字化引領(lǐng)驅(qū)動農(nóng)業(yè)農(nóng)村現(xiàn)代化,為實現(xiàn)鄉(xiāng)村全面振興提供有力支撐。這其中對核心主糧作物、經(jīng)濟(jì)作物種植區(qū)域進(jìn)行數(shù)字化建模是實現(xiàn)農(nóng)業(yè)數(shù)字化的基礎(chǔ)一環(huán)。依托現(xiàn)代衛(wèi)星遙感技術(shù),對地物目標(biāo)進(jìn)行多光譜、多時段監(jiān)測,可以獲取大量信號特征,同時基于不同農(nóng)作物對不同波段光譜的特異性反射差異、生長周期特點(diǎn),可以實現(xiàn)低成本、高精度、大范圍的農(nóng)作物種類識別,為實現(xiàn)農(nóng)業(yè)數(shù)字化生產(chǎn)、高效網(wǎng)格化經(jīng)營提供基礎(chǔ)數(shù)據(jù)。
本賽題主要目的是通過時序多光譜遙感數(shù)據(jù)序列,設(shè)計人工智能算法,識別出對應(yīng)地點(diǎn)對應(yīng)時間段的種植農(nóng)作物種類。
(1)數(shù)據(jù)集:本賽題給出了約22萬條的多光譜傳感器數(shù)值時序序列,每條序列包含若干個時間點(diǎn),每個時間點(diǎn)包含了11個通道的值,這些值均為整數(shù)。因此,一條多光譜傳感器數(shù)值時序序列的數(shù)據(jù)可以表示為
其中T為時間點(diǎn)的數(shù)目。
(2)目標(biāo):其目標(biāo)是給定對應(yīng)的多光譜傳感器數(shù)值時序序列,以判定該地點(diǎn)種植作物種類(玉米、水稻、大豆中的其中一類),是個三分類問題。
(3)評價指標(biāo):本次賽題為機(jī)器學(xué)習(xí)經(jīng)典的分類問題,評價指標(biāo)采用分類準(zhǔn)確率。
該賽題提供了一組序列數(shù)據(jù),可以直接將該問題視為一個序列分類問題,并使用GRU(門控循環(huán)單元)或Transformer進(jìn)行建模。對于輸入數(shù)據(jù),有兩種可能的處理方法。
(1)第一種方法是將11個通道的值進(jìn)行歸一化,從而得到一個時長為T的序列,其中每個時刻的輸入向量維度為11。這種方法相對簡單,但有一個缺點(diǎn):由于其數(shù)值是線性的,歸一化后的數(shù)值對于相近的整數(shù)也是相近的,這使得模型難以區(qū)分這些相近的值。
(2)為了解決這個問題,我們的隊伍采用了第二種方法:對11個通道的值進(jìn)行embedding,從而得到一個11×h維度的向量。在輸入到序列模型之前,我們通過一個線性變換將這個向量轉(zhuǎn)化為一個[T, H]的矩陣,其中H是序列模型的隱藏層大小,例如256或512。這種方法的優(yōu)點(diǎn)是能夠?qū)⒃嫉?、線性的輸入值轉(zhuǎn)化為一個更加豐富、更能表征數(shù)據(jù)特點(diǎn)的高維空間。這使得模型能夠捕獲到更多的數(shù)據(jù)特征,從而提高模型的分類性能。
圖1. 解決方案整體框架
我們團(tuán)隊的解決方案如圖1所示。在這個解決方案中,我們首先利用BERT模型對多光譜傳感器的數(shù)值時序序列進(jìn)行建模。BERT模型能夠捕捉時序序列中的上下文信息,這對于理解農(nóng)作物生長過程中的時空變化是很重要的。然后,我們將從BERT模型的最后一層得到的特征與光譜反射和農(nóng)作物生長周期的特征進(jìn)行拼接并通過4層的transformer。這樣做的目的是將從不同源獲取的信息融合在一起,以提供更全面的信息。最后,我們采用mean pooling和max pooling對transformer的輸出進(jìn)行池化操作,以得到最終的序列特征。這個特征會被用作分類模型的輸入。接下來,我們將詳細(xì)介紹如何預(yù)訓(xùn)練BERT特征,以及如何提取光譜反射與農(nóng)作物生長周期的特征。
(1)BERT模型的預(yù)訓(xùn)練
圖2. BERT模型MLM預(yù)訓(xùn)練任務(wù)
為了更有效地捕捉序列中的語義信息和依賴關(guān)系,我們采用了改進(jìn)的Masked Language Modeling(MLM)任務(wù)來對BERT模型進(jìn)行預(yù)訓(xùn)練。具體地,我們并不是對一個時刻的所有傳感器數(shù)值進(jìn)行掩蓋,而是隨機(jī)掩蓋掉20%的傳感器數(shù)值。這樣做的優(yōu)點(diǎn)是,我們不僅可以使用不同時間點(diǎn)的傳感器數(shù)值來預(yù)測當(dāng)前的數(shù)值,還能使用當(dāng)前時刻的其他傳感器數(shù)值來預(yù)測某一個傳感器的數(shù)值。這樣的設(shè)計有助于模型更好地理解不同傳感器數(shù)值之間的依賴關(guān)系,以及不同時間點(diǎn)之間的依賴關(guān)系。這對于捕捉多光譜傳感器數(shù)據(jù)中的時空變化信息是非常重要的。
(2)光譜反射與農(nóng)作物生長周期特征
遙感農(nóng)作物識別時,光譜反射特性和農(nóng)作物生長周期特性是兩個關(guān)鍵特征。圖3顯示了豆科植物對不同光譜波段的反射率示意圖,而圖4展示了不同農(nóng)作物生長周期中的NDVI指數(shù)變化示意圖。這些示意圖均來自公開資料,如果存在侵權(quán)問題,請聯(lián)系我們刪除。NDVI是一種常用的指數(shù),用于衡量植被的生長狀況。它的計算公式如下,其中NIR代表近紅外波段,R代表紅色光波段:
因此,我們計算每個時間點(diǎn)的NDVI值,并將其作為額外的輸入特征。從圖4中,我們還可以觀察到,不同農(nóng)作物的NDVI指數(shù)變化梯度也不同。這是一個重要的指標(biāo),可以幫助我們更好地區(qū)分特定地點(diǎn)適合種植哪些農(nóng)作物。因此,我們也使用了梯度信息作為額外的特征。
首先,我們要對主辦方在“科技助實”這一具有深遠(yuǎn)影響的主題上提供寶貴的數(shù)據(jù)和有趣的賽題表示感謝。這不僅為我們提供了一個展示科技創(chuàng)新能力的平臺,還讓我們有機(jī)會為農(nóng)業(yè)持續(xù)發(fā)展貢獻(xiàn)一份力量。"科技助實"不僅是一個充滿意義的研究領(lǐng)域,而且具有極高的社會價值,它能夠助力提高農(nóng)作物產(chǎn)量、提升農(nóng)業(yè)可持續(xù)性,并最終改善農(nóng)民的生活質(zhì)量。同時,我們也要對所有參與指導(dǎo)和支持的老師表示由衷的感謝。您們的專業(yè)知識和無私奉獻(xiàn)為我們提供了強(qiáng)大的技術(shù)支持和指導(dǎo),使我們能夠更加自信地面對這個挑戰(zhàn)。最后,我們期望接下來的比賽能夠繼續(xù)發(fā)揚(yáng)光大,吸引更多具有激情和創(chuàng)新精神的人才參與,共同推動“科技助實”這一崇高事業(yè)不斷向前發(fā)展。
雷峰網(wǎng)(公眾號:雷峰網(wǎng))
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。