丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
機(jī)器人 正文
發(fā)私信給任平
發(fā)送

0

無(wú)人機(jī)帝國(guó)創(chuàng)新史:視覺(jué)導(dǎo)航團(tuán)隊(duì)的破繭、破界與破維

本文作者: 任平   2025-09-23 10:10
導(dǎo)語(yǔ):大疆機(jī)器視覺(jué)的崛起。

01 技術(shù)牛逼獎(jiǎng)

2014年,大疆作為“空中的相機(jī)”已然成績(jī)斐然。

精靈2相機(jī)、云臺(tái)、圖傳技術(shù)成熟,精靈3視覺(jué)定位與懸停功能完善,極大提升消費(fèi)級(jí)無(wú)人機(jī)實(shí)用性與易用性,徹底改變大眾對(duì)無(wú)人機(jī)的認(rèn)知,使航拍從專業(yè)小眾走向大眾普及。

然而,大疆創(chuàng)始人Frank心中仍懷揣著三大未竟的夢(mèng)想,其中之一便是賦予無(wú)人機(jī)“眼睛”和“大腦”,使其能夠在樹(shù)林中自由穿梭,自動(dòng)跟隨用戶拍攝,并能在遭遇障礙物時(shí)自主繞行。

這一設(shè)想,在當(dāng)時(shí)看來(lái)近乎天方夜譚。

當(dāng)年底,趙叢來(lái)到大疆時(shí),毫無(wú)“正規(guī)軍”的模樣。

整個(gè)團(tuán)隊(duì)僅他一人帶領(lǐng)3位實(shí)習(xí)生龐敏健、李睿、周游。

他們既沒(méi)有獨(dú)立的研發(fā)經(jīng)費(fèi),也缺乏固定的開(kāi)發(fā)環(huán)境,甚至連項(xiàng)目本身都未被列入精靈4(Phantom 4)的初始立項(xiàng)計(jì)劃,更像是一個(gè)游離在核心業(yè)務(wù)之外的“邊緣團(tuán)隊(duì)”。

團(tuán)隊(duì)面臨的是從零開(kāi)始的挑戰(zhàn)。

在學(xué)術(shù)領(lǐng)域,當(dāng)時(shí)計(jì)算機(jī)視覺(jué)(CV)的研究多集中于簡(jiǎn)單物體的短時(shí)跟蹤,學(xué)者們比拼的是跟蹤框(Bounding - Box)的像素級(jí)精度。

而對(duì)于一個(gè)空中機(jī)器人,需要在劇烈運(yùn)動(dòng)、遮擋、復(fù)雜光影變化下實(shí)現(xiàn)長(zhǎng)時(shí)間穩(wěn)定跟隨(Long - term Tracking),并理解三維世界進(jìn)行避障,幾乎沒(méi)有成熟方案可供參考。

從相機(jī)成像、目標(biāo)識(shí)別與跟蹤、芯片底層優(yōu)化,到局部環(huán)境地圖構(gòu)建、實(shí)時(shí)導(dǎo)航?jīng)Q策以及整個(gè)數(shù)據(jù)與控制鏈路的調(diào)校,每一個(gè)環(huán)節(jié)都需要自主攻克。

更讓團(tuán)隊(duì)感到壓力的是來(lái)自大疆內(nèi)部的質(zhì)疑。

多數(shù)老同事都對(duì)他們持否定態(tài)度。

“已經(jīng)有很多前人嘗試過(guò)但做不出來(lái),沒(méi)必要瞎折騰?!?/p>

“GPS跟隨就夠了,視覺(jué)跟隨搞不出來(lái)的,搞出來(lái)了也落不了地?!?/p>

這樣的聲音時(shí)常傳入團(tuán)隊(duì)成員耳中。

在協(xié)調(diào)內(nèi)部資源時(shí),他們團(tuán)隊(duì)更是屢屢碰壁。由于項(xiàng)目不受重視,他們想要獲取特殊版本的相機(jī)、飛控固件進(jìn)行調(diào)試,都需要反復(fù)溝通。

“那段時(shí)間,我差不多是每個(gè)周末都四處請(qǐng)各個(gè)部門的同事吃飯,靠各種臨時(shí)版本拼湊起來(lái)原型(機(jī))?!?/p>

趙叢后來(lái)回憶起這段經(jīng)歷時(shí),語(yǔ)氣中仍帶著一絲感慨。

即便面臨重重阻力,趙叢始終堅(jiān)信視覺(jué)跟隨的意義。

他清楚地知道,GPS 跟隨存在明顯短板——目標(biāo)的定位誤差高達(dá) 10 米,這使得無(wú)人機(jī)只能在高空進(jìn)行跟拍,無(wú)法滿足用戶近距離拍攝的需求;同時(shí),被拍攝對(duì)象還必須隨身攜帶遙控器,極大限制了使用場(chǎng)景。

而視覺(jué)跟隨,不僅能將目標(biāo)定位精度提升至像素級(jí),擺脫被拍攝主體對(duì)遙控器的依賴,還有可能以被拍主體為中心實(shí)現(xiàn)更優(yōu)的構(gòu)圖和運(yùn)鏡,甚至對(duì)運(yùn)動(dòng)目標(biāo)實(shí)現(xiàn)像“刷鍋”(環(huán)繞拍攝)等高難度運(yùn)鏡動(dòng)作,而這些鏡頭即便是職業(yè)飛手用遙控器也難以實(shí)現(xiàn)的。

“面對(duì)未知的困難,倒沒(méi)有焦慮,反而是一種對(duì)開(kāi)拓創(chuàng)新的興奮?!壁w叢至今回憶起來(lái),“沒(méi)人做成過(guò)的事情才有意思嘛?!?/p>

2015 年中,一次偶然的機(jī)會(huì)成為了項(xiàng)目的轉(zhuǎn)折點(diǎn)。

當(dāng)時(shí),趙叢和小伙伴們正在測(cè)試場(chǎng)地調(diào)教算法時(shí),無(wú)人機(jī)穩(wěn)定跟隨著一名印度實(shí)習(xí)生模特,全程 10 分鐘無(wú)人工干預(yù),這一場(chǎng)景恰好被Frank看到。

正是這短暫的演示,讓Frank意識(shí)到了該技術(shù)的潛力,“跟隨避障” 特性自此正式被納入大疆下一代核心產(chǎn)品——精靈 4 的研發(fā)計(jì)劃中。

隨之而來(lái)的,是團(tuán)隊(duì)發(fā)展的重要機(jī)遇——趙叢團(tuán)隊(duì)獲得了擴(kuò)張的機(jī)會(huì)。他們從最初的 4 人小團(tuán)隊(duì),逐步吸納了算法工程師、嵌入式工程師、導(dǎo)航工程師等各類專業(yè)人才,包括封旭陽(yáng)、錢杰、余俊峰、劉昂、胡驍、張立天等。

同時(shí),F(xiàn)rank對(duì)項(xiàng)目進(jìn)展高度關(guān)注,每一到兩周都會(huì)親自追問(wèn)技術(shù)進(jìn)度,查看整體效果。

“他對(duì)其他團(tuán)隊(duì)及其嚴(yán)苛,經(jīng)常給出嚴(yán)厲甚至尖銳的批評(píng);每次看我們的演示反而是罕見(jiàn)出現(xiàn)的包容和期待,給出的評(píng)價(jià)也都是以鼓勵(lì)和建設(shè)性意見(jiàn)為主。”趙叢回憶道。

這種認(rèn)可,讓團(tuán)隊(duì)成員備受鼓舞,也為創(chuàng)新注入了更強(qiáng)的動(dòng)力。

然而,原型的成功只是第一步,要實(shí)現(xiàn)產(chǎn)品化,還需解決無(wú)數(shù)細(xì)節(jié)問(wèn)題。

對(duì)于無(wú)人機(jī)這類消費(fèi)級(jí)產(chǎn)品而言,任何一次技術(shù)故障都可能引發(fā)嚴(yán)重后果:若出現(xiàn)跟錯(cuò)目標(biāo)的情況,可能對(duì)人員造成安全威脅;若避障功能失效,則會(huì)導(dǎo)致無(wú)人機(jī)碰撞損壞。

因此,團(tuán)隊(duì)必須將不可預(yù)測(cè)行為的風(fēng)險(xiǎn)降至最低。

為攻克障礙物預(yù)測(cè)難題,團(tuán)隊(duì)在空曠場(chǎng)地搭建了臨時(shí)測(cè)試場(chǎng),用籃球架、圍欄等物品模擬樹(shù)林、路燈、巖石等復(fù)雜空中障礙環(huán)境,進(jìn)行高強(qiáng)度的調(diào)試。

在漫長(zhǎng)的調(diào)試周期里,無(wú)人機(jī)碰撞損壞成為常態(tài)。

“那幾個(gè)月基本沒(méi)有休過(guò)周末,不記得撞壞了多少架無(wú)人機(jī),維修部修到崩潰。”趙叢笑著回憶道。

每一次碰撞,團(tuán)隊(duì)都會(huì)仔細(xì)分析故障原因,優(yōu)化算法參數(shù)與控制邏輯,逐步提升系統(tǒng)的穩(wěn)定性與可靠性。

經(jīng)過(guò)無(wú)數(shù)次的調(diào)試與優(yōu)化,趙叢團(tuán)隊(duì)終于攻克了全世界AI和機(jī)器人領(lǐng)域尚未解決的長(zhǎng)時(shí)間目標(biāo)識(shí)別跟蹤和遮擋恢復(fù)難題,并通過(guò)雙目深度計(jì)算建立局部3D地圖和自主規(guī)劃路徑,實(shí)現(xiàn)了障礙物的主動(dòng)繞行。

這意味著,無(wú)人機(jī)首次具備了在復(fù)雜動(dòng)態(tài)環(huán)境中,長(zhǎng)時(shí)間穩(wěn)定跟蹤目標(biāo)并自主規(guī)避障礙的能力。

后來(lái),他們回憶道:“他們做得事,類似于幾年后興起的自動(dòng)駕駛,無(wú)人機(jī)時(shí)刻面對(duì)的是動(dòng)態(tài)變化的目標(biāo)、局部可見(jiàn)的障礙物、實(shí)時(shí)變化的預(yù)測(cè)和決策,以及對(duì)事故的幾乎零容忍?!?/p>

當(dāng)時(shí),行業(yè)內(nèi)也有其他企業(yè)在嘗試探索類似的問(wèn)題。

在2016年初,Intel就展示過(guò)其室內(nèi)無(wú)人機(jī)跟隨方案,但該方案更像是一場(chǎng)“實(shí)驗(yàn)室演出”——整個(gè)房間布滿VICON傳感器,無(wú)人機(jī)僅能執(zhí)行預(yù)設(shè)的固定動(dòng)作,毫無(wú)適應(yīng)真實(shí)復(fù)雜戶外環(huán)境的可能。

行業(yè)內(nèi)人士評(píng)價(jià):“和當(dāng)今很多具身智能一樣,是自動(dòng)化,并不具備什么智能”。

就在2個(gè)月后的2016年3月,在美國(guó)紐約,大疆正式發(fā)布新一代消費(fèi)級(jí)無(wú)人機(jī)——精靈4。

發(fā)布會(huì)上,演示畫(huà)面中,精靈4無(wú)人機(jī)一路跟隨跑者、滑板玩家、跑酷冠軍,以流暢優(yōu)雅的姿態(tài)避開(kāi)沿途的巖石、路燈等障礙物,并自動(dòng)完成環(huán)繞運(yùn)鏡、一鍵生成短片,全場(chǎng)為之震撼。

精靈 4 的發(fā)布迅速引爆全球市場(chǎng)。

在 YouTube 平臺(tái)上,相關(guān)演示視頻的在線觀看人數(shù)突破 500 萬(wàn),無(wú)數(shù)明星、網(wǎng)紅將其視作時(shí)尚單品,紛紛在社交平臺(tái)分享使用精靈 4 拍攝的作品。

《財(cái)富》雜志更是將大疆譽(yù)為 “無(wú)人機(jī)行業(yè)的蘋(píng)果”。作為全球首款具有視覺(jué)能力的消費(fèi)級(jí)機(jī)器人產(chǎn)品,精靈 4 上市后銷量迅速突破百萬(wàn)臺(tái),為大疆帶來(lái)超百億元營(yíng)收,成為精靈系列的經(jīng)典收官之作。

憑借這一突破性技術(shù)成果,該技術(shù)創(chuàng)新成為大疆 2015 年度研發(fā)部最主要的關(guān)鍵性技術(shù)突破,趙叢作為開(kāi)創(chuàng)者和技術(shù)總負(fù)責(zé)人獲得了 “技術(shù)牛逼獎(jiǎng)”—— 這也是大疆首次設(shè)立此項(xiàng)獎(jiǎng)勵(lì)。

而創(chuàng)始人Frank更是將精靈 4 形容為 “自己迄今為止最滿意的產(chǎn)品”。

他在發(fā)布會(huì)上張開(kāi)雙手向外界宣告:“歡迎來(lái)到機(jī)器視覺(jué)時(shí)代?!?與此同時(shí),大疆悄然將自身的定位描述從以往的 “ Flying Camera ”(飛行相機(jī))轉(zhuǎn)變?yōu)?“ Flying Robot ”(飛行機(jī)器人),標(biāo)志著無(wú)人機(jī)行業(yè)正式邁入智能時(shí)代。

伴隨著不斷涌現(xiàn)出的創(chuàng)新,大疆也迎來(lái)了高速發(fā)展的 5 年,估值從 100 億人民幣上漲到了 200 億美金。

而創(chuàng)新的價(jià)值,從來(lái)不是一蹴而就的光鮮,而是在無(wú)人問(wèn)津時(shí)的堅(jiān)持,在重重質(zhì)疑下的突破,最終讓看似不可能的夢(mèng)想,照進(jìn)現(xiàn)實(shí)。

趙叢回憶說(shuō),“大疆擁有非常好的創(chuàng)新土壤,整個(gè)公司非常低調(diào)務(wù)實(shí)且崇尚和鼓勵(lì)創(chuàng)新,當(dāng)時(shí)這樣的氛圍十分濃烈”。

02 端側(cè)AI時(shí)刻

精靈 4(Phantom 4)的成功,并未讓趙叢團(tuán)隊(duì)停下創(chuàng)新的腳步。

在消費(fèi)級(jí)無(wú)人機(jī)市場(chǎng),用戶對(duì)產(chǎn)品的便攜性、智能化提出了更高要求 —— 既需要更小巧便攜的機(jī)身,又渴望強(qiáng)大的 AI 功能。

這一趨勢(shì)推動(dòng)著團(tuán)隊(duì)向更復(fù)雜的技術(shù)領(lǐng)域發(fā)起挑戰(zhàn),而大疆 Mavic Pro 這款產(chǎn)品意外成為了 AI 學(xué)術(shù)界、芯片界、智能硬件界首次跨界碰撞的載體,大疆本身,也悄然連接了三個(gè)原本平行的世界。

2016 年,計(jì)算機(jī)視覺(jué)領(lǐng)域最頂級(jí)的會(huì)議 CVPR 在美國(guó)拉斯維加斯舉辦。

與以往不同,這一屆會(huì)議的贊助商名單中,出現(xiàn)了大疆的名字。其參展展位被安排在 Apple、Intel、Microsoft 和 Google 等科技巨頭之間。

展會(huì)期間,大疆展示區(qū)始終人頭攢動(dòng)。

李飛飛、何愷明等 AI 學(xué)術(shù)界大牛紛紛駐足,他們的驚訝源于兩點(diǎn):

一是無(wú)人機(jī)竟能實(shí)現(xiàn)如此高程度的智能化;

二是大疆居然將深度學(xué)習(xí)技術(shù)成功部署在了消費(fèi)級(jí)無(wú)人機(jī)的端側(cè)芯片上。

在當(dāng)時(shí)的行業(yè)環(huán)境中,頂級(jí)智能硬件廠商如蘋(píng)果、特斯拉都尚未推出成熟的 AI 產(chǎn)品,深度學(xué)習(xí)技術(shù)多運(yùn)行在服務(wù)器端,普通消費(fèi)者對(duì) “端側(cè) AI” 的概念更是聞所未聞。

這種跨界碰撞的背后,是趙叢團(tuán)隊(duì)面臨的極端技術(shù)難題。

Mavic Pro 所搭載的芯片為聯(lián)芯 LC 1860,單核心算力僅為 1.2GFlops ,尚不如當(dāng)今主流智能硬件端側(cè)芯片算力的 1/3000,在如此有限的硬件資源上實(shí)現(xiàn)深度學(xué)習(xí)應(yīng)用,意味著必須在算法優(yōu)化、神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)、模型訓(xùn)練技巧等方面做到極致。

有了之前在精靈 4 上探索卷積神經(jīng)網(wǎng)絡(luò)(CNN 模型)小型化的經(jīng)驗(yàn),趙叢和伙伴們開(kāi)始了針對(duì)更多 CV 任務(wù)進(jìn)行端側(cè)部署的嘗試。

隨著一批新人骨干張李亮、李思晉、李堯、許旌陽(yáng)、朱高等的加入,團(tuán)隊(duì)開(kāi)始在算法層面,對(duì)各個(gè)任務(wù)進(jìn)行網(wǎng)絡(luò)結(jié)構(gòu)的設(shè)計(jì)、裁剪、蒸餾訓(xùn)練、以及 8 位定點(diǎn)量化,在保證識(shí)別精度的前提下,最大限度降低模型體積與計(jì)算量;

其次在芯片適配層面,他們建立了 “模型設(shè)計(jì) - 訓(xùn)練 - 量化 - 芯片適配” 的聯(lián)合開(kāi)發(fā)和調(diào)試流程,每一步都與芯片底層加速指令深度結(jié)合,避免算力浪費(fèi);

最終,他們成功在 1.2GFlops 的 32 位 ARM 處理器上,實(shí)時(shí)運(yùn)行 100KB 參數(shù)量、50MFLOPS 計(jì)算量的目標(biāo)檢測(cè)識(shí)別和人體姿態(tài)識(shí)別模型,實(shí)現(xiàn)了無(wú)人機(jī)手勢(shì)拍照控制功能,讓用戶僅通過(guò)特定手勢(shì),就能觸發(fā)拍攝指令。

Mavic Pro 的技術(shù)突破,不僅改變了消費(fèi)者對(duì)無(wú)人機(jī)的認(rèn)知,更引發(fā)了行業(yè)連鎖反應(yīng)。芯片廠商首次意識(shí)到,消費(fèi)級(jí)硬件芯片竟能承載如此豐富的 AI 應(yīng)用場(chǎng)景。

當(dāng)時(shí)芯片設(shè)計(jì)領(lǐng)域的前輩、IEEE Fellow、Candence 和 Tensilica 公司創(chuàng)始人Chris Rowen,專程從美國(guó)飛來(lái)深圳約見(jiàn)趙叢,探討端側(cè) AI 芯片的發(fā)展方向 —— 這一交流,也間接推動(dòng)了后續(xù)消費(fèi)級(jí) AI  芯片的技術(shù)迭代。

除手勢(shì)控制外,團(tuán)隊(duì)還在 Mavic Pro 上攻克了另外兩大技術(shù)難題:

其一為精準(zhǔn)降落功能:利用 SLAM 回環(huán)檢測(cè)技術(shù),結(jié)合向量詞庫(kù)匹配算法,實(shí)現(xiàn)了厘米級(jí)誤差的自主返航降落,解決了傳統(tǒng) GPS 降落精度不足的問(wèn)題;

其二為超遠(yuǎn)距離避障:通過(guò)優(yōu)化目標(biāo)跟蹤算法,讓無(wú)人機(jī)可識(shí)別并避開(kāi) 1 公里外的高山及建筑,攻克了此前無(wú)人機(jī) “近視眼” 的行業(yè)痛點(diǎn)。

市場(chǎng)層面,Mavic Pro 同樣取得了巨大成功。它不僅登上《時(shí)代》周刊年度最具影響力產(chǎn)品榜首,還被媒體評(píng)為 “史上最智能無(wú)人機(jī)”。上市后,Mavic Pro 銷量迅速突破百萬(wàn)臺(tái),為大疆帶來(lái) 180 億元營(yíng)收,成為繼精靈 4 之后,又一款現(xiàn)象級(jí)產(chǎn)品。

這場(chǎng) AI、芯片、智能硬件的跨界碰撞,不僅讓 Mavic Pro 成為經(jīng)典,更開(kāi)創(chuàng)了消費(fèi)級(jí)智能硬件的 “端側(cè) AI” 時(shí)代——它證明,即便在有限的硬件資源下,通過(guò)技術(shù)創(chuàng)新,依然能讓復(fù)雜的 AI 功能走進(jìn)普通人的生活。創(chuàng)新的裂變,往往始于對(duì) “不可能” 的挑戰(zhàn)。當(dāng)不同領(lǐng)域的技術(shù)壁壘被打破,碰撞出的火花,便會(huì)照亮整個(gè)行業(yè)的前行方向。

03 那時(shí)的具身智能

Mavic Pro 的成功,讓 “端側(cè) AI” 成為消費(fèi)級(jí)無(wú)人機(jī)的新標(biāo)配,但趙叢團(tuán)隊(duì)并未止步于已有的突破。在 2017 年初大疆第一代自研芯片流片成功后,Mavic Air 項(xiàng)目啟動(dòng)。

趙叢提出了一個(gè)更激進(jìn)的目標(biāo):

通過(guò)AI實(shí)現(xiàn)完全脫離遙控器的全手勢(shì)操控,讓無(wú)人機(jī)成為真正意義上的 “空中自主機(jī)器人”—— 用戶無(wú)需任何額外設(shè)備,僅憑手勢(shì)就能完成從起飛、飛行控制、拍攝到降落的全流程操作,讓 Mavic Air 像一只隨時(shí)聽(tīng)候調(diào)遣的寵物。

這一目標(biāo),相當(dāng)于在無(wú)人機(jī)領(lǐng)域要實(shí)現(xiàn)空中的 L3 級(jí)別自動(dòng)駕駛,其技術(shù)難度與安全要求遠(yuǎn)超此前所有產(chǎn)品。

“當(dāng)時(shí)也是受 Mavic Air 產(chǎn)品經(jīng)理的一句話之托,希望給產(chǎn)品增加一些亮點(diǎn),我感覺(jué)這個(gè)軸距的機(jī)型,從定位上除了飛高飛遠(yuǎn)拍風(fēng)景以外,非常適合近距離用戶交互。而且這幾顆 CEVA DSP 不用來(lái)做些酷炫的新功能很可惜。”趙叢回憶道。

當(dāng)時(shí)距離 Mavic Air 計(jì)劃發(fā)布僅剩 9 個(gè)月,而團(tuán)隊(duì)面臨的不僅是時(shí)間壓力,還有硬件層面的全新挑戰(zhàn)。

此次 Mavic Air 搭載的是大疆第一代自研芯片,搭載了 4 顆 CEVA DSP ,每個(gè)核心的 16 位定點(diǎn)計(jì)算能力是 30 G FLOPS。雖然與聯(lián)芯 LC 1860 相比有了較大的算力提升,但想要達(dá)到全自主飛行的精度仍然十分捉襟見(jiàn)肘。

CEVA 官方只提供了Google Inception v2/v3 的參考模型,用作圖像分類,而且也只能跑到 30 %左右的 MAC 利用率?!斑@哪夠用,我們要跑一堆 AI 模型,那我們自己重寫(xiě)工具鏈吧!”

趙叢回憶道,“我們沒(méi)有選擇等待更高算力芯片的問(wèn)世,而是決定從軟件層面挖掘硬件潛力?!?/p>

要在這樣的硬件基礎(chǔ)上同時(shí)運(yùn)行 6 個(gè) AI 模型,支撐全手勢(shì)操控的復(fù)雜需求,團(tuán)隊(duì)必須在芯片優(yōu)化與算法設(shè)計(jì)上實(shí)現(xiàn)三重突破:

首先要解決的是算力瓶頸。

他們對(duì)自研芯片中的 2 顆 CEVA DSP 核心進(jìn)行了徹底的軟件重寫(xiě),通過(guò)重構(gòu)指令集、優(yōu)化數(shù)據(jù)流轉(zhuǎn)邏輯,將 16x16 的MAC 單元拆成 2 個(gè) 8x8 的 MAC 單元來(lái)使用。這一改造不僅讓芯片的理論算力提升 2 倍,更關(guān)鍵的是,通過(guò)算法和芯片的緊耦合協(xié)同設(shè)計(jì),將算法利用率提高了 8 倍,最終使芯片的 MAC 利用率達(dá)到了恐怖的 97% ——這意味著每一分算力都被精準(zhǔn)利用,幾乎沒(méi)有浪費(fèi)。

其次是AI算法。

全手勢(shì)操控對(duì)識(shí)別精度的要求極高,任何微小的誤差都可能導(dǎo)致操作失誤,且由于脫離了遙控器,系統(tǒng)甚至沒(méi)有機(jī)會(huì)提醒用戶介入修正。

甚至用戶可能會(huì)期待他在 0.5米~10 米的范圍內(nèi)的所有交互動(dòng)作都可以被無(wú)人機(jī)識(shí)別和響應(yīng)。

為解決這一問(wèn)題,需要高精度且實(shí)時(shí)的運(yùn)行 6 個(gè) AI 模型:近身頭肩檢測(cè)識(shí)別、遠(yuǎn)場(chǎng)全身檢測(cè)識(shí)別、近身頭部跟蹤、遠(yuǎn)場(chǎng)全身跟蹤、人體關(guān)節(jié)點(diǎn)、手部手勢(shì)識(shí)別。為了避免定點(diǎn)量化造成的模型精度損失,他們研發(fā)了 8 位無(wú)損訓(xùn)練技術(shù),通過(guò)將定點(diǎn)量化納入訓(xùn)練環(huán)節(jié),保證了 8 位定點(diǎn)與 32 位浮點(diǎn)的模型誤差在 0.1‰ 以內(nèi),既滿足了實(shí)時(shí)性需求,又確保了手勢(shì)識(shí)別的準(zhǔn)確性。

與此同時(shí),導(dǎo)航控制方面的開(kāi)發(fā)也在同步推進(jìn)。

“用戶的手部動(dòng)作太多太豐富了,這和之前精靈 4 的跟拍完全不一樣。你需要面對(duì),哪些是用戶有意識(shí)的召喚和控制,哪些是無(wú)意識(shí)的抓耳撓腮,哪些是主人的動(dòng)作,哪些可能是其他人錯(cuò)位而構(gòu)成的干擾,哪些情況是 AI 觀測(cè)失效需要導(dǎo)航控制加強(qiáng)預(yù)測(cè),哪些情況是 AI 觀測(cè)誤報(bào)需要過(guò)濾。跟得太緊了,飛機(jī)的動(dòng)作太猛會(huì)嚇到圍觀的人,跟得太松了,主人會(huì)覺(jué)得它笨得像熊。”

趙叢笑著說(shuō)道,“2017 年還沒(méi)有端到端、VLA 的概念,每個(gè)細(xì)節(jié)都是一行一行代碼,一個(gè)一個(gè)參數(shù)調(diào)教出來(lái)的。甚至連交互的設(shè)計(jì)、指示燈的閃爍,F(xiàn)rank只提了一個(gè)要求,就是要讓用戶不看說(shuō)明書(shū)的情況下憑直覺(jué)就可以操作“。

經(jīng)過(guò) 9 個(gè)月的極限攻關(guān),團(tuán)隊(duì)最終在 Mavic Air 上實(shí)現(xiàn)了預(yù)設(shè)目標(biāo):

用戶只需伸出手掌,無(wú)人機(jī)即可通過(guò)手勢(shì)識(shí)別完成起飛;在 0.5 米~ 10 米范圍內(nèi),通過(guò)揮手、推拉、旋轉(zhuǎn)等動(dòng)作,就能精準(zhǔn)控制無(wú)人機(jī)的飛行方向、距離與高度;拍攝時(shí),一個(gè)簡(jiǎn)單的手勢(shì)即可觸發(fā)拍照或錄像;任務(wù)結(jié)束后,手勢(shì)指令又能引導(dǎo)無(wú)人機(jī)平穩(wěn)降落。

整個(gè)過(guò)程無(wú)需任何額外設(shè)備,完全依靠無(wú)人機(jī)自身的視覺(jué)感知與 AI 決策完成。

這一技術(shù)突破的意義,遠(yuǎn)超產(chǎn)品本身。

直至 2025 年的今天,業(yè)界多數(shù)具身智能相關(guān)研發(fā)仍依賴遙控器進(jìn)行輔助控制,而 8 年前的 Mavic Air 的全手勢(shì)操控,首次證明了消費(fèi)級(jí)機(jī)器人可以實(shí)現(xiàn)真正意義上的 “自主交互”。

此后,各國(guó)政要來(lái)大疆參觀考察時(shí),全手勢(shì)操控成為必看的代表性功能——它用最直觀的方式,展現(xiàn)了機(jī)器視覺(jué)與 AI 技術(shù)融合的可能性。

市場(chǎng)反饋同樣印證了技術(shù)的價(jià)值。Mavic Air 不僅再次登上《時(shí)代》周刊年度最具影響力產(chǎn)品榜首,延續(xù)了 “史上最智能無(wú)人機(jī)” 的口碑,更在商業(yè)上取得巨大成功:上市后迅速成為 2018 年消費(fèi)級(jí)無(wú)人機(jī)銷冠。

在 Mavic Air 上推出的 “一鍵短片” 功能,包含 “小行星”“彗星” 等創(chuàng)新模式,通過(guò) AI 算法自動(dòng)規(guī)劃飛行軌跡與云臺(tái)姿態(tài),讓普通用戶也能輕松拍攝出電影級(jí)的短視頻,進(jìn)一步拓寬了無(wú)人機(jī)的應(yīng)用場(chǎng)景。

從技術(shù)層面看,Mavic Air 的全手勢(shì)操控為具身智能的發(fā)展提供了重要啟示:

在硬件資源有限的情況下,通過(guò)算法與芯片的深度協(xié)同優(yōu)化,依然能實(shí)現(xiàn)高復(fù)雜度的自主交互功能。它證明,具身智能的核心并非單純依賴高算力硬件,而是在于對(duì) “感知 - 決策 – 控制” 全鏈路的精準(zhǔn)把控,以及對(duì)用戶需求的深度理解。

大疆團(tuán)隊(duì)在 Mavic Air 項(xiàng)目中展現(xiàn)的,不僅是技術(shù)創(chuàng)新能力,更是對(duì) “極限挑戰(zhàn)” 的掌控力——在有限的時(shí)間與資源下,將看似不可能的目標(biāo)轉(zhuǎn)化為現(xiàn)實(shí),這正是創(chuàng)新最核心的價(jià)值所在。

04 6000份簡(jiǎn)歷的1/2

2017-2018 年的兩年間,趙叢團(tuán)隊(duì)進(jìn)入了創(chuàng)新井噴期。

在精靈 4、Mavic Pro、Mavic Air 之外,團(tuán)隊(duì)還在 Spark、自動(dòng)駕駛、Mavic Pro 2、Robomaster、農(nóng)業(yè)無(wú)人機(jī) T16 等領(lǐng)域持續(xù)保持創(chuàng)新和突破。

據(jù)稱,大疆每年年終總結(jié)全年誕生的兩三項(xiàng)最重要的突破創(chuàng)新中,就有一兩項(xiàng)是來(lái)自于這支視覺(jué)導(dǎo)航團(tuán)隊(duì)。

“2015 年在招募算法工程師的時(shí)候,被問(wèn)到最多的問(wèn)題是‘大疆要做視覺(jué)用來(lái)干什么’。2016 年被問(wèn)到最多的是‘大疆要做深度學(xué)習(xí)用來(lái)干什么’,后來(lái)這些問(wèn)題就消失了。我記得到了 2018 年的校招,整個(gè)研發(fā)部收到的約 6000 份簡(jiǎn)歷當(dāng)中,有大約 3000 份是投向了機(jī)器學(xué)習(xí)工程師的崗位。那個(gè)階段大疆在 AI 相關(guān)領(lǐng)域的眾多企業(yè)中,是領(lǐng)跑者的存在。”趙叢回憶道。

這一時(shí)期,隨著陳曉智、陳競(jìng)、劉政哲、潘為、潘緒洋等新一批技術(shù)骨干的加入,創(chuàng)新開(kāi)始在大疆的各個(gè)產(chǎn)品線遍地開(kāi)花:

從無(wú)人機(jī),到手持云臺(tái)相機(jī)、自動(dòng)駕駛、Robomaster 機(jī)甲大師、農(nóng)業(yè)噴灑無(wú)人機(jī)等等。

2017 年,大疆的視覺(jué)團(tuán)隊(duì)面臨一個(gè)殘酷現(xiàn)實(shí):無(wú)人機(jī)仍是極客玩具,從未真正“破圈”。

趙叢團(tuán)隊(duì)決定向“繁瑣”開(kāi)刀。他們推出的 Spark 不像無(wú)人機(jī),倒像一款智能寵物——用戶托掌即起飛,揮手能操控,點(diǎn)擊可出片。背后是毫秒級(jí)的人臉識(shí)別、CNN 手勢(shì)算法和 95% 以上的交互精度。它用“一鍵短片”干掉 99% 的飛行學(xué)習(xí)成本,第一次讓小白用戶拍出電影感鏡頭。

但這只是開(kāi)始。

一年后,Mavic 2 Pro 把跟蹤算法碾到了新高度。它不僅看得見(jiàn)目標(biāo),更能預(yù)測(cè)運(yùn)動(dòng)、繞開(kāi)障礙,甚至在目標(biāo)消失后仍能智能續(xù)追。真正破圈的是“一鍵短片”。用戶不用學(xué)任何飛行動(dòng)作,只要點(diǎn)一下,Spark 就能自動(dòng)完成漸遠(yuǎn)、環(huán)繞、螺旋等電影運(yùn)鏡,生成 10 秒短視頻。它降低了創(chuàng)作的門檻,也重新定義了消費(fèi)級(jí)無(wú)人機(jī)的交互標(biāo)桿。

同年,大疆殺入農(nóng)業(yè)。T16 植保機(jī)搭載的視覺(jué)系統(tǒng),能在 1 分鐘內(nèi)掃描200畝地,精準(zhǔn)識(shí)別每一棵果樹(shù)、電線桿和水塘,還實(shí)現(xiàn)了“哪兒有樹(shù)飛哪兒,沒(méi)樹(shù)不飛,高樹(shù)高飛,低樹(shù)低飛”。有數(shù)字顯示,這款農(nóng)機(jī)將農(nóng)藥成本壓降 30% ,作業(yè)效率提升 5 倍,可以說(shuō)真正用機(jī)器視覺(jué)重新定義了“精準(zhǔn)農(nóng)業(yè)”,也是大疆技術(shù)從天空走向土地,從創(chuàng)作走向生產(chǎn)的一個(gè)例子。

2019 年,技術(shù)落地教育。RoboMaster S1 機(jī)器人配備31個(gè)傳感器,能識(shí)別人、標(biāo)簽、手勢(shì)甚至掌聲,支持從 Scratch 到Python的無(wú)縫編程過(guò)渡。它讓高中生也能親手搭建一臺(tái)真正具有視覺(jué)能力的 AI 機(jī)器人。

實(shí)際上,在創(chuàng)新高歌猛進(jìn)的兩年里,也有難題。

趙叢講述,當(dāng)時(shí)團(tuán)隊(duì)面臨的已不僅是技術(shù)問(wèn)題,而是急劇增長(zhǎng)的碎片化需求,倒逼團(tuán)隊(duì)在 2018 年中拆分為機(jī)器學(xué)習(xí)部,更聚焦于 AI 底層突破。

從 Spark 到 T16 ,這支最初 4 人的小組推動(dòng)大疆從“飛行相機(jī)”蛻變?yōu)椤帮w行機(jī)器人”。而這些突破,也悄悄為后日的大疆埋下伏筆:后來(lái)大疆孵化的許多創(chuàng)業(yè)項(xiàng)目,都源自這個(gè)階段積累的視覺(jué)基因。

05 離開(kāi)大疆的日子

2019年,趙叢離開(kāi)大疆,一年后創(chuàng)立共達(dá)地。

在籌備創(chuàng)業(yè)的那一年,趙叢不明白:“AI賦能千行百業(yè)”的口號(hào)已喊響多年,但真正實(shí)現(xiàn)成功商業(yè)化的案例卻寥寥無(wú)幾?”

深入調(diào)研后,趙叢發(fā)現(xiàn)了問(wèn)題的核心矛盾:

一方面,千行百業(yè)蘊(yùn)含著海量且復(fù)雜的AI算法需求——從城市治理中的細(xì)節(jié)監(jiān)測(cè),到工業(yè)生產(chǎn)里手機(jī)零部件的高精度質(zhì)檢,每個(gè)行業(yè)所需的AI算法數(shù)以千計(jì);

另一方面,各行業(yè)仍面臨AI人才的短缺。據(jù)統(tǒng)計(jì),2025年全國(guó)各行業(yè)AI工程師缺口總和將達(dá)到2000萬(wàn)。

供需之間的巨大差距,讓AI技術(shù)難以真正滲透到產(chǎn)業(yè)深處。這些難題相互疊加,形成了AI落地的“死亡循環(huán)”:碎片化需求推高開(kāi)發(fā)成本,泛化能力不足增加迭代頻率,人才短缺延長(zhǎng)項(xiàng)目周期,最終導(dǎo)致企業(yè)投入產(chǎn)出比失衡,不敢輕易嘗試AI應(yīng)用,進(jìn)一步限制了行業(yè)發(fā)展。

趙叢深刻意識(shí)到,要打破這一循環(huán),不能依賴傳統(tǒng)的“定制開(kāi)發(fā)”模式,必須從技術(shù)底層、產(chǎn)品形態(tài)與商業(yè)模式三個(gè)維度同時(shí)進(jìn)行系統(tǒng)性創(chuàng)新,找到一條可規(guī)?;瘡?fù)制的路徑。

2020年,趙叢創(chuàng)辦了共達(dá)地,致力于通過(guò)技術(shù)創(chuàng)新、產(chǎn)品創(chuàng)新與商業(yè)模式創(chuàng)新,打破AI廣泛落地的壁壘,讓AI技術(shù)真正服務(wù)于千行百業(yè)。

在技術(shù)層面,通過(guò)端到端的AutoML創(chuàng)新來(lái)模擬AI工程師的工作流程。用戶只需上傳數(shù)據(jù),系統(tǒng)就能自動(dòng)分析場(chǎng)景的數(shù)據(jù)特點(diǎn),自動(dòng)對(duì)數(shù)據(jù)進(jìn)行標(biāo)注,自動(dòng)設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),自動(dòng)訓(xùn)練與調(diào)參,以及半自動(dòng)進(jìn)行芯片適配。點(diǎn)點(diǎn)鼠標(biāo),即可生成能在邊緣和終端直接運(yùn)行的AI算法。

在產(chǎn)品層面,打造業(yè)界首個(gè)低門檻端到端的AI訓(xùn)練和推理平臺(tái)。該平臺(tái)支持拖拉拽式業(yè)務(wù)邏輯編排與多模態(tài)大模型的用戶交互,適配10余個(gè)品牌超100款芯片。

在商業(yè)模式上,通過(guò)解決方案咨詢來(lái)積累大量的B端客戶,通過(guò)高效低門檻的算法服務(wù)沉淀大量的AI應(yīng)用場(chǎng)景,通過(guò)對(duì)這些應(yīng)用場(chǎng)景的不斷抽象來(lái)打磨更好的產(chǎn)品使用體驗(yàn)。

06 后記

坦白講,趙叢這幫人,一直都是野路子。

當(dāng)年在大疆,他硬是帶著幾個(gè)兄弟給無(wú)人機(jī)“開(kāi)了天眼”,從零磕出機(jī)器視覺(jué),讓飛機(jī)學(xué)會(huì)自己看路、認(rèn)人、避障。圈內(nèi)人都說(shuō):這小子夠狠,資源沒(méi)有、代碼自己寫(xiě),炸過(guò)的機(jī)比別人飛過(guò)的還多。

后來(lái)出來(lái)搞共達(dá)地,他依然不信邪。AI落地這潭深水,多少團(tuán)隊(duì)淹死在里頭,趙叢偏要摸出一條路來(lái)。沒(méi)場(chǎng)景?下地!沒(méi)數(shù)據(jù)?硬訓(xùn)!說(shuō)白了就是一個(gè)道理,搞技術(shù)不是請(qǐng)客吃飯,是打仗。你得比問(wèn)題更兇,比痛點(diǎn)更狠。

回頭看看,從飛控算法到農(nóng)業(yè)噴藥,從視覺(jué)跟蹤到千行百業(yè),趙叢這幫人還不想躺平。他們信的是手上有代碼,眼里有需求,腳下就得踩出條路。

如今江湖再遇,他依舊那句話:“別廢話,就是干。解決問(wèn)題的路上,從來(lái)沒(méi)有終點(diǎn),只有下一個(gè)山頭。”

在記錄趙叢他們的故事時(shí),筆者曾找趙叢本人要一張團(tuán)隊(duì)合影,結(jié)果只有這一張團(tuán)隊(duì)趴在地上的背影,誰(shuí)都沒(méi)露出正臉。

無(wú)人機(jī)帝國(guó)創(chuàng)新史:視覺(jué)導(dǎo)航團(tuán)隊(duì)的破繭、破界與破維

這也是個(gè)注腳。

趙叢這幫搞技術(shù)的人,事兒做得轟天動(dòng)地,回過(guò)頭看,卻只覺(jué)得那天普通得不能再普通。照樣調(diào)試、跑碼、爭(zhēng)論、加班,深夜的實(shí)驗(yàn)室燈亮著,泡面盒堆在墻角——當(dāng)時(shí)他們或許沒(méi)覺(jué)得自己正在“改變世界”,只尋思著這個(gè) bug 今晚必須干掉。

說(shuō)到底,真故事,就是這樣。

雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))雷峰網(wǎng)

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知

分享:
相關(guān)文章
最新文章
請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)