丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
人工智能 正文
發(fā)私信給叢末
發(fā)送

0

對話碼隆科技 CTO 碼特:應(yīng)對商品識別獨有挑戰(zhàn),技術(shù)研發(fā)實力是根本

本文作者: 叢末 2019-06-16 13:00
導(dǎo)語:并不斷用現(xiàn)有的學術(shù)基準來測試自己的技術(shù)

雷鋒網(wǎng) AI 科技評論按:隨著人工智能的發(fā)展步入加速期,以計算機視覺為代表的人工智能技術(shù)也逐漸落地到行業(yè)場景中,開始在安防、教育、金融、物流等行業(yè)大顯身手,并從中衍生出一批新的應(yīng)用場景,如新零售、無人駕駛等等,在科技巨頭以及人工智能初創(chuàng)企業(yè)中都激起了千波浪。

然而,行業(yè)應(yīng)用場景中的一系列計算機視覺底層技術(shù),仍存在較大的挑戰(zhàn),就比如說商品識別技術(shù),相較于人臉識別、場景識別等技術(shù)相比,它因其特殊屬性而面臨著其獨有的挑戰(zhàn),比如商品包裝雷同問題、商品上新問題等等,對于該細分行業(yè)的玩家在技術(shù)實力以及技術(shù)產(chǎn)品化方面都提出了更高的要求。

作為一家在商品識別領(lǐng)域深耕四年多的創(chuàng)業(yè)公司,碼隆科技憑借其在行業(yè)內(nèi)深厚的技術(shù)積累以及豐富的產(chǎn)品商業(yè)化經(jīng)驗,業(yè)已成為該細分領(lǐng)域的領(lǐng)先者。本次,雷鋒網(wǎng) AI 科技評論聚焦 AI 商品識別技術(shù)這一主題,與該公司的 CTO 碼特(Matt Scott)進行了一次對話,碼特也從碼隆科技在技術(shù)研發(fā)、產(chǎn)品化方面積淀下來的經(jīng)驗出發(fā),為大家分享了在商品識別這一細分領(lǐng)域中的一些思路。

應(yīng)對商品識別的獨有難題,技術(shù)研發(fā)實力是根本!

碼隆科技成立于 2014 年,在當時無論是科技巨頭還是人工智能創(chuàng)業(yè)公司紛紛青睞人臉識別、自動駕駛等領(lǐng)域的背景下,創(chuàng)立之初便另辟蹊徑,選擇了商品識別這一賽道,而這一開始也為碼隆科技此后在該領(lǐng)域的發(fā)展贏得了先機。

對于公司成立之初的這一決定,碼特回憶道:「當四年前我們剛剛成立并做出這個決定時,還沒有其他公司完全專注于人工智能商品識別這一領(lǐng)域。在這五年的時間里,我們專注技術(shù)研發(fā),并同時兼顧核心科研成果的實際場景落地,可以說,如今即便在世界范圍內(nèi),我們都是將深度學習技術(shù)應(yīng)用于商品識別這一領(lǐng)域的引領(lǐng)者。雖然在該領(lǐng)域,我們目前也面臨著一些競爭對手,但是碼隆在研發(fā)、工程、數(shù)據(jù)和國際客戶、合作伙伴方面,都有著先天優(yōu)勢?!?/p>

而實際上,相比于一般場景中所用到的人臉識別、場景識別而言,商品識別技術(shù)存在許多其獨有的難題,在場景落地中面臨著更大的挑戰(zhàn),對此,碼特詳細介紹道:「例如,商品有海量的庫存單位(SKU, Stock Keeping Unit),其中有很多都是細粒度的,存在的差異是很難分辨出來的。不僅如此,即使是同一種商品或者庫存單位,在不同的情境下也有可能呈現(xiàn)出非常不同的外觀,比如針對同一種商品的電商賣家秀和買家秀,往往外觀效果大有不同。此外,商品識別技術(shù)還需要解決的一個基本問題是:因為商品外部包裝經(jīng)常更新,需要保證高效的庫存單位更新能力,也就是上新的問題?!?/p>

對此,碼隆科技倚靠扎實的技術(shù)研發(fā)實力,從不同的技術(shù)路徑來解決這些問題。「比如針對商品上新問題,我們自主研發(fā)了弱監(jiān)督學習算法 CurriculumNet,能夠有效處理有噪音數(shù)據(jù)和數(shù)據(jù)不均衡的情況,讓我們僅需 20 張圖像數(shù)據(jù)進行訓練就能取得與訓練成百上千張圖像相同的效果,從而極大地減輕了其數(shù)據(jù)收集和標注的壓力和成本。另外對于不同商品的包裝相似問題,我們研究的細粒度分類(Fine-grained Classification)技術(shù)能夠讓 AI 系統(tǒng)做出判斷達到與人類根據(jù)視覺觀察做出正確判斷同樣的水準,在某些場景中,機器識別的正確率甚至更高?!?/p>

零售是最優(yōu)先落地商品識別技術(shù)的行業(yè)

作為一家注重商品識別技術(shù)研發(fā)和商業(yè)化并駕齊驅(qū)的公司,碼隆在技術(shù)產(chǎn)品化方面也是不遺余力地投入。自創(chuàng)立以來,碼隆科技打造了一系列 AI 商品識別產(chǎn)品,其中就包括其最早大眾化的產(chǎn)品——商品識別基礎(chǔ)技術(shù)平臺 ProductAI??。

據(jù)介紹,ProductAI? 集成了包括商品圖像的搜索、檢測、分類、分析、標注以及色彩分析和文字識別等多種基礎(chǔ)技術(shù),涉及弱監(jiān)督學習、課程學習、目標跟蹤、細粒度分類、物體檢測等等的計算機視覺核心算法?!竿瑫r,碼隆科技也正在進行前沿深度度量學習(Deep Metric Learning)的研究,作為細粒度分類、檢測和追蹤技術(shù)的補充?,F(xiàn)在這些算法都已應(yīng)用于圖像或視頻處理的商品識別場景。」

在場景中的實際落地情況,以智能貨柜為例,其在整個流程中充當?shù)慕巧牵簩οM者來說,該技術(shù)主要用于自動結(jié)算這一環(huán)節(jié),可以根據(jù)消費者的拿取商品前后的變化識別出消費者具體購買了哪些商品,并以此為依據(jù)進行結(jié)算;對商戶來說,一是商品識別技術(shù)能夠使商家實時了解智能貨柜的運營狀態(tài),二是后臺會有銷售大數(shù)據(jù)分析系統(tǒng),可以為商家提供一些銷售洞察作為決策參考,如哪些商品在什么樣的布點位置銷售情況更好等等。

對于碼隆的商品識別技術(shù)的整個落地情況,碼特介紹道:「線上和線下零售是我們最優(yōu)先落地的場景。在線下零售方面,我們目前將智能貨柜作為實體零售的主要落地場景,此外還有商超資產(chǎn)保護、智能稱重等應(yīng)用場景。而在線上零售方面,我們的商品識別技術(shù)也已經(jīng)通過 API 調(diào)用的形式賦能了很多電商平臺和時尚應(yīng)用。」

作為在該行業(yè)有著合作伙伴積累的碼隆來說,在 AI 商品識別技術(shù)的場景落地合作伙伴的選擇上,也有著自己的考量點 :「我們的策略是選擇那些垂直行業(yè)的龍頭玩家去進行合作,他們能在更宏觀的角度看待產(chǎn)業(yè)發(fā)展,深知行業(yè)痛點,同時對新技術(shù)的布局意識也更勝一籌。比如,在將商品識別與智能貨柜結(jié)合的探索中,我們選擇和世界頂級冰柜制造商海爾進行合作。在 AI 技術(shù)落地的過程中,一定是有很多困難的,這就需要行業(yè)內(nèi)的廠商相互配合、各自發(fā)揮優(yōu)勢進行一點一點地打磨?!?/p>

不斷用現(xiàn)有的學術(shù)基準來測試、挑戰(zhàn)自己的技術(shù)

作為一家以技術(shù)研發(fā)為長的公司,碼隆科技也時刻關(guān)注著學術(shù)界在該領(lǐng)域的動態(tài),比如包括細粒度分類、弱監(jiān)督學習、深度度量學習以及檢測追蹤算法等等。同時,碼隆也會緊隨學術(shù)動態(tài),將自己的研究成果搬到學術(shù)界去進行測試:一方面是通過學術(shù)界一系列商品識別評估標準進行自我檢驗;另一方面,碼隆科技也樂于向 CVPR、ICCV 和 ECCV 等計算機視覺世界頂級行業(yè)會議投遞論文,去接受該領(lǐng)域的國際權(quán)威評審。

例如,在 CVPR 2019,碼隆科技就發(fā)表了一篇關(guān)于多相似度損失的論文:「Multi-Similarity Loss with General Pair Weighting for Deep Metric Learning」。據(jù)碼特介紹,該論文提出使用 GPW(General Pair Weighting)框架來從底層來理解圖像檢索中的損失函數(shù),并在該框架下提出了多相似度損失(Multi-similarity Loss, MS Loss)函數(shù),顯著提高了圖像搜索的性能——該損失函數(shù)在世界上所有主要的圖像檢索基準上都獲得了領(lǐng)先的結(jié)果。

不僅如此,碼隆科技甚至還創(chuàng)建了自己的評估標準?!附衲?,我們舉辦了一項有關(guān)商品識別的比賽 iMaterialist Challenge on Product Recognition,截至目前,全球已有近一百支代表隊參賽,比賽結(jié)果將在 CVPR 研討會上公布。在比賽中,我們開放了史上數(shù)據(jù)量最大,商品種類最多元的數(shù)據(jù)庫,比賽涵蓋 2019 個 SKU 超過一百萬張圖像數(shù)據(jù),每個 SKU 都有超過 200 張圖片,是 CVPR 迄今數(shù)據(jù)規(guī)模最大、種類最多的商品識別競賽。同時,我們也和谷歌研究院一起合作將該挑戰(zhàn)賽列入了谷歌 CVPR 研討會『the Sixth Annual Workshop on Fine-Grained Visual Categorization』的一部分?!?/p>

商品識別技術(shù)未來發(fā)展的期望

作為前微軟亞洲研究院高級研發(fā)主管、現(xiàn)任碼隆科技 CTO 的碼特,在其學生時代就已在計算機視覺領(lǐng)域勤耕,如今選擇聚焦商品識別領(lǐng)域展開研究,對于這項技術(shù)未來的發(fā)展自然充滿了期待:「與計算機視覺其他相關(guān)任務(wù)一樣,我們同樣也期待機器能夠在這一細分領(lǐng)域以超越人類的水平實現(xiàn)持續(xù)學習和推理。未來,這項核心技術(shù)將會對零售等行業(yè)帶來變革性的影響,在讓商業(yè)更加高效運營、提升利潤的同時,也改變和優(yōu)化人們購物和生活的方式?!?/p>

而具化到碼隆科技上,碼特表示,現(xiàn)在和未來,碼隆科技依舊會聚焦于商品識別這一領(lǐng)域,同時會不斷開發(fā)和優(yōu)化相關(guān)的底層算法,并以此為基礎(chǔ)推動技術(shù)與更多行業(yè)的結(jié)合,最終落地到實際場景中給人們帶來便利。此外,碼隆科技也從研究層面去探索該技術(shù)在其他行業(yè)應(yīng)用中更多的可能性,而具體的細節(jié),也將會在不久后對外公布。 雷鋒網(wǎng)

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

對話碼隆科技 CTO 碼特:應(yīng)對商品識別獨有挑戰(zhàn),技術(shù)研發(fā)實力是根本

分享:
相關(guān)文章
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說