丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
人工智能 正文
發(fā)私信給奕欣
發(fā)送

0

阿里 FashionAI 數(shù)據(jù)集:用知識重建構(gòu)造「時尚+AI」的巴別塔

本文作者: 奕欣 2018-07-07 20:41
導語:如何用機器能理解的邏輯語言,清楚地定義、規(guī)范和傳遞一個行業(yè)、尤其是時尚行業(yè)的 benchmark?
開發(fā)
企業(yè):阿里巴巴
操作:發(fā)布數(shù)據(jù)集
內(nèi)容:阿里巴巴發(fā)布FashionAI數(shù)據(jù)集

雷鋒網(wǎng) AI 科技評論按:《圣經(jīng) ·舊約·創(chuàng)世記》第 11 章記載,人類希望能聯(lián)手共建通往天堂的巴別塔,但因為各種族語言不通,計劃因此失敗。而在時尚領域,人工智能同樣面臨巴別塔難題,專業(yè)人士、機器智能和普通消費者之間存在信息阻滯和溝通不暢。

客觀科學和主觀時尚,這兩個概念看似互相矛盾,實際上從某種程度上也反映著傳統(tǒng)行業(yè)與全新技術的鴻溝。如何用機器能理解的邏輯語言,清楚地定義、規(guī)范和傳遞一個行業(yè)、尤其是時尚行業(yè)的 benchmark? 在阿里巴巴「圖像和美」團隊和香港理工大學紡織及服裝學系的這次深度合作中,我們或許能找到答案。

阿里 FashionAI 數(shù)據(jù)集:用知識重建構(gòu)造「時尚+AI」的巴別塔

7 月 4 日至 6 日,由阿里巴巴「圖像和美」團隊聯(lián)合香港理工大學紡織及服裝學系、英國紡織協(xié)會聯(lián)合舉辦的「人工智能與時尚紡織大會」學術會議在香港理工大學舉行,同期包括學術主題演講、2018 FashionAI 全球挑戰(zhàn)賽決賽答辯會及線下 FashionAI 概念店體驗活動等多項內(nèi)容。這一事件在雷鋒網(wǎng)學術頻道 AI 科技評論旗下數(shù)據(jù)庫項目「AI 影響因子」中有相應加分。

2018 FashionAI 全球挑戰(zhàn)賽自今年 3 月發(fā)起,共吸引全球 42 個國家和地區(qū)的 5272 支隊伍共 6594 名選手參與,爭奪 134 萬的人民幣獎金池。

7 月 5 日答辯會當天,來自西安交通大學、馬里蘭大學、北京郵電大學、中科院深圳先進技術研究院、唯品會等高校及企業(yè)的 10 支隊伍進行了現(xiàn)場展示及答辯環(huán)節(jié)。

阿里 FashionAI 數(shù)據(jù)集:用知識重建構(gòu)造「時尚+AI」的巴別塔

FashionAI 全球挑戰(zhàn)賽英雄榜

最終,早稻田大學博士研究生李瑋特的單人團隊 bilibili 摘得關鍵點賽道的冠軍獎項;來自西安交通大學的禾思眾成團隊在服飾屬性賽道獲得冠軍。

阿里 FashionAI 數(shù)據(jù)集:用知識重建構(gòu)造「時尚+AI」的巴別塔

服飾關鍵點定位賽道冠軍——bilibili

阿里 FashionAI 數(shù)據(jù)集:用知識重建構(gòu)造「時尚+AI」的巴別塔

服飾標簽屬性識別賽道冠軍——禾思眾成


針對本次比賽,中科院計算所研究員、中科院智能信息處理實驗室常務副主任山世光博士作為 FashionAI 全球挑戰(zhàn)賽的決賽評委代表向雷鋒網(wǎng) AI 科技評論表示,本次 FashionAI 受到眾多高校及研究機構(gòu)的關注,除了阿里天池平臺本身的影響力以及誘人的獎金激勵外,AI 對于時尚行業(yè)的滲透,本身也是一個在學術界逐步受到重視的問題?!鸽S著人工智能特別是計算機視覺的進步,AI 未來會在零售、電商等應用中得到更多的體現(xiàn)?!?/p>

根據(jù)賽制介紹 [1],F(xiàn)ashionAI 全球挑戰(zhàn)賽的兩大賽道分別為服飾關鍵點賽道及服飾屬性賽道,前者專注于女裝的服飾關鍵點定位?;诜b設計知識,賽事組委會定義了一套服飾的關鍵點,并梳理了在女裝 6 大專業(yè)類別(上衣、外套、褲子、半身裙、連身裙、連身褲)下的具體定義,要求參賽者設計算法進行定位預測;而后者基于數(shù)據(jù)集所構(gòu)建的女裝標簽知識體系,要求選手在屬性維度和屬性值兩個層面對單主體(單人模特或單件平鋪)服飾商品進行局部屬性識別。

這兩大賽道的設置,反映的是認知時尚的兩大基礎問題。據(jù)阿里巴巴副總裁、淘寶事業(yè)部技術總經(jīng)理兼阿里巴巴大文娛優(yōu)酷高級副總裁兼 CTO 莊卓然的介紹,阿里巴巴于今年年初和香港理工大學一起開始投入到該領域的建設,一同梳理服飾領域的知識和規(guī)則,并將成果制作成這個嚴謹、實用、符合商業(yè)場景的服飾數(shù)據(jù)集,與 FashionAI 全球挑戰(zhàn)賽同期發(fā)布。

這個業(yè)界首個同時滿足服飾專業(yè)性和機器學習要求的大規(guī)模高質(zhì)量數(shù)據(jù)集 [2],包括服飾關鍵點定位、服飾基礎屬性識別等任務。據(jù)介紹,前者的關鍵點定義源自服裝設計原理,目前覆蓋女裝 5 大類部件,共 41 個細分類目,24 種關鍵點,總計 10 萬張標注圖片;后者通過對基礎屬性的專業(yè)整理,構(gòu)建了一個層次化的標簽分類體系,目前覆蓋女裝 5 大類部件,41 個細分類目,8 個維度 54 個標簽,總計 25.7 萬標注圖片。數(shù)據(jù)集中使用的所有圖像數(shù)據(jù)全部來源于電商真實場景,從各個季節(jié)、類目等維度的上億的服裝數(shù)據(jù)中采樣得到,從而保證了數(shù)據(jù)的多樣性。

阿里 FashionAI 數(shù)據(jù)集:用知識重建構(gòu)造「時尚+AI」的巴別塔

服飾,特別是女裝,是淘寶上最大的商品類目。2017 年雙十一當天,服飾領域的成交占比超過 30%,阿里巴巴深知用戶在服飾時尚領域巨大的消費能力,也密切關注互聯(lián)網(wǎng)和技術在其中能創(chuàng)造的商業(yè)價值。

阿里巴巴資深算法專家雷音(賈夢雷)所帶領的阿里巴巴「圖像和美」團隊從 10 年前就開始在淘寶做圖像的檢測和搜索,彼時主要針對的是商家圖片版權(quán)保護、虛假廣告宣傳等。

正如莊卓然所言,「識別」只是計算機視覺的一部分。如果要進一步做到感知和交互,進一步拉通消費和生產(chǎn),只靠技術是遠遠不夠的。雷音也深刻地意識到淘寶今天所面臨的困境,是消費者和平臺、和商家無法用達成共識的語言溝通商品需求的問題。「單單連衣裙類目就有 2000 萬件商品,產(chǎn)品數(shù)量非常龐大,但還是有很多用戶抱怨找不到自己想要的商品,」雷音介紹道,阿里巴巴在時尚角度的數(shù)據(jù)重組依然有很大的提升空間,這樣才能讓消費者很好地表達自己的需求,并通過這些表達接觸到對應的數(shù)據(jù)。

數(shù)據(jù)重組是 FashionAI 的重要組成部分。只有讓機器能理解人類所表達的內(nèi)容,把數(shù)據(jù)進行有效的分類,才能讓消費者熟悉穿搭行業(yè)的認知,進行更有效的需求表達。

在一個主觀的世界里去做客觀的事情并不容易,而首當其沖的便是要讓機器懂得時尚界的語言。

「讓機器理解衣服,核心是制作服飾圖像數(shù)據(jù)集。[3] 」 雷音認為,將從業(yè)者的知識轉(zhuǎn)化為機器可以理解的邏輯語言,首先要從數(shù)據(jù)集入手,用足夠的數(shù)據(jù)讓機器明白各種服飾的區(qū)別和特性。

而要構(gòu)建一個時尚與人工智能結(jié)合的數(shù)據(jù)集,讓機器擁有「時尚之心」,便涉及到 FashionAI 要做的核心內(nèi)容:知識重建。原有的時尚知識體系僅停留于專業(yè)人士之間的溝通和交流,往往存在不完備和二義性兩大問題。也就是說,同一層次的概念可能存在不少模糊地帶,而且不一定能覆蓋實用場景的各種情況,這是追求邏輯的機器絕對不能「理解」和「容忍」的問題。更棘手的是,專業(yè)人士與非專業(yè)人士的認知并不統(tǒng)一,存在工業(yè)設計知識、平臺運營知識及大眾營銷知識標準不統(tǒng)一的問題。

在整個知識體系的重建中,雷音總結(jié)了三條重要的經(jīng)驗,這不僅對于時尚行業(yè),對于任何一個傳統(tǒng)行業(yè)用 AI 賦能的過程都具有借鑒意義。

首先是,知識要實現(xiàn)人和人的溝通,既要符合行業(yè)常識,也要符合消費者的認知?!笀D像和美」團隊希望能夠?qū)⑦@套知識體系做到「通用」,做到可溝通可理解,因此與香港理工大學及其它專業(yè)院校進行了密切合作,力求在消費者和專業(yè)人士的溝通中尋求知識體系的統(tǒng)一和平衡。以「波西米亞風」為例,雖然行業(yè)的風格體系中存在這個類目,但由于消費者缺乏相應的概念和認知,團隊最終并沒有將這一風格納入分類定義中。

其次,知識要方便機器與人的溝通,盡量實現(xiàn)邏輯上的互斥和完備。機器是 0 和 1 的世界,因此要盡可能地消除中間的模糊地帶,并且能涵蓋所有可能的情況。比如,半身裙的定義是「下半身穿著服飾,最上不超過下胸線,襠部以下中線無收緊縫合」,而褲子的定義是「下半身穿著服飾,最上不超過下胸線,襠部以下中線有收緊縫合」,這就能滿足邏輯完備和互斥的情況。

第三點是理解「視覺可分」和「感官可分」的區(qū)別。一種體系如果沒有足夠多的合適樣本進行學習,那么團隊也需要做出取舍。以「西裝領」為例,從專業(yè)人士的角度可劃分為 9 種領子,但「圖像和美」團隊與香港理工大學團隊考慮到,對于普通消費者而言,肉眼看不出這 9 款領子的區(qū)別,且無法找到這么多細粒度過高的數(shù)據(jù),因此在分類上也做出了取舍。另外,女性服飾的視覺刺激點非常多,可以在西裝領的分類上適當精簡,但男士服飾視覺刺激點較少,領子的分類需要更加細化,這也是「圖像和美」團隊與專業(yè)人士進行反復協(xié)調(diào)和溝通所達成的共識。

此外雷音也提及了非常重要的一點是,這個過程中要避免結(jié)構(gòu)化噪聲的情況。比如在夏天搜索「圓領」的衣服,結(jié)果可能會大量呈現(xiàn)「T 恤」,這便是結(jié)構(gòu)化噪聲的問題,為了將「圓領」與冬天的「毛衣」數(shù)據(jù)也能相關聯(lián),需要保證「圓領」在各種類別的服飾中均得到采樣。在這個過程中,團隊需要借助知識和模型校驗檢查是否引入不合理的相關性,并借助共性部分與標簽相關性的強弱來判定是否為噪聲。

為了更好地理解時尚行業(yè),原本只穿運動服的典型程序員雷音飛到上海定制了幾萬元的高定西裝,第一次懂得了什么叫「適合自己的衣服」;跑遍了杭州銀泰城的每一家服裝店,和店員們聊穿衣搭配的經(jīng)驗體會……由于深入了解了時尚行業(yè)對于材質(zhì)和面料的壟斷「潛規(guī)則」,這幾年來雷音再也沒買過打折的衣服。對于時尚的理解一天天加深,雷音也感慨,「機器能學到的是規(guī)則,學不到的是創(chuàng)意,我們希望能在這個過程中讓消費者能逐漸從熟悉規(guī)則到欣賞創(chuàng)意。如果機器能更好地用機器語言理解 Fashion,實際上也是幫助更多的消費者提升審美水平,增進對時尚行業(yè)的理解?!苟?FashionAI 全球挑戰(zhàn)賽的應運而生,也是希望能讓更多的人關注到這個將改變行業(yè)的數(shù)據(jù)集,一同攜手關注機器認知時尚的基礎問題,共同推動AI 技術在時尚產(chǎn)業(yè)的落地。

但在雷音看來,如果把整個時尚 AI 行業(yè)理解為一場球賽,挑戰(zhàn)賽就相當于「踢點球」,在主辦方給予的有限條件內(nèi)完成規(guī)定的任務;但這離學會真正的「踢足球」還很遠,即從科研的角度來思考整個行業(yè)知識的重構(gòu)問題。對于行業(yè)來說,他們要做的還有很多。

因為溝通的問題,《圣經(jīng)》中的巴別塔盡管得到了多種族的人類協(xié)作,依然無法通天。但阿里巴巴「圖像和美」團隊的 FashionAI 數(shù)據(jù)集,正是希望能從知識重建做起,構(gòu)建 Fashion 和 AI 結(jié)合起來的知識體系,構(gòu)建一個「人工智能+時尚」的巴別塔。

參考資料:

[1] FashionAI 全球挑戰(zhàn)賽, http://fashionai.alibaba.com/

[2] FashionAI 數(shù)據(jù)集,http://fashionai.alibaba.com/datasets/

[3] 如何做一個“實用”的圖像數(shù)據(jù)集,https://mp.weixin.qq.com/s?__biz=MzI3MTM5ODA0Nw==&mid=2247484084&idx=1&sn=a1e6a1637991c24066fdc0c3297c9b7c&chksm=eac32744ddb4ae5225360d8477ca105d5b30d73eaf71aa083653d2563fba848722497c050de1&scene=38#wechat_redirect

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

阿里 FashionAI 數(shù)據(jù)集:用知識重建構(gòu)造「時尚+AI」的巴別塔

分享:
相關文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說