0
本文為 AI 研習社編譯的技術博客,原標題 :
Designing Data Products
作者 | Simon O'Regan
翻譯 | YuYuko
校對 | 呂鑫燦 審核 | 鄧普斯·杰弗 整理 | 立魚王
原文鏈接:
https://towardsdatascience.com/designing-data-products-b6b93edf3d23
Mountainous time series. Paul Gilmore on Unsplash
什么是數(shù)據(jù)產(chǎn)品,而它又為什么值得你去關心呢?
DJ Patil對數(shù)據(jù)產(chǎn)品的定義是:“通過使用數(shù)據(jù)促進最終目標的產(chǎn)品”,
這一定義乍看起來涵蓋的范圍似乎相當廣泛。畢竟,在大多數(shù)情況下,所有的Web產(chǎn)品都使用數(shù)據(jù)。它們都是使用數(shù)據(jù)來促進最終目標的實現(xiàn)。那現(xiàn)在網(wǎng)絡上的一切都是數(shù)據(jù)產(chǎn)品嗎?
對此,我將指出二者之間存在的一個非常重要的區(qū)別;使用數(shù)據(jù)促進最終目標的產(chǎn)品和主要目標是使用數(shù)據(jù)促進最終目標的產(chǎn)品之間的區(qū)別。
數(shù)據(jù)產(chǎn)品,從某種意義上說是需要有自己的類別,它們是以數(shù)據(jù)為主要目標的產(chǎn)品。
定義數(shù)據(jù)產(chǎn)品
為什么要如此拘泥于細節(jié)---嗯,我個人的觀點是,數(shù)據(jù)產(chǎn)品,無論是面向客戶的完整產(chǎn)品還是部分后端產(chǎn)品,都具有與其他技術產(chǎn)品不同的特性。
雖然許多標準的產(chǎn)品開發(fā)規(guī)則都適用---解決客戶需求、從反饋中汲取經(jīng)雖然許多標準的產(chǎn)品開發(fā)規(guī)則都適用——解決客戶的需求、從反饋中學習、無情地確定優(yōu)先級等等——但有些微妙之處可能會使對數(shù)據(jù)產(chǎn)品的思考有些不同。
上面的定義用于區(qū)分我們是否應該像通常那樣考慮產(chǎn)品,還是我們是否需要考慮更適合數(shù)據(jù)世界的產(chǎn)品開發(fā)方面。
通過這種方法,我們來舉幾個例子。
媒體是數(shù)據(jù)產(chǎn)品嗎?根據(jù)我們的定義判定媒體并不是數(shù)據(jù)產(chǎn)品;它雖然使用數(shù)據(jù),但它的主要目標是“…建立一個更好的發(fā)布平臺---一個允許任何人向世界提供他們的故事和想法,并幫助偉大的人登上首頁”。雖然數(shù)據(jù)將在這項任務中發(fā)揮關鍵作用,但它不是實現(xiàn)這一目標的主要驅(qū)動力。也不是媒體的目標,對于媒體來說,數(shù)據(jù)是達到目的的手段。
如果我們對媒體平臺進行再深入一點分析,我們會發(fā)現(xiàn)那些通過使用數(shù)據(jù)來定義其目的的產(chǎn)品。媒體的搜索功能是一種數(shù)據(jù)產(chǎn)品。其目標是將相關文章推薦給相關讀者,而數(shù)據(jù)是實現(xiàn)這一目標的關鍵。
媒體的文章訂閱功能怎么樣實現(xiàn)的呢?是的,數(shù)據(jù),再一次在決定向讀卡器顯示內(nèi)容時起著關鍵作用。
我們再舉一個例子:Gmail是數(shù)據(jù)產(chǎn)品嗎?不,Gmail是一種電子郵件服務,其主要目標是允許個人之間進行異步的書面通信。然而,Gmail將我們的電子郵件分類成重要和不重要的數(shù)據(jù)產(chǎn)品。主要目標是對電子郵件進行分類,這主要集中在自然語言處理上。
Instagram是數(shù)據(jù)產(chǎn)品嗎?并不是,但如果將其視為離散產(chǎn)品,則其大部分功能都是數(shù)據(jù)產(chǎn)品-,例如:標記、搜索、發(fā)現(xiàn)。
谷歌分析是一種數(shù)據(jù)產(chǎn)品嗎?是的,它的主要目標是給用戶帶來對在線行為的定量理解。這里的數(shù)據(jù)是與用戶交互的中心,與目前提到的其他產(chǎn)品不同,它的使用是明確的。
顯然,存在各種不同類型的數(shù)據(jù)產(chǎn)品。即使將可能的產(chǎn)品領域縮小到符合我們定義的范圍之內(nèi),這些產(chǎn)品之間仍然存在相當大的差異性。隨著這種差異性在產(chǎn)品開發(fā)中進一步微妙化。
我們可以將這些數(shù)據(jù)產(chǎn)品分為5大類:原始數(shù)據(jù)、派生數(shù)據(jù)、算法、決策支持和自動化決策。
一般來說,這些產(chǎn)品類型是根據(jù)日益增加的復雜性列出的。更具體一點來說,它們是根據(jù)不斷增加的內(nèi)部復雜性列出的,并且(應該)用戶方面的復雜性較低。
換句話說,數(shù)據(jù)產(chǎn)品本身的計算、決策或“思考”越多,則用戶需要的思考就越少。
通常(但不完全)原始數(shù)據(jù)、派生數(shù)據(jù)和算法都有技術使用者。大多數(shù)情況下,他們往往是一個組織的內(nèi)部產(chǎn)品,但反例將包括廣告交流,或API套件。決策支持和自動化決策產(chǎn)品往往具有更均衡的技術和非技術用戶組合;盡管對于任何給定的產(chǎn)品,用戶組往往是其中之一。
原始數(shù)據(jù)。從原始數(shù)據(jù)開始,我們收集并提供可用的數(shù)據(jù)(也許我們正在做一些小的處理或清理步驟)。然后,用戶可以選擇使用適當?shù)臄?shù)據(jù),但大多數(shù)工作都是在用戶完成的。
導出數(shù)據(jù)。在向用戶提供派生數(shù)據(jù)時,我們在我們這邊做一些處理。對于客戶數(shù)據(jù),我們可以添加其他屬性,例如為每個客戶分配一個客戶段,或者添加他們單擊廣告或從某個類別購買產(chǎn)品的可能性。
算法。接下來我們有算法,或者算法服務。我們得到了一些數(shù)據(jù),我們通過算法運行它-無論是機器學習還是其他-并返回信息或見解。谷歌圖片就是一個很好的例子:用戶上傳圖片,并接收一組與上傳圖片相同或相似的圖片。在后臺,該產(chǎn)品提取功能,對圖像進行分類,并將其與存儲的圖像進行匹配,返回最相似的圖像。
決策支持。在這里,我們希望向用戶提供信息,幫助他們做出決策,但我們自己并沒有做決定。分析儀表盤(如Google Analytics、Flurry或WGSN)將屬于此類。我們做的大部分工作都是在我們這邊進行的;我們的目的是以易于消化的格式向用戶提供相關信息,以便他們做出更好的決策。在谷歌分析的案例中,這可能改變編輯策略,解決轉(zhuǎn)換漏斗中的漏洞,或者雙倍降低給定產(chǎn)品策略。這里要記住的重要一點是:雖然我們在數(shù)據(jù)收集、新數(shù)據(jù)的派生、選擇要顯示的數(shù)據(jù)以及如何顯示這些數(shù)據(jù)等方面做出了設計決策,但是用戶仍然有責任,自己解釋這些數(shù)據(jù)。他們控制著對該數(shù)據(jù)采?。ɑ虿徊扇。┬袆拥臎Q定。
自動化決策。在這里,我們將給定領域內(nèi)的所有智能外包出去。Netflix的產(chǎn)品推薦或Spotify的每周發(fā)現(xiàn)就是常見的例子。自動駕駛汽車或無人駕駛飛機更是這種閉環(huán)決策循環(huán)的物理表現(xiàn)。
我們允許算法完成這項工作,并向用戶提供最終的輸出(有時會解釋為什么人工智能選擇了該選項,而其他時候則完全不透明)。
到目前為止,我們已經(jīng)討論了功能數(shù)據(jù)產(chǎn)品的類型。
這些數(shù)據(jù)產(chǎn)品中的每一種都可以以各種方式呈現(xiàn)給我們的用戶,對他們的設計有明確的影響。這些接口或交互是什么?
API。對于API,我們假設一個技術用戶。我們?nèi)匀粦撟裱己玫漠a(chǎn)品實踐,并確保API的使用直觀,有良好的文檔記錄,能夠滿足用戶的需求,并且值得我們使用。
儀表盤和可視化。對于儀表盤和可視化,我們假設在處理數(shù)字方面具有一定的統(tǒng)計知識或能力。在最極端的情況下,我們可以為用戶做很多繁重的工作,并努力確保我們只以易于理解的格式呈現(xiàn)最相關的信息。通過選擇要顯示的信息,我們正在影響決策,但它仍然將解釋和決策留在用戶的手中(或頭腦中)。
網(wǎng)絡元素。在過去5年左右的時間里,用戶最不常見的數(shù)據(jù)產(chǎn)品的技術接口就是網(wǎng)絡元素。最近,這些接口的應用被廣泛擴展,包括語音、機器人和增強現(xiàn)實等。雖然這些新接口的設計細節(jié)都是明顯不同的,但其中有相當大的重疊,因為它們都圍繞著向用戶展示決策結(jié)果,也許還傳達了人工智能實現(xiàn)決策的原因或方式。
根據(jù)可能的接口繪制數(shù)據(jù)產(chǎn)品的類型,我們得到一個橙色點矩陣,每個點代表不同數(shù)據(jù)產(chǎn)品矩陣-不同的產(chǎn)品需要不同的方法。
數(shù)據(jù)產(chǎn)品矩陣——不同的產(chǎn)品需要不同的方法
矩陣中的每一個元素都要求設計注意事項,無論是在用戶需要什么方面,還是在我們用于實現(xiàn)目標的設計過程方面,都會有很大的不同。
從左上角的圓圈(原始數(shù)據(jù)API)斜向右下角的圓圈(自動決策Web元素)是指從技術、工程驅(qū)動的產(chǎn)品轉(zhuǎn)向更典型的軟件產(chǎn)品(即產(chǎn)品經(jīng)理和設計師更直觀的產(chǎn)品,往往出現(xiàn)在書中的產(chǎn)品、雜志和文章)
根據(jù)我的經(jīng)驗,當團隊將人性化設計方法應用于更多的數(shù)據(jù)產(chǎn)品時,他們就會遇到大問題。當然,這并不是說工程師不是人。大多數(shù)是,而那些不經(jīng)常有一個不可思議的相似性。但是,HCD是一種整體的產(chǎn)品開發(fā)方法,當設計師理解用戶的動機和行為時,它是一種很好的方法。對于技術數(shù)據(jù)產(chǎn)品,產(chǎn)品邊界通常被功能組織考慮人為地限制,并且產(chǎn)品和用戶體驗團隊通常不具備以下技術:a)了解技術用戶行為的復雜性;b)不具備探索這些復雜性的能力。
那么,假設我們一直在閱讀的開箱即用設計思想或精益方法論是幼稚的。
然而,這并不是恐慌的原因。
盡管用戶研究的輸出可能與面向消費者的產(chǎn)品或真正典型的SaaS產(chǎn)品有很大的不同,而且關鍵績效指標的定義可能在技術方面出錯,但設計思維和精益都具有足夠的可塑性,使我們能夠針對這個新領域調(diào)整我們的方法。
我的建議是,在將這些方法應用于數(shù)據(jù)產(chǎn)品時,要確保問題空間是根據(jù)最終用戶而不是直接數(shù)據(jù)輸出的用戶來定義的。很可能,這就意味著要擴大團隊,將相鄰的產(chǎn)品及其經(jīng)理包括在內(nèi)。
同樣,如果用戶是一個技術性的用戶,那么我們就應該適應這種環(huán)境。要同情遇到工程問題的用戶,可能意味著我們必須打開一個IDE并進行編碼。
豆瓣菜,使用HCD瘦肉組合開發(fā)。由馬庫斯·斯皮斯克拍攝
這篇文章形成了我在2017年都柏林的產(chǎn)品罐會議上發(fā)表的一個演講的一些內(nèi)容。
想要繼續(xù)查看該篇文章相關鏈接和參考文獻?
點擊【“數(shù)據(jù)產(chǎn)品”設計指南】或長按下方地址打開:
https://ai.yanxishe.com/page/TextTranslation/1459
AI研習社今日推薦:雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)
卡耐基梅隆大學 2019 春季《神經(jīng)網(wǎng)絡自然語言處理》是CMU語言技術學院和計算機學院聯(lián)合開課,主要內(nèi)容是教學生如何用神經(jīng)網(wǎng)絡做自然語言處理。神經(jīng)網(wǎng)絡對于語言建模任務而言,可以稱得上是提供了一種強大的新工具,與此同時,神經(jīng)網(wǎng)絡能夠改進諸多任務中的最新技術,將過去不容易解決的問題變得輕松簡單。
加入小組免費觀看視頻:https://ai.yanxishe.com/page/groupDetail/33
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。