0
本文作者: 小東 | 2017-01-09 14:26 |
雷鋒網(wǎng)按:數(shù)據(jù)隱私、數(shù)據(jù)安全、數(shù)據(jù)道德這三者一直是商業(yè)界與學術(shù)界探討的熱點問題,本文就在流程過程中如和處理上述三個問題,提出了一些自己的見解。本文作者為 Anne Rozinat 博士與Christian W. Gunther 博士,雷鋒網(wǎng)編譯,未經(jīng)許可不得轉(zhuǎn)載。
十二年前,我移民到了荷蘭,常在當?shù)氐囊患疫B鎖超市買東西,一開始他們讓我辦購物卡,說這種卡在它們的連鎖店買東西會打折,但我卻不想辦這種卡。我一直覺得,如果商家知道了我的購買記錄,那么他們就會采取一些針對方案(如廣告推送)使我購買更多的商品(而我原本并不想買的),但是后來我發(fā)現(xiàn),是我想錯了。
數(shù)據(jù)分析技術(shù)本身不存在好壞之分,人們使用數(shù)據(jù)分析技術(shù)只是為了讓產(chǎn)品的銷量更好。例如,超市通過分析人們的購物習慣,在擺放商品時,它們會讓顧客走盡可能長的路,花費盡可能多的時間來買顧客原本想買的東西。在買全物品的過程中,讓顧客盡可能多的看到在他們購買計劃之外的商品,以增加這些計劃外商品的銷售量。除此之外,商場還可以使用顧客的購買信息,為顧客提供更好的購物體驗。
許多公司以這種或那種的方式對數(shù)據(jù)進行分析,這些數(shù)據(jù)分析技術(shù)給公司和消費者帶來了極大的好處,數(shù)據(jù)分析技術(shù)的廣泛使用雖然帶了很多好處,但也產(chǎn)生了一些問題,最主要的就是數(shù)據(jù)道德問題。Responsible Data Science在研討會主動討論了關(guān)于數(shù)據(jù)道德問題、并且呼吁研發(fā)人員在研究算法時不應只研究算法本身,還要考慮數(shù)據(jù)的準確性,保密性、安全性等問題。隨著其探討與呼吁,越來越多的人開始關(guān)注到了這一問題。
如果流程挖掘運用得當,那么它將可以使你更加深入了解你的業(yè)務處理流程,并提出改進措施。但這面臨一個問題,那就是你怎么保證你在流程挖掘過程沒有觸碰道德底線呢?你在流程挖掘中應該注意些什么呢?
在本文中,我們就在流程挖掘過程中應該注意的問題,提出了一些自己的見解。
首先我們應明確我們的分析目標,大多數(shù)情況我們下,我們只需要對內(nèi)部組織流程進行分析。進一步說,你是對整體進行分析。舉個例子,一個流程挖掘的目標可能是讓人們不要閑下來,而不是讓人們的工作效率更高。此外,流程之間是相互影響的,一旦你想要對某一特定流程進行深入了解,你就得深入研究其它流程,因為這些流程會對你要研究的那個流程造成影響。
因此在進行流程挖掘的開始階段,你就應該明確你的分析目標,弄清分析結(jié)果可以應用在哪些地方,想明白你要處理哪些問題以及為了解決這些問題,你需要哪些數(shù)據(jù)。
在這個過程中,以下事情你需要做:
所用數(shù)據(jù)是否有法定限制。例如,在德國,員工相關(guān)信息是不允許直接拿來使用的,如果你的項目需要使用員工信息,你需要對員工信息進行加密處理,然后再使用;
項目道德底線問題。在確定項目目標時,你應該考慮哪些地方可以使用你的分析結(jié)果,哪些地方不能用。舉個例子,你研發(fā)了一個對人的工作效果進行評估的項目,在項目的開始時,你就應該明確該項目不會用在自己的員工身上。此外,我們還應該與數(shù)據(jù)提供者隨時保持聯(lián)系,以便他們隨時為你提供你所需要的數(shù)據(jù)。
以下事情不能做:
在項目目標不明確的情況下啟動項目。要啟動一個項目,一定要想清楚你到底要解決什么問題?解決這些問題到底需要哪些數(shù)據(jù)?你的項目應該緊跟商業(yè)目標,這樣才能取得商業(yè)經(jīng)理的支持。
項目不要立得太大,應該有一個清楚、明確、具體的目標。如果一個項目過大,那么人們會很難弄清楚你到底要做什么,進而可能會出現(xiàn)反對你的項目的情況。
當你獲得數(shù)據(jù)后,你關(guān)心的只是數(shù)據(jù)本身。只有發(fā)生數(shù)據(jù)泄露問題時,人們才意識到數(shù)據(jù)安全問題。所以拿到數(shù)據(jù)之后,一定要對你拿到的數(shù)據(jù)進行恰到的保護,以防數(shù)據(jù)泄露,為了做到這些,你需要做以下事情:
與員工簽署數(shù)據(jù)保密協(xié)議;
對數(shù)據(jù)存儲設(shè)備進行加密處理;
數(shù)據(jù)檢查,在將拿到的數(shù)據(jù)交給開發(fā)人員之前,應對數(shù)據(jù)進行仔細檢查,確保沒有多余信息、敏感信息的出現(xiàn);
不要使用任何需要數(shù)據(jù)上傳的過程挖掘工具,過程挖掘工具應該使用本地內(nèi)部版本。
不能做的事情:
直接將數(shù)據(jù)交給研發(fā)人員,而不對其進行任何審查;
未經(jīng)公司允許,將數(shù)據(jù)直接上傳到云端過程挖掘工具中。
如果數(shù)據(jù)集中有敏感信息怎么辦呢?將這些敏感信息直接刪除,除了這種方法,我還有別的選擇嗎?當然有,我們可以對這些信息進行加密處理,例如員工姓名 Mary Jones、Fred Smith。我們可以將其處理成Resource 1、Resource 2。如果同一個名字出現(xiàn)多次,我們就用同樣的值將其替換。這樣就可以對你的信息即進行了加密處理、又保留了數(shù)據(jù)信息的完整性。例如,在對員工姓名進行加密后,你照樣可以對每個員工的工作量進行分析。
讓我們值得高興的事,一些過程挖掘工具包含了加密功能。這就意味加密將變得簡單,我們只需簡單的將數(shù)據(jù)導入工具,然后選擇要加密的數(shù)據(jù),輕輕一點,就實現(xiàn)了數(shù)據(jù)加密。 在這個過程中,你需要做如下事情:
● 確定要加密信息并且明確加密后對數(shù)據(jù)分析的影響;
● 提高信息安全意識,某些信息即使加密,也有可能會造成信息安全問題。例如在病歷中,只有一個人患有某一種罕見的特殊疾病,如果我們知道這個人的出生日期及其出生時間,那么通過這些信息我們就很有可能推斷出患有此疾病的人是誰。
● 數(shù)據(jù)清洗之前進行數(shù)據(jù)加密。例如:在不同地區(qū)我們對用戶類別的叫法稍有不同,但它們實際是一類,在數(shù)據(jù)清洗的時候,你可以簡單的將那些叫法不同但含義相同的類進行合并,如果你先對數(shù)據(jù)進行了加密,那么這些叫法不同但含義相同的類將被徹底分為兩個不同的類,它們將會很難被合并。
以下事情不應該做:
不要給不需要加密的信息進行加密處理。加密盡管可以保留原始信息,但其卻會失去相關(guān)信息。舉個例子,如果你對Case ID進行加密,那么在服務臺你就無法查詢關(guān)于該Case ID的先關(guān)信息。如果你的團隊責任意識強、保密意識強,那么你還是可以考慮將原始數(shù)據(jù)向整個團隊公開的。
4 合作文化
在負責任的流程挖掘過程中,最重要的就是創(chuàng)建一種合作的文化。流程挖掘可以發(fā)現(xiàn)業(yè)務流程中的不足,并將這種不足以一種透明的形式展現(xiàn)在人們面前,因此,我們應鼓勵人們說“實話”,即說出業(yè)務流程中的不足。此外,我們還應該選擇一種恰當?shù)姆绞綄⒛愕牧鞒掏诰蚰繕伺c相關(guān)人員進行溝通。這樣做的目的是為創(chuàng)造一種這樣的環(huán)境,即我們不是在責怪你(因為你使得業(yè)務流程出現(xiàn)問題),而是說與你一起努力,使我們的流程更加合理、完善。為了達到這個效果,你應該做如下事情:
確保數(shù)據(jù)質(zhì)量,最好聘請相關(guān)領(lǐng)域?qū)<覍?shù)據(jù)進行審查。數(shù)據(jù)質(zhì)量足夠高,那么挖掘出來的信息才能讓人更加信服、更具有代表性。
使用迭代的方式進行挖掘,即將挖掘出的新信息做為下一次挖掘的已知條件。給人們解釋與提問的機會。這有助于提高你的挖掘效果。
跳出結(jié)論:永遠不要以為自己將流程看得很清、很透。進展慢的組可能解決了棘手的問題。人們可能因為一個充分而合理的理由而對原問題跑偏。討論的時候,將自己的觀察作為出發(fā)點,而不是結(jié)論,聽取別人的解釋,構(gòu)建一種信任、協(xié)作的文化氛圍。
不要做的事情:
不要通過歪曲數(shù)據(jù)來證明自己的觀點,相反,密切注意過程挖掘中所采用的的數(shù)據(jù)與流程。對分析結(jié)果有任何疑問,我們都要進行相關(guān)回溯。例如,如果我們對挖掘出的結(jié)果有疑問,我們就應該立即分析,以確定到底是哪些數(shù)據(jù)過濾導致了這個觀點的產(chǎn)生。
via KDnuggets,雷鋒網(wǎng)編譯
【兼職召集令!】
如果你對未來充滿憧憬,喜歡探索改變世界的科技進展,look no further!
我們需要這樣的你:
精通英語,對技術(shù)與產(chǎn)品感興趣,關(guān)注人工智能學術(shù)動態(tài)的蘿莉&萌妹子&技術(shù)宅;
文字不求妙筆生花,但希望通俗易懂;
在這里,你會收獲:
一群來自天南地北、志同道合的小伙伴;
前沿學術(shù)科技動態(tài),每天為自己充充電;
更高的生活品質(zhì),翻翻文章就能掙到零花錢;
有意向的小伙伴們把個人介紹/簡歷發(fā)至 guoyixin@leiphone.com,如有作品,歡迎一并附上。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。