丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能 正文
發(fā)私信給叢末
發(fā)送

0

杉數(shù)科技趙珂珍:大數(shù)據(jù)分析工程師的求職分享—從大廠到初創(chuàng)企業(yè)的決策之路 | AI 研習(xí)社職播間第 5 期

本文作者: 叢末 2018-10-30 10:24
導(dǎo)語(yǔ):數(shù)據(jù)分析師入行需要的技術(shù)能力較易,轉(zhuǎn)行、自學(xué)性價(jià)比極高。
活動(dòng)
企業(yè):杉數(shù)科技
操作:公開課合作
事項(xiàng):求職分享

隨著互聯(lián)網(wǎng)的興起,人工智能和大數(shù)據(jù)成為了熱門領(lǐng)域,越來越多的企業(yè)開始通過對(duì)數(shù)據(jù)的挖掘分析來為商業(yè)決策提供建議,在國(guó)內(nèi)市場(chǎng),人工智能和大數(shù)據(jù)領(lǐng)域人才出現(xiàn)巨大的缺口。而數(shù)據(jù)分析師入行需要的技術(shù)能力較易,轉(zhuǎn)行/自學(xué)性價(jià)比極高,成為大數(shù)據(jù)領(lǐng)域的熱門職業(yè)。

近日,在雷鋒網(wǎng) AI 研習(xí)社第 5 期職播間上,杉數(shù)科技算法工程師趙珂珍進(jìn)行了「從大廠到初創(chuàng)企業(yè)的決策之路」的求職分享,并進(jìn)行了招聘宣講。公開課回放視頻網(wǎng)址:http://www.mooc.ai/open/course/567?=zhaokezhen

趙珂珍:杉數(shù)科技算法工程師,本科畢業(yè)于天津大學(xué)建筑工程學(xué)院,研究生畢業(yè)于斯坦福大學(xué)工學(xué)院,從傳統(tǒng)工程學(xué)科跨領(lǐng)域成為算法工程師,曾在國(guó)內(nèi)頭部大廠擔(dān)任數(shù)據(jù)分析師,現(xiàn)就職于杉數(shù)科技,從事與大數(shù)據(jù)相關(guān)的工作。

分享主題:大數(shù)據(jù)分析工程師的求職分享—從大廠到初創(chuàng)企業(yè)的決策之路

分享提綱:

1. 個(gè)人經(jīng)歷及為何選擇杉數(shù)科技;

2. 大數(shù)據(jù)分析工程師職業(yè)內(nèi)容;

3. 大數(shù)據(jù)分析工業(yè)場(chǎng)景應(yīng)用實(shí)例;

4. 大數(shù)據(jù)分析/挖掘的自學(xué)建議;

5. 杉數(shù)科技招聘內(nèi)容及內(nèi)推通道。

雷鋒網(wǎng) AI 研習(xí)社將其分享內(nèi)容整理如下:

大家好,歡迎來到 AI 研習(xí)社職播間,我是分享嘉賓趙珂珍,這次的分享內(nèi)容更針對(duì)初入職場(chǎng)或者有志于跨領(lǐng)域轉(zhuǎn)入大數(shù)據(jù)分析相關(guān)崗位的求職者。本次分享包括:

第一,簡(jiǎn)單介紹個(gè)人經(jīng)歷以及最終選擇杉數(shù)科技公司的原因;

第二,簡(jiǎn)單介紹大數(shù)據(jù)分析師是做什么的,在行業(yè)內(nèi)有怎樣的分類,以及工作中具體需要用到哪些技能等等;

第三,結(jié)合我在大廠和杉數(shù)科技的經(jīng)驗(yàn),根據(jù)具體的工業(yè)場(chǎng)景應(yīng)用實(shí)例,讓大家了解大數(shù)據(jù)分析師的工作內(nèi)容;

第四,結(jié)合自己求學(xué)、求職和工作的經(jīng)驗(yàn),為大家提供一些大數(shù)據(jù)分析師所需要的學(xué)習(xí)建議和資源(其中包括我在斯坦福學(xué)習(xí)的優(yōu)質(zhì)課程資源);

第五,詳細(xì)介紹一下杉數(shù)科技的業(yè)務(wù)和公司情況,為大家講解算法工程師類的招聘需求,并提供簡(jiǎn)歷投放通道。

個(gè)人經(jīng)歷及為何選擇杉數(shù)科技

首先,做一個(gè)簡(jiǎn)單的自我介紹。我本科畢業(yè)于天津大學(xué)工學(xué)院,主要學(xué)習(xí)建筑工程的水利工程,它和土木工程比較類似。在校期間,我學(xué)習(xí)了大量力學(xué)和數(shù)學(xué)相關(guān)知識(shí),并在南開大學(xué)獲得金融雙學(xué)位,主要學(xué)習(xí)數(shù)學(xué)、經(jīng)濟(jì)學(xué)和金融學(xué)相關(guān)的基本理論。研究生畢業(yè)于斯坦福工學(xué)院,專業(yè)是環(huán)境流體力學(xué),這個(gè)專業(yè)要求很扎實(shí)的線性代數(shù)知識(shí)和編程技能。另外,因?yàn)檠芯可捎米杂蛇x課制度,跟本科差別不大,學(xué)生可以選修學(xué)院的其他課程,因此我修完本專業(yè)學(xué)分后,還選修了一些熱門課程,例如吳恩達(dá)的機(jī)器學(xué)習(xí)課程 CS229,李飛飛的深度學(xué)習(xí)與圖像識(shí)別 CS231n。

杉數(shù)科技趙珂珍:大數(shù)據(jù)分析工程師的求職分享—從大廠到初創(chuàng)企業(yè)的決策之路 | AI 研習(xí)社職播間第 5 期

后來在課程學(xué)習(xí)過程中,我有了跨行業(yè)就業(yè)的想法。當(dāng)時(shí)考慮到目前業(yè)內(nèi)大多數(shù)博士生在做 AI 設(shè)計(jì),而研究生階段的課程和數(shù)據(jù)挖掘的銜接更為自然,因此我開始找數(shù)據(jù)相關(guān)的實(shí)習(xí)。研一暑假,我在國(guó)內(nèi)頭部大廠總部新成立的大數(shù)據(jù)分析部擔(dān)任數(shù)據(jù)分析工程師,兩個(gè)多月后拿到了 return offer。研二第一學(xué)期,我又接觸到斯坦福校友組建的創(chuàng)業(yè)公司——杉數(shù)科技,并且拿到 offer 回國(guó)入職。目前我正式在杉數(shù)科技工作,擔(dān)任算法工程師,主攻機(jī)器學(xué)習(xí)方向。

結(jié)合我個(gè)人的經(jīng)歷來看,我今天的分享主要回答三個(gè)問題:為什么選擇跨專業(yè)進(jìn)入大數(shù)據(jù)領(lǐng)域?為什么選擇回國(guó)就業(yè)?大廠和初創(chuàng)企業(yè)有什么差異,為什么我最終選擇了創(chuàng)業(yè)公司?這三個(gè)問題也是大多數(shù)求職者或多或少會(huì)面臨的問題。

第一個(gè)是職業(yè)方向的選擇。比起我本專業(yè)的方向,大數(shù)據(jù)領(lǐng)域有著顯而易見的幾點(diǎn)優(yōu)勢(shì):人才缺口非常大,薪資的相對(duì)水平比較高,成長(zhǎng)速度比較快。

從互聯(lián)網(wǎng)開始普及,我們每天都會(huì)產(chǎn)生大量的數(shù)據(jù),并且數(shù)據(jù)存儲(chǔ)技術(shù)也在進(jìn)一步發(fā)展,所以大數(shù)據(jù)背后的價(jià)值越來越被大家所重視。實(shí)際上,銀行、電商等領(lǐng)域中,數(shù)據(jù)分析已經(jīng)有完整的職業(yè)生態(tài)了,但是信息技術(shù)的發(fā)展,給數(shù)據(jù)分析帶來了更多的應(yīng)用場(chǎng)景,目前單電商領(lǐng)域的發(fā)展就帶來了采銷、倉(cāng)儲(chǔ)、運(yùn)送等環(huán)節(jié)的數(shù)據(jù)應(yīng)用,甚至傳統(tǒng)工業(yè)也都對(duì)數(shù)據(jù)挖掘提出要求,而在未來幾十年里,這個(gè)需求都不會(huì)衰退,大數(shù)據(jù)的用人缺口極大。

目前,高校針對(duì)大數(shù)據(jù)分析和人工智能領(lǐng)域設(shè)置的對(duì)口專業(yè)非常少,很多專業(yè)人才都是計(jì)算機(jī)、金融或者統(tǒng)計(jì)出身,而用人市場(chǎng)又存在極大的需求,因而工資也水漲船高。

至于成長(zhǎng)速度,一方面,大數(shù)據(jù)面對(duì)的工業(yè)場(chǎng)景在不斷更新和擴(kuò)展,目前比較熱門的可能是互聯(lián)網(wǎng)電商行業(yè),而很多傳統(tǒng)工業(yè)也在嘗試用大數(shù)據(jù)做決策優(yōu)化;另一方面,很多數(shù)據(jù)挖掘理論也在與時(shí)俱進(jìn),因此數(shù)據(jù)挖掘算法相關(guān)從業(yè)者需要保持項(xiàng)目的實(shí)踐推進(jìn)能力,并持續(xù)進(jìn)行理論學(xué)習(xí),這類從業(yè)者的淘汰率大,壓力也大,不過成長(zhǎng)速度也快。

第二個(gè)問題是為什么回國(guó)。一個(gè)原因是根據(jù)自身情況所做出的選擇,在這里不多說,有借鑒意義的是中美在大數(shù)據(jù)行業(yè)的差異性。

美國(guó)作為一個(gè)發(fā)達(dá)國(guó)家,很多應(yīng)用場(chǎng)景下的數(shù)據(jù)采集、管理分析流程已經(jīng)比較成熟了。除了前沿的技術(shù)研究進(jìn)展,從工業(yè)應(yīng)用領(lǐng)域來看,中美大體差異不大,甚至中國(guó)在未來的發(fā)展空間還更廣闊,但是涉及到一些傳統(tǒng)工業(yè)或電商、物流這類的新型產(chǎn)業(yè),中國(guó)整體的大數(shù)據(jù)應(yīng)用水平還是比較遲滯的。

中國(guó)在數(shù)據(jù)這一領(lǐng)域的發(fā)展空間會(huì)給大家更多的機(jī)會(huì),因此在大數(shù)據(jù)行業(yè)發(fā)光發(fā)熱,其實(shí)是一個(gè)非常好的選擇?,F(xiàn)在進(jìn)入這一行業(yè)的人,在某種程度上會(huì)成為第一批接觸并且解決該行業(yè)問題的人才。

第三個(gè)問題是創(chuàng)業(yè)公司和大廠有哪些區(qū)別。實(shí)際上,二者有各自的優(yōu)勢(shì)。大廠具有穩(wěn)定、體系分明、接觸業(yè)務(wù)層面較深、細(xì)分領(lǐng)域深耕、晉升通道明確等優(yōu)勢(shì),而初創(chuàng)公司的優(yōu)勢(shì)表現(xiàn)在:管理扁平、任人唯能、接觸項(xiàng)目廣泛、直接對(duì)接客戶,并對(duì)業(yè)界的不同領(lǐng)域均能涉獵,成長(zhǎng)曲線陡峭。

在劣勢(shì)上,大廠可能存在視野過窄、不跳槽難以晉升、工作內(nèi)容及模式固定化、成為一顆「螺絲釘」等問題。而初創(chuàng)公司相對(duì)來說比較不穩(wěn)定,并且團(tuán)隊(duì)靠譜與否會(huì)影響上述優(yōu)勢(shì)能否保證。

我個(gè)人傾向去創(chuàng)業(yè)公司或者大廠剛剛成立的重點(diǎn)部門,因?yàn)槎?strong>者都具備一個(gè)特質(zhì),就是都能接觸到大量工作和項(xiàng)目,而不是在一些細(xì)分的領(lǐng)域做「螺絲釘」。在我看來,入行初期比較重要的是行業(yè)視野——大面看得全,才能夠在深耕領(lǐng)域做出最優(yōu)的選擇。因此我的第一份正式工作就選擇了創(chuàng)業(yè)公司。另外我實(shí)習(xí)大廠的大數(shù)據(jù)部門,也有同樣優(yōu)勢(shì),它剛剛成立,能夠很快對(duì)接到業(yè)務(wù)層面,并且其內(nèi)部也是采取扁平化的管理方式,能給我很多的鍛煉機(jī)會(huì)。

其他原因還包括團(tuán)隊(duì)和成長(zhǎng)機(jī)會(huì)。我曾在硅谷機(jī)緣巧合地接觸到了杉數(shù)科技的 CTO 王子卓老師,便立志加入杉數(shù)團(tuán)隊(duì)。由于杉數(shù)科技目前還在成長(zhǎng)階段,能夠讓我接觸大量項(xiàng)目,而每一個(gè)項(xiàng)目就是行業(yè)或工業(yè)的解決方案。此外,除了技術(shù)和理論研究實(shí)力非常強(qiáng)大的創(chuàng)始人團(tuán)隊(duì),杉數(shù)科技更有一批行業(yè)非常頂尖的科學(xué)家,這些都是行業(yè)內(nèi)的超優(yōu)質(zhì)資源。因此對(duì)個(gè)人而言,杉數(shù)科技的工作不僅僅意味著能與這些優(yōu)秀科學(xué)家共事,大量的項(xiàng)目也非常鍛煉人。

杉數(shù)科技是一家基于大數(shù)據(jù)的咨詢公司,主要客戶是中國(guó)工業(yè)界的大中型企業(yè),其基于大數(shù)據(jù)的精細(xì)化運(yùn)算和行業(yè)解決方案,能夠幫助企業(yè)提高決策水平。

之所以說杉數(shù)科技的前景非常好,一方面是因?yàn)榇蟓h(huán)境下越來越多的工業(yè)企業(yè)開始重視數(shù)據(jù),但它們未必有足夠的資金像 BAT 一樣去養(yǎng)數(shù)據(jù)團(tuán)隊(duì),并且即便是 BAT 這樣的大型企業(yè),針對(duì)特定的、非常態(tài)的復(fù)雜問題也需要搞外包服務(wù),這也是杉數(shù)科技存在的價(jià)值。另一方面,杉數(shù)科技創(chuàng)始人團(tuán)隊(duì)都是斯坦福高學(xué)歷人才,并且配備豐富的行業(yè)經(jīng)驗(yàn)和學(xué)術(shù)經(jīng)驗(yàn),并兼有強(qiáng)勁的技術(shù)實(shí)力和前沿的理論研究實(shí)力,曾為 Google、IBM、波音、美國(guó)能源部、中國(guó)電網(wǎng)等機(jī)構(gòu)解決運(yùn)營(yíng)決策優(yōu)化問題。

大數(shù)據(jù)分析工程師職業(yè)內(nèi)容

下面我講一下大數(shù)據(jù)分析師的工作內(nèi)容,公司的崗位需求以及職業(yè)發(fā)展路徑。

數(shù)據(jù)分析這個(gè)概念,其實(shí)大家都不陌生,基本上就是針對(duì)一些數(shù)據(jù)源,去探索它們的特點(diǎn),得出相應(yīng)的結(jié)論或者追溯一些商業(yè)現(xiàn)象的原因。不同于傳統(tǒng)的數(shù)據(jù)分析,大數(shù)據(jù)分析不僅僅是基于自身的數(shù)據(jù)統(tǒng)計(jì),有時(shí)也需要考慮一些外部因素,對(duì)其他需要的數(shù)據(jù)源進(jìn)行采集、整理和合并,并且它的數(shù)據(jù)規(guī)模比較大,從業(yè)人員需要掌握一定的運(yùn)行并行工具和算法,而不僅局限于基于統(tǒng)計(jì)學(xué)的分析。

但是就我的從業(yè)經(jīng)歷來看,大部分?jǐn)?shù)據(jù)分析師的末端工作內(nèi)容還是基于一些常用的統(tǒng)計(jì)學(xué)理論和傳統(tǒng)的數(shù)據(jù)分析方法,只是在這一步前增加了很多大型數(shù)據(jù)集整理、合并和運(yùn)算的過程,而這些過程需要一些新的技能和理論。

從一個(gè)維度來說,目前大數(shù)據(jù)分析有兩個(gè)大體的方向:

杉數(shù)科技趙珂珍:大數(shù)據(jù)分析工程師的求職分享—從大廠到初創(chuàng)企業(yè)的決策之路 | AI 研習(xí)社職播間第 5 期

一個(gè)是偏業(yè)務(wù)方向,這個(gè)方向要求從業(yè)者對(duì)業(yè)務(wù)有著比較深的理解,并且有比較強(qiáng)的統(tǒng)計(jì)學(xué)理論知識(shí),能夠?qū)Υ笮蛿?shù)據(jù)集做簡(jiǎn)單的處理,然后得到所需維度的數(shù)據(jù),而最重要的一項(xiàng)能力是,要能夠結(jié)合商用市場(chǎng)和業(yè)務(wù)提出的要求,去定位問題和發(fā)現(xiàn)結(jié)論。一般來說,工作中所需外部數(shù)據(jù)源越少,前期的物理邏輯就越簡(jiǎn)單,也越接近傳統(tǒng)的商業(yè)分析。

比如拿到某個(gè)企業(yè)某個(gè)部門這一季度的所有訂單后,需要對(duì)訂單的來源去向分區(qū)域、分時(shí)段進(jìn)行統(tǒng)計(jì),然后要輸出結(jié)果、監(jiān)控異常、定位來源,并根據(jù)數(shù)據(jù)表現(xiàn)提出解決方案,這一整個(gè)過程就是商業(yè)分析。而當(dāng)數(shù)據(jù)量達(dá)到一定的規(guī)模,沒有辦法用 Excel 這些工具直接進(jìn)行分析的時(shí)候,就需要使用一些大數(shù)據(jù)平臺(tái)對(duì)數(shù)據(jù)進(jìn)行預(yù)處理和預(yù)運(yùn)算,比如維度擴(kuò)大到整個(gè)企業(yè)某季度的所有訂單。其中,當(dāng)我們?cè)诜治霎a(chǎn)品類型、客戶類型等多個(gè)維度的結(jié)果輸出的時(shí)候,涉及到的就是某些初級(jí)大數(shù)據(jù)分析師的工作內(nèi)容,一直到這一步,相關(guān)的數(shù)據(jù)分析都是跟業(yè)務(wù)結(jié)合得非常緊密的。

目前很多領(lǐng)域的大數(shù)據(jù)分析師的基本工作內(nèi)容,就是在大數(shù)據(jù)平臺(tái)用 SQL 等工具來整理和取數(shù),做一些初步運(yùn)算,然后再用 Excel 進(jìn)行分析和操作。而精細(xì)到不同場(chǎng)景,這個(gè)崗位會(huì)有一些不同的發(fā)展方向:有做數(shù)據(jù)產(chǎn)品的,需要具備一定的需求把控能力和項(xiàng)目管理能力;有做決策支持的,需要一些商業(yè)敏感度—在一些業(yè)務(wù)開展之前,要能夠利用市場(chǎng)數(shù)據(jù)的各個(gè)維度進(jìn)行分析,以確定某項(xiàng)業(yè)務(wù)是否要開展,有哪些方案,以及哪些方案能最大程度地爭(zhēng)取利潤(rùn)和減少風(fēng)險(xiǎn)等等;有做數(shù)據(jù)運(yùn)營(yíng)的,包括客戶運(yùn)營(yíng)和產(chǎn)品增長(zhǎng)運(yùn)營(yíng)等,要結(jié)合一些歷史數(shù)據(jù)和數(shù)據(jù)規(guī)律,找到其增長(zhǎng)點(diǎn),推行并迭代數(shù)據(jù)。

我們可以從這些工作內(nèi)容看到,其實(shí)偏業(yè)務(wù)方向的大數(shù)據(jù)分析師結(jié)合市場(chǎng)、產(chǎn)品或者運(yùn)營(yíng),可以有多種發(fā)展方向,他們可以緊貼著業(yè)務(wù)、運(yùn)營(yíng)和產(chǎn)品等跟市場(chǎng)結(jié)合比較緊密的部分不斷成長(zhǎng),直到進(jìn)入決策層,前景十分光明。

這種業(yè)務(wù)型大數(shù)據(jù)分析師的崗位需求,在技能方面的門檻不是非常高?;旧蠈W(xué)會(huì)用 SQL 取數(shù),可以使用大數(shù)據(jù)平臺(tái)對(duì)一些數(shù)據(jù)進(jìn)行處理,會(huì)用 Excel 的高端操作進(jìn)行數(shù)據(jù)分析、匯報(bào)撰寫以及擁有基本的可視化技術(shù),就可以嘗試找這方面的工作了。另外,這個(gè)崗位的核心能力在于你的商業(yè)敏感度以及對(duì)業(yè)務(wù)的了解深度,而這些都是需要在實(shí)際工作中積累的軟實(shí)力。

另一個(gè)是偏技術(shù)方向,其基礎(chǔ)仍然是做數(shù)據(jù)分析,但是工作的側(cè)重點(diǎn)有所變化。除了監(jiān)控?cái)?shù)據(jù)、鎖定異常、查找原因等工作內(nèi)容,數(shù)據(jù)挖掘方向的大數(shù)據(jù)分析師面臨多一層的需求——給定解決方案。比如某個(gè)網(wǎng)站想要將廣告投放收入最大化,你要考慮怎樣根據(jù)網(wǎng)站的流量分布采取適當(dāng)?shù)耐斗欧桨负褪召M(fèi)方案,甚至針對(duì)不同客戶進(jìn)行定向投放等,這其中就涉及一些推薦問題。一套合理的投放模型,向上要考慮廣告投放方案的利潤(rùn)最大化,向下要考慮向客戶推薦廣告能夠最大化地帶來真實(shí)流量,這一系列的邏輯,不僅要基于大量的數(shù)據(jù)采集來分析結(jié)論,也要基于業(yè)務(wù)邏輯、算法理論和基于經(jīng)驗(yàn)的假設(shè)提出解決方案—實(shí)際上到這個(gè)階段,大數(shù)據(jù)分析師已經(jīng)進(jìn)階為大數(shù)據(jù)工程師和科學(xué)家。同時(shí),這個(gè)過程中還會(huì)用到一些基于大數(shù)據(jù)工具下的數(shù)據(jù)挖掘算法、傳統(tǒng)機(jī)器算法,甚至深度學(xué)習(xí)算法知識(shí)。嚴(yán)格意義上講,這已經(jīng)是算法工程師的工作了。

不過實(shí)際上在很多應(yīng)用場(chǎng)景下,大數(shù)據(jù)分析師不需要解決這樣系統(tǒng)、龐大的類如推薦、識(shí)別等問題,而只需要在具體工作場(chǎng)景下針對(duì)一些小的問題,建立簡(jiǎn)單的機(jī)器學(xué)習(xí)模型,比如隨機(jī)回歸、邏輯分類器等。以一個(gè)小的應(yīng)用場(chǎng)景為例,在給定了客戶數(shù)據(jù)后,需要訓(xùn)練一個(gè)分類器能夠最大程度地識(shí)別傾向于某個(gè)產(chǎn)品子類的客戶,從而對(duì)這個(gè)客戶進(jìn)行篩選,然后提供針對(duì)性的服務(wù)。這是一個(gè)比較簡(jiǎn)單的分類問題,需要根據(jù)不同的情況采用不同的方法進(jìn)行建模。

總之,偏技術(shù)這個(gè)方向的大數(shù)據(jù)分析師,無論是利用傳統(tǒng)機(jī)器學(xué)習(xí)方法還是深度學(xué)習(xí)方法,都需要采用一定的數(shù)據(jù)挖掘算法,去嘗試建立模型解決問題,迭代、更新數(shù)據(jù)以及不斷調(diào)整參數(shù),這一整套過程就是大多數(shù)數(shù)據(jù)挖掘師的工作邏輯。

這個(gè)方向下也細(xì)分出很多不同的發(fā)展方向,比如定價(jià)、推薦、語(yǔ)音識(shí)別、NLP 等等,但這個(gè)方向因?yàn)殚T檻比較高,要求掌握扎實(shí)的數(shù)學(xué)、線性代數(shù)、計(jì)算機(jī)算法理論基礎(chǔ),以及較強(qiáng)的代碼能力。另外,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法還在不斷更新中,基本上會(huì)隨著論文更新出現(xiàn)新的算法,因此這個(gè)方面需要大家不斷學(xué)習(xí),保持閱讀論文,隨時(shí)更新個(gè)人知識(shí)。

在工業(yè)界,偏技術(shù)方向的人一般會(huì)沿著技術(shù)專家、數(shù)據(jù)科學(xué)家的路線發(fā)展,或者在積累經(jīng)驗(yàn)后產(chǎn)學(xué)結(jié)合進(jìn)行算法方面的革新等等。對(duì)于想要跨專業(yè)往這個(gè)領(lǐng)域發(fā)展的求職者,我建議大家先進(jìn)入一些技能較低的大數(shù)據(jù)分析崗位,在工業(yè)界積累一定問題處理能力后,再在特定領(lǐng)域通過深造努力向數(shù)據(jù)挖掘方向靠攏。

目前,大數(shù)據(jù)分析師和數(shù)據(jù)挖掘師的行業(yè)主要集中在數(shù)據(jù)采集和管理比較成熟和體系化的金融、政務(wù)等領(lǐng)域,其中,金融行業(yè)的大數(shù)據(jù)分析師會(huì)相對(duì)偏量化一點(diǎn),并且側(cè)重商業(yè)分析,要求較高的金融理論知識(shí)。不過,互聯(lián)網(wǎng)企業(yè)可能會(huì)是未來大數(shù)據(jù)人才缺口最大的行業(yè),比如電商、物流行業(yè)的整個(gè)鏈條的智能管理和決策優(yōu)化都要基于一定大數(shù)據(jù)算法實(shí)現(xiàn);而政務(wù)領(lǐng)域往往是基于互聯(lián)網(wǎng)+平臺(tái),并且采取一些外包的方式實(shí)現(xiàn)智能化管理。此外,像今日頭條這類資訊型的互聯(lián)網(wǎng)公司也會(huì)有廣告推薦、用戶增長(zhǎng)等大數(shù)據(jù)分析相關(guān)的熱門崗位。

除了本身搭載移動(dòng)互聯(lián)網(wǎng)信息化的成熟企業(yè),工業(yè)界企業(yè)對(duì)大數(shù)據(jù)應(yīng)用上的訴求基本上集中在倉(cāng)配優(yōu)化、成本控制、定量預(yù)測(cè)等很多細(xì)分領(lǐng)域。大數(shù)據(jù)比較成熟的企業(yè),比較重視在深耕領(lǐng)域的精細(xì)化模型的搭建,比如我們前面提到的推薦算法等等,但是對(duì)于大數(shù)據(jù)初具規(guī)模的企業(yè)和傳統(tǒng)企業(yè)來說,基于成本控制和利潤(rùn)提升的簡(jiǎn)單算法的全局性優(yōu)化方案是更為重要的。

數(shù)據(jù)分析和數(shù)據(jù)科學(xué)也是有差異的。基本上,數(shù)據(jù)分析的技術(shù)棧有三個(gè):數(shù)據(jù)庫(kù)處理、腳本細(xì)處理(有一些公司會(huì)對(duì)這個(gè)技能有一定要求)、維度分析+可視化。而數(shù)據(jù)科學(xué)是基于數(shù)據(jù)分析的技能,要求比較強(qiáng)的編程能力、數(shù)學(xué)能力和算法能力,門檻相對(duì)較高。

大數(shù)據(jù)分析工業(yè)場(chǎng)景應(yīng)用實(shí)例

簡(jiǎn)單舉個(gè)實(shí)例來介紹一下我在工業(yè)界中所做的與大數(shù)據(jù)分析相關(guān)的工作。由于大多數(shù)數(shù)據(jù)分析崗位也要求一定的基本建模能力,所以我把涉及到數(shù)據(jù)分析的工作內(nèi)容簡(jiǎn)單歸類為三個(gè)大場(chǎng)景:

第一個(gè),數(shù)據(jù)監(jiān)控。這一類場(chǎng)景下基本是固定取數(shù)邏輯,只需根據(jù)業(yè)務(wù)市場(chǎng)或數(shù)據(jù)模型的需求,從數(shù)據(jù)庫(kù)中提取元代數(shù)據(jù),再通過邏輯合并和運(yùn)算處理輸出結(jié)果。數(shù)據(jù)監(jiān)控工作具有重復(fù)性的特點(diǎn),需要周期性生成固定口徑的數(shù)據(jù),以及監(jiān)控一段時(shí)間內(nèi)的數(shù)據(jù)分布,鎖定數(shù)據(jù)異常,并且發(fā)現(xiàn)異常時(shí),還需要在數(shù)據(jù)庫(kù)中結(jié)合業(yè)務(wù)進(jìn)行診斷,最后生成分析報(bào)告。我一般會(huì)用 SQL 取數(shù)、Excel 統(tǒng)計(jì),最后做 PPT 進(jìn)行匯報(bào)。

第二個(gè),數(shù)據(jù)分析。這個(gè)場(chǎng)景跟數(shù)據(jù)監(jiān)控相似,不同的是,它是不固定取數(shù)邏輯,可能會(huì)涉及多次取數(shù)以及不同的分析方法,因?yàn)槠渥罱K目的是在數(shù)據(jù)層面找到一些現(xiàn)象的原因、結(jié)論,而在分析之前,我們很難從成百上千個(gè)工業(yè)維度的數(shù)據(jù)直接定位到造成某個(gè)影響的維度。另外這一場(chǎng)景最終的呈現(xiàn)形式也是匯報(bào),需要用到一些前端知識(shí)和便利的可視化軟件。

第三個(gè),數(shù)據(jù)建模。這個(gè)場(chǎng)景需要在分析的基礎(chǔ)上,根據(jù)業(yè)務(wù)需求抽象模型方案并進(jìn)行數(shù)據(jù)集探索,建模完成相應(yīng)需求。

除了這三個(gè)場(chǎng)景,還有一些其他場(chǎng)景,它們不屬于大數(shù)據(jù)分析師的崗位,但需要密切依靠大數(shù)據(jù)的相關(guān)工作,例如工業(yè)定價(jià)、工業(yè)銷量預(yù)測(cè)、倉(cāng)儲(chǔ)管理、供應(yīng)鏈優(yōu)化等,這些工作都需結(jié)合運(yùn)籌學(xué)和其他算法知識(shí)進(jìn)行數(shù)據(jù)挖掘、建模及優(yōu)化工作。

下面是我的一個(gè)具體工作案例,讓大家了解這三個(gè)場(chǎng)景在實(shí)際工作中的具體應(yīng)用。這是我們公司做的一個(gè)定價(jià)項(xiàng)目下的子環(huán)節(jié):

杉數(shù)科技趙珂珍:大數(shù)據(jù)分析工程師的求職分享—從大廠到初創(chuàng)企業(yè)的決策之路 | AI 研習(xí)社職播間第 5 期

(關(guān)于該定價(jià)項(xiàng)目的具體工作案例講解,請(qǐng)請(qǐng)回看視頻 00:26:30 處,http://www.mooc.ai/open/course/567?=zhaokezhen

大數(shù)據(jù)分析/挖掘的自學(xué)建議

針對(duì)大數(shù)據(jù)分析和初步數(shù)據(jù)挖掘自學(xué),我會(huì)提供一些建議,也會(huì)給大家提供一些資料。

現(xiàn)在,大數(shù)據(jù)分析崗位所需的技能包括:

杉數(shù)科技趙珂珍:大數(shù)據(jù)分析工程師的求職分享—從大廠到初創(chuàng)企業(yè)的決策之路 | AI 研習(xí)社職播間第 5 期

第一個(gè),數(shù)據(jù)獲取的技能,需要處理哪些數(shù)據(jù)/哪些維度/如何界定待分析等問題,大部分公司要求使用 SQL+R/Python 等軟件進(jìn)行預(yù)處理。

第二個(gè),數(shù)據(jù)處理的技能,需要掌握 R/Python 等工具,能幫助大家比較靈活地進(jìn)行數(shù)據(jù)清洗工作。不過針對(duì)數(shù)據(jù)量比較小的數(shù)據(jù),可以直接使用 Excel 處理,這就需要掌握 Excel 高端技能。

第三個(gè),數(shù)據(jù)分析的技能,其中的軟技能包括商業(yè)敏銳度、業(yè)務(wù)理解以及統(tǒng)計(jì)學(xué)知識(shí)。

第四個(gè),數(shù)據(jù)展示的技能,要求大家具備優(yōu)秀的可視化和良好的表達(dá)能力。

標(biāo)配就是 SQL+Excel,依靠這些能力基本上就能幫助你找到一些工作或者實(shí)習(xí)機(jī)會(huì)。

杉數(shù)科技趙珂珍:大數(shù)據(jù)分析工程師的求職分享—從大廠到初創(chuàng)企業(yè)的決策之路 | AI 研習(xí)社職播間第 5 期

針對(duì) SQL,我建議大家去菜鳥教程上進(jìn)行學(xué)習(xí),主要掌握比較簡(jiǎn)單的應(yīng)用型語(yǔ)法,可以一邊操作一邊學(xué)習(xí),遇到不懂的則要學(xué)會(huì)使用搜索引擎進(jìn)行查詢。另外,我建議直接上 Leecode 網(wǎng)站,刷一下數(shù)據(jù)結(jié)構(gòu)這幾道題,網(wǎng)站上按照從易到難的順序會(huì)有不同的解法,大家可以嘗試用不同方法去解決一個(gè)問題。掌握 SQL,基本上可以應(yīng)付工業(yè)界的取數(shù)任務(wù)了。

Excel 方面,基礎(chǔ)操作無法滿足要求,要求至少熟練使用常用的統(tǒng)計(jì)工具,如簡(jiǎn)單的表格數(shù)據(jù)處理、查詢、排序等,vlookup 等高級(jí)函數(shù),多維引用數(shù)值公式,可視化圖表(需要掌握?qǐng)D表展示、美化、高級(jí)圖表、圖標(biāo)插件等)以及非常常用的數(shù)據(jù)透視。另外,有的數(shù)據(jù)處理也涉及 VBA 開發(fā),大家如果對(duì)這方面有興趣也可以自學(xué)一下。

大家如果掌握了 SQL+ Excel+PPT 這三個(gè)工具,基本上就可以嘗試去找大數(shù)據(jù)相關(guān)的工作,之后可以根據(jù)個(gè)人發(fā)展方向和崗位需求確定自己的技能加強(qiáng)方向。

另外,針對(duì)想要學(xué)習(xí)一些腳本語(yǔ)言的同學(xué),我比較推薦 Python,這款軟件比較好用,且容易入門。大家可以上廖雪峰的官網(wǎng)上了解一下基本的 Python 語(yǔ)法、數(shù)據(jù)存儲(chǔ)方式等內(nèi)容。關(guān)于數(shù)據(jù)處理的學(xué)習(xí),則可以直接看 pandas 手冊(cè)(http://pandas.pydata.org/pandas-docs/stable/pandas.pdf)——從 500 頁(yè)開始基本上都在介紹常用的語(yǔ)法指令。目前數(shù)據(jù)處理方面的工作,一般都是使用 SQL+pandas 指令完成的。

如果需要掌握結(jié)構(gòu)化處理,大家可以學(xué)習(xí)一下 numpy 這個(gè)數(shù)據(jù)包,并在在工作中邊學(xué)邊用。在機(jī)器學(xué)習(xí)和深度學(xué)習(xí)中,該數(shù)據(jù)包的應(yīng)用比較多。

基于數(shù)據(jù)分析的數(shù)據(jù)挖掘,則要求自學(xué)者有較好的線性代數(shù)基礎(chǔ),并進(jìn)行機(jī)器學(xué)習(xí)和深度學(xué)習(xí)相關(guān)的學(xué)習(xí)。關(guān)于傳統(tǒng)的機(jī)器學(xué)習(xí)理論,比較完備的課程是吳恩達(dá)的 CS229,工業(yè)界中常見的分類和回歸問題所涉及到的,比如隨機(jī)分離以及樸素貝葉斯等理論,CS229 基本都涵蓋到了,不過這門課程偏理論一點(diǎn),因此對(duì)數(shù)學(xué)理論的要求非常高。大家之后在工作中可能遇到各種「疑難雜癥」,可以去閱讀相關(guān)論文或者技術(shù)博客(尋找相應(yīng)的解決方法和思路)。而實(shí)用性較強(qiáng)的課程中,我比較推薦 Stanford CS246 這門課程,包括基于 Spark 平臺(tái)去操作完成一些簡(jiǎn)單的推薦算法、直線聚類等與工業(yè)界結(jié)合非常緊密的實(shí)踐和課程。

此外,針對(duì)一些數(shù)據(jù)挖掘細(xì)分領(lǐng)域的偏理論的課程,我在資料(http://sendanywhe.re/900QEJJZ)中附上了著名的黃皮書,大家可以參考。

傳統(tǒng)機(jī)器學(xué)習(xí)相關(guān)工作,將這些理論掌握就可以說是做好比較充分的準(zhǔn)備了。需要注意的是,工業(yè)界跟學(xué)術(shù)界存在的一個(gè)比較顯著的差別就是,工業(yè)界的工業(yè)數(shù)據(jù)是非?!概K」的,當(dāng)遇到很多棘手的問題,我們無法獲得理想數(shù)據(jù)進(jìn)行模型訓(xùn)練,比如分類中常見的分類不平衡等問題,這就需要我們結(jié)合工業(yè)場(chǎng)景嘗試不同的算法和工業(yè)應(yīng)用理解去找到合適解決方法。另外,不同公司的數(shù)據(jù)分析崗位的具體工作內(nèi)容會(huì)有區(qū)別。因此,我認(rèn)為行業(yè)經(jīng)驗(yàn)以及學(xué)習(xí)和理解能力非常重要。

杉數(shù)科技招聘內(nèi)容及內(nèi)推通道

接下來介紹一下杉數(shù)科技,并給大家講一些崗位的招聘需求。

杉數(shù)科技于 2016 年 7 月份成立,總部在北京東城區(qū),并在上海楊浦區(qū)設(shè)立有子公司——上海杉數(shù)網(wǎng)絡(luò)科技有限公司。創(chuàng)立的同年 8 月,杉數(shù)科技便獲得真格基金與北極光創(chuàng)投的聯(lián)合投資,天使輪融資高達(dá) 210 萬美金,創(chuàng)下 2016 年中國(guó)大數(shù)據(jù)領(lǐng)域天使輪融資額度新高。2017 年 7 月,杉數(shù)科技完成 A 輪融資,融資額約 4000 萬元,由高達(dá)投資(Pagoda Investment)領(lǐng)投,將門創(chuàng)投、聯(lián)想創(chuàng)投跟投。

公司由五位斯坦福的教授及博士聯(lián)合創(chuàng)立,匯聚了海內(nèi)外一流科學(xué)家團(tuán)隊(duì),目標(biāo)是希望利用優(yōu)秀的人工智能決策技術(shù),讓中國(guó)每個(gè)企業(yè)都擁有定制最優(yōu)化決策的能力,并通過創(chuàng)新地結(jié)合一些機(jī)器學(xué)習(xí)和深度學(xué)習(xí)技術(shù)以及運(yùn)籌優(yōu)化技術(shù),為企業(yè)服務(wù)。目前的合作方包括京東、順豐、德邦、萬達(dá)、滴滴、永輝等各個(gè)行業(yè)的巨頭企業(yè)。

下面是我們公司最初的幾個(gè)創(chuàng)始人:

杉數(shù)科技趙珂珍:大數(shù)據(jù)分析工程師的求職分享—從大廠到初創(chuàng)企業(yè)的決策之路 | AI 研習(xí)社職播間第 5 期

杉數(shù)科技創(chuàng)立以來也獲得了大大小小數(shù)十個(gè)獎(jiǎng)項(xiàng),比如「國(guó)家高新技術(shù)企業(yè)」、「中關(guān)村技術(shù)企業(yè)」、黑馬新零售 Top 50 等。相比于傳統(tǒng)的咨詢公司,我們公司有一些優(yōu)勢(shì):較強(qiáng)的優(yōu)化求解技術(shù)、從數(shù)據(jù)到?jīng)Q策的閉環(huán)服務(wù)能力、頂尖的數(shù)據(jù)決策科學(xué)家團(tuán)隊(duì)等等。除此之外,我們還有許多與大企業(yè)的合作經(jīng)驗(yàn),目前仍與大企業(yè)保持深度合作。

我們的業(yè)務(wù)項(xiàng)目包括為電商、零售等行業(yè)提供智能預(yù)測(cè)、庫(kù)存優(yōu)化、倉(cāng)儲(chǔ)自動(dòng)化、收益管理、智慧選址等一系列的解決方案。

杉數(shù)科技趙珂珍:大數(shù)據(jù)分析工程師的求職分享—從大廠到初創(chuàng)企業(yè)的決策之路 | AI 研習(xí)社職播間第 5 期

其中,我介紹一下智能選址、倉(cāng)儲(chǔ)管理等杉數(shù)科技的成功案例,而在這些項(xiàng)目的實(shí)施過程中,我們也可以看到杉數(shù)科技需要哪些方面的人才。

案例一:智能選址。在零售行業(yè)相關(guān)項(xiàng)目中,我們做了門店選址項(xiàng)目。傳統(tǒng)的選址一般會(huì)根據(jù)行業(yè)經(jīng)驗(yàn)粗略地劃一片目標(biāo)區(qū)域,派遣人員進(jìn)行實(shí)地走訪并最終確認(rèn)。而在這個(gè)項(xiàng)目中,我們顛覆了傳統(tǒng)的選址方式,將選址問題變成了一個(gè)優(yōu)化問題,這個(gè)問題主要目的是:增加營(yíng)收,進(jìn)行品牌營(yíng)銷,以及提高人口覆蓋率、便利程度。

營(yíng)收方面,已知大量門店的流水?dāng)?shù)據(jù),再結(jié)合一定業(yè)務(wù)經(jīng)驗(yàn),我們挖掘了店面營(yíng)收相關(guān)的若干個(gè)大特征(大范圍內(nèi)共享的特征,比如人口覆蓋、最近地鐵站的距離等)和小特征(更精細(xì)的特征,包括店面的臺(tái)階高度,門前是否有欄桿等),對(duì)特征進(jìn)行量化后,采取了多種預(yù)測(cè)模型,最終使得每月的營(yíng)收準(zhǔn)確度高達(dá) 90% 以上。覆蓋率方面,我們將上海的大特征打到各個(gè)網(wǎng)格中,以找到全局營(yíng)收和人口覆蓋最優(yōu)的函數(shù)為選址目標(biāo),通過整數(shù)規(guī)劃獲得最優(yōu)網(wǎng)格后,再結(jié)合業(yè)務(wù)人員的實(shí)地考察,找到符合營(yíng)收最高的小特征的地址,并確定下來。這個(gè)過程中,要求數(shù)據(jù)分析師對(duì)業(yè)務(wù)有較深理解。

其中,在店面的特征對(duì)營(yíng)收造成影響上,我們將現(xiàn)實(shí)問題抽象成一個(gè)模型,并采用目標(biāo)、約束以及機(jī)器學(xué)習(xí)預(yù)測(cè)相關(guān)的方法。這就要求需要大數(shù)據(jù)分析師有很強(qiáng)的數(shù)據(jù)搜索、處理能力以及邏輯思維、取數(shù)、建模能力等。

案例二:智能倉(cāng)儲(chǔ)管理。這個(gè)項(xiàng)目中,我們將整個(gè)倉(cāng)儲(chǔ)問題分解為很多子問題,從問題流程的角度將其劃分為補(bǔ)貨問題、擺放問題、訂單波次問題以及揀貨路徑問題,這四個(gè)問題的聯(lián)合最優(yōu)解才是補(bǔ)貨和揀貨成本最低的最優(yōu)方案。

補(bǔ)貨問題是一個(gè)經(jīng)典的倉(cāng)儲(chǔ)問題。我們首先將庫(kù)存 SKU 按照銷量熱度分組,對(duì)于高銷量的產(chǎn)品,我們的策略是單獨(dú)為其開辟空間,這種產(chǎn)品一般處于促銷狀態(tài);而低銷量的產(chǎn)品的存放量則會(huì)比較少,這些數(shù)量可以應(yīng)付一段時(shí)間的需求。

擺放問題同樣涉及產(chǎn)品銷量熱度問題,此外還需要考慮產(chǎn)品間的關(guān)聯(lián)度。首先,熱銷產(chǎn)品要擺放在距離揀貨出發(fā)點(diǎn)最近的位置(如果出發(fā)點(diǎn)與終點(diǎn)分開,則需要離終點(diǎn)最近)。關(guān)聯(lián)度上,一個(gè)訂單同時(shí)出現(xiàn)兩款產(chǎn)品的可能性越高,產(chǎn)品的關(guān)聯(lián)度也就越高,揀貨員需要盡可能減少揀貨距離。另外,由于同一種貨物可能出現(xiàn)在不同的貨架上,這使得擺放問題的復(fù)雜性也更高。

訂單波次生成問題,是指一個(gè)揀貨員在單個(gè)揀貨路徑上可能進(jìn)行多個(gè)揀貨任務(wù),多次生成是為了在將同一個(gè)路徑上的揀貨任務(wù)生成到一個(gè)任務(wù)單上。倉(cāng)儲(chǔ)管理中出現(xiàn)的多個(gè)訂單,會(huì)進(jìn)入訂單池,之后訂單池中的訂單會(huì)實(shí)現(xiàn)最優(yōu)的訂單合并。這個(gè)問題中,我們也會(huì)考慮時(shí)效性來保證訂單波次的可靠性,例如合作態(tài)度比較低的訂單、訂單合并效果一般但是進(jìn)入訂單池很久的訂單要求及時(shí)打撈。

揀貨路徑規(guī)劃問題,不是簡(jiǎn)單最短路徑算法就能夠解決的問題,同一個(gè) SKU 可能會(huì)擺放在不同貨架上,因此只有確定任務(wù)單上所有 SKU 的貨架位置,才能進(jìn)一步進(jìn)行路徑規(guī)劃。上面所說情況比較復(fù)雜,但仍屬于傳統(tǒng)倉(cāng)儲(chǔ)管理的范疇。

此外,我們還有無人倉(cāng)調(diào)度管理方法。相比傳統(tǒng)的倉(cāng)儲(chǔ)調(diào)度,我們的規(guī)模更大,實(shí)施性也更好。

由于我們公司的項(xiàng)目往往會(huì)分解成很多子項(xiàng)目,因此我們需要的人才是綜合能力比較強(qiáng)、思維比較活躍,能迅速深入理解業(yè)務(wù)的本質(zhì),并在數(shù)據(jù)挖掘、運(yùn)籌方面有一定想法的人。

另外,我總結(jié)了杉數(shù)科技的一些大項(xiàng)目所存在的共同點(diǎn)

第一個(gè)是基于項(xiàng)目的預(yù)測(cè)引擎,這是很多項(xiàng)目的前置工作,我們需要識(shí)別、挖掘數(shù)據(jù)的特征,以防止過擬合,并對(duì)突發(fā)事件進(jìn)行比較精準(zhǔn)的預(yù)測(cè)等。而這些數(shù)據(jù)的維度比較高,往往存在缺失、噪音、原始信息的表達(dá)比較困難等常見問題。

第二個(gè)是全渠道的預(yù)測(cè)補(bǔ)貨方案,其基于庫(kù)存管理對(duì)當(dāng)前的補(bǔ)貨進(jìn)行優(yōu)化,從而提高庫(kù)存管理的準(zhǔn)確度。

第三個(gè)是數(shù)據(jù)驅(qū)動(dòng)的定價(jià)問題。我們會(huì)基于企業(yè)自有數(shù)據(jù)特有的類型和特點(diǎn),結(jié)合外源數(shù)據(jù),根據(jù)不同的定價(jià)驅(qū)動(dòng)因素,來自動(dòng)輸入定價(jià)、利潤(rùn)等關(guān)鍵指標(biāo)的變動(dòng)趨勢(shì),此外還會(huì)結(jié)合不同目標(biāo)靈活地調(diào)整定價(jià)策略,來解決動(dòng)態(tài)定價(jià)、促銷定價(jià)、大客戶定價(jià)、捆綁定價(jià)等問題。

除此之外,對(duì)于多維度、多場(chǎng)景的智能配送物流運(yùn)輸?shù)囊?guī)劃解決方案,在考慮多種業(yè)務(wù)的約束條件的同時(shí),還要統(tǒng)籌規(guī)劃所有的資源,這是非常難的。此外,我們還需要在保證服務(wù)水平的前提下,盡可能減少運(yùn)輸成本,并提升資源利用率,提高物流響應(yīng)速度。這個(gè)過程中,需要比較強(qiáng)的算法來支持。而我們的車輛調(diào)度優(yōu)化算法能顯著提高運(yùn)輸效率,解決裝箱問題、資源匹配不合理、城市分區(qū)等現(xiàn)實(shí)中存在的業(yè)務(wù)約束問題,從而解放手工調(diào)度的人力成本。

在基于業(yè)務(wù)場(chǎng)景的選址方案方面,我們前面所舉的例子商超零售商業(yè)選址是基于全局的選址方案中的一種,我們會(huì)結(jié)合機(jī)器學(xué)習(xí)、深度學(xué)習(xí)以及運(yùn)籌規(guī)劃的模型,去賦予新零售、新餐飲下的企業(yè)挖掘商圈和商機(jī)的機(jī)會(huì),讓它們迅速科學(xué)地布局店鋪。此外我們還積累了很多城市數(shù)據(jù)等外源數(shù)據(jù),這些數(shù)據(jù)可以用來刻畫區(qū)域特點(diǎn)和激活商圈活力。

很多制造業(yè)也有相對(duì)應(yīng)地解決方案,例如基于業(yè)務(wù)的工業(yè)排程、生產(chǎn)周期排班方案以及用戶分析、風(fēng)險(xiǎn)控制、產(chǎn)品設(shè)計(jì)等等。

除了這些項(xiàng)目產(chǎn)品,我們從中將項(xiàng)目經(jīng)驗(yàn)沉淀下來,轉(zhuǎn)化為杉數(shù)的無形資產(chǎn),打造杉數(shù)智慧鏈。例如:

我們第一個(gè)產(chǎn)品 PonyPlus,也叫小馬駕駕,是一個(gè)運(yùn)輸優(yōu)化系統(tǒng),通過特有的車輛調(diào)度優(yōu)化算法,在考慮時(shí)間窗、門店優(yōu)先級(jí)等多種業(yè)務(wù)約束條件的同時(shí),統(tǒng)籌規(guī)劃所有資源,確保滿足客戶的服務(wù)要求,提供配送的最優(yōu)路徑、裝卸時(shí)間窗、司機(jī)排班以及箱內(nèi)裝載等等業(yè)務(wù)的智能優(yōu)化解決方案,進(jìn)而減少企業(yè)的用車數(shù)量、行駛距離和配送時(shí)間,從而降低總體運(yùn)輸成本。目前,小馬駕駕還支持多種提送模式,涵蓋多種車輛的限行約束政策,支持運(yùn)輸途中路線的實(shí)時(shí)再優(yōu)化,實(shí)用性很廣。

第二個(gè)是 StockGo,它是一個(gè)庫(kù)存管理系統(tǒng),也是我們從項(xiàng)目中沉淀下來的一個(gè)比較好的產(chǎn)品??紤]全維度的數(shù)據(jù),比如流量、轉(zhuǎn)化數(shù)據(jù)、庫(kù)存數(shù)據(jù)、采購(gòu)數(shù)據(jù)、訂單數(shù)據(jù)、促銷數(shù)據(jù)等等,基本會(huì)考慮到商業(yè)場(chǎng)景中的所有落地信息,并采取多種預(yù)測(cè)算法,比如時(shí)間序列分析、機(jī)器學(xué)習(xí)預(yù)測(cè)、循環(huán)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)等等,能夠預(yù)測(cè)企業(yè)真實(shí)的動(dòng)態(tài)銷量,從而針對(duì)不同的流量渠道和復(fù)雜的業(yè)務(wù)場(chǎng)景來提出智能、精準(zhǔn)的庫(kù)存決策建議。

此外,我們還有一些實(shí)時(shí)定價(jià)系統(tǒng)。

這是我們公司之前合作過以及現(xiàn)在依舊保持合作的大型企業(yè)。創(chuàng)業(yè)兩年以來,杉數(shù)已積累了來自多個(gè)國(guó)內(nèi)行業(yè)的標(biāo)桿企業(yè)背書。

杉數(shù)科技趙珂珍:大數(shù)據(jù)分析工程師的求職分享—從大廠到初創(chuàng)企業(yè)的決策之路 | AI 研習(xí)社職播間第 5 期

下面是公司對(duì)員工提供的福利:

杉數(shù)科技趙珂珍:大數(shù)據(jù)分析工程師的求職分享—從大廠到初創(chuàng)企業(yè)的決策之路 | AI 研習(xí)社職播間第 5 期

下面是我們公司正在招聘的一些崗位:

杉數(shù)科技趙珂珍:大數(shù)據(jù)分析工程師的求職分享—從大廠到初創(chuàng)企業(yè)的決策之路 | AI 研習(xí)社職播間第 5 期

其中算法工程師分為運(yùn)籌優(yōu)化和機(jī)器學(xué)習(xí)兩個(gè)方向,今天我們分享的涉及大數(shù)據(jù)層面的基本上屬于機(jī)器學(xué)習(xí)這個(gè)方向。另外一些開發(fā)崗位,我們也有一些人才需求的缺口。

大家可以通過我們的公眾號(hào)了解更多相關(guān)信息,另外,通過郵箱 job@shanshu.ai 可投遞簡(jiǎn)歷。

杉數(shù)科技趙珂珍:大數(shù)據(jù)分析工程師的求職分享—從大廠到初創(chuàng)企業(yè)的決策之路 | AI 研習(xí)社職播間第 5 期

大家有問題也可以整理好發(fā)到我的郵箱 kezhen@shanshu.ai,我都會(huì)為大家解答。

趙珂珍老師分享結(jié)束后還對(duì)同學(xué)們提出的問題進(jìn)行了回答,大家可以移步社區(qū)(http://ai.yanxishe.com/page/questionDetail/9077)進(jìn)行詳細(xì)了解。

以上就是本期嘉賓的全部分享內(nèi)容。更多公開課視頻請(qǐng)到雷鋒網(wǎng) AI 研習(xí)社社區(qū)觀看。關(guān)注微信公眾號(hào):AI 研習(xí)社(okweiwu),可獲取最新公開課直播時(shí)間預(yù)告。

問答部分:

1. 請(qǐng)問招應(yīng)屆生嗎?

招應(yīng)屆生。雖然我們的招聘要求上寫著要求 2 年以上工作經(jīng)驗(yàn),但我們也鼓勵(lì)碩士、博士應(yīng)屆生加入,我們這邊也有很多員工本科階段過來實(shí)習(xí),最后留在公司。我們實(shí)習(xí)崗位,比正式員工要求也低一些?;谖业那舐毥?jīng)驗(yàn),我建議大家嘗試找一些實(shí)習(xí),因?yàn)閷?shí)習(xí)能讓你了解到這個(gè)行業(yè)大概做什么內(nèi)容,并且有機(jī)會(huì)接觸到工業(yè)界的大數(shù)據(jù),這些都會(huì)對(duì)正式求職加分不少。

2. 老師在斯坦福讀的什么專業(yè)?

我讀的是環(huán)境流體力學(xué)。

3. 請(qǐng)問工業(yè)界積存的原始數(shù)據(jù)來源收集方法。

這個(gè)要結(jié)合工業(yè)界的具體場(chǎng)景來說,目前一些數(shù)據(jù)部分來自于爬蟲,所以公司也會(huì)有一個(gè)跟爬蟲相關(guān)的崗位。

4. 數(shù)據(jù)分析實(shí)習(xí)職位只會(huì) SQL 和 Python 能申請(qǐng)嗎,還需要其他的技能嗎?我是純理工生,老師講的業(yè)務(wù)不太懂。

如果你會(huì) SQL 和 Python,有很多加分,但也要求較強(qiáng)的 Excel 技能,因?yàn)樵诠ぷ髦行枰獙?shù)據(jù)調(diào)到 Excel 中進(jìn)行數(shù)據(jù)維度的處理。另外,業(yè)務(wù)方面的知識(shí),對(duì)現(xiàn)在掌握多少?zèng)]有太大要求,但是你在具體工業(yè)場(chǎng)景中要有對(duì)業(yè)務(wù)的理解和學(xué)習(xí)能力,如果有必要的話,可以到業(yè)務(wù)一線去實(shí)習(xí)一段時(shí)間。

現(xiàn)在很多大公司都有這類崗位的培訓(xùn)機(jī)制。大家掌握一些技能就可以大膽去找工作,并在工作中不斷進(jìn)行業(yè)務(wù)層面的積累和沉淀。

5. 數(shù)據(jù)怎么來的?

很多工業(yè)數(shù)據(jù)都是自己建立數(shù)據(jù)庫(kù),再進(jìn)行不斷維護(hù)更新。現(xiàn)在之所以說工業(yè)界處于擴(kuò)寬的階段,就是因?yàn)楹芏鄶?shù)據(jù)不是那么完備,在維護(hù)上還有很多缺口,處理的任務(wù)會(huì)非常繁重。

而互聯(lián)網(wǎng)上的數(shù)據(jù),需要使用數(shù)據(jù)搜索能力,使用爬蟲技術(shù)來獲得外部數(shù)據(jù)源。大型互聯(lián)網(wǎng)公司相關(guān)崗位的工作,會(huì)基于內(nèi)部的大數(shù)據(jù)平臺(tái)取數(shù),并基于 spark 這樣的平臺(tái)存儲(chǔ)數(shù)據(jù),按照具體場(chǎng)景取數(shù)使用。

6.CS229 是啥?

CS229 是斯坦福的一門機(jī)器學(xué)習(xí)課程,非常有名,其涵蓋了傳統(tǒng)機(jī)器學(xué)習(xí)的大多數(shù)內(nèi)容。大家可以搜索一下課程課號(hào),網(wǎng)上有詳細(xì)的介紹,公開學(xué)習(xí)平臺(tái)都有這些課程,但可能有一些刪減,大家可以參考一下我提供的資料(http://sendanywhe.re/900QEJJZ)。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

杉數(shù)科技趙珂珍:大數(shù)據(jù)分析工程師的求職分享—從大廠到初創(chuàng)企業(yè)的決策之路 | AI 研習(xí)社職播間第 5 期

分享:
相關(guān)文章
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說