- 相關(guān)推薦
大神面試京東數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)崗位成功拿到offer
關(guān)于面京東,感觸只有一個(gè),虐的快吐血了。首先說京東分四個(gè)板塊,有京東商城、京東金融、京東剛收購(gòu)的拍拍和海外事業(yè)部。我這個(gè)職位主要是在金融部數(shù)據(jù)組做數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí),還有推薦系統(tǒng)。面試是在周一,本身也沒打算正經(jīng)去面試的,結(jié)果被虐了整整一個(gè)下午。。。。。。
實(shí)話實(shí)說,京東在整個(gè)互聯(lián)網(wǎng)行業(yè)里待遇基本是最低的,唯獨(dú)平臺(tái)好,每天有10億新的用戶行為數(shù)據(jù),對(duì)于DM而言,再好不過了。教主讓我多面試幾家,雖然某狗給13k,但是實(shí)在頂不住快被虐的吐血的壓力,某狗、優(yōu)x和樂x就在等等吧。
面試經(jīng)過,好痛苦。。。上來先自我介紹什么的就不說了,接著就是問推薦系統(tǒng)。還好我周末花了兩天的時(shí)間把項(xiàng)亮老師寫的《推薦系統(tǒng)實(shí)戰(zhàn)》過了一邊,于是我就開始扯架構(gòu),然后說了說相關(guān)算法,比如User協(xié)同過濾和Item協(xié)同過濾,還有如果遇到冷啟動(dòng)問題該如何處理神馬的。說完推薦,就問我編碼能力怎么樣,我說還行,又問sql怎么樣,我說以前做過購(gòu)物網(wǎng)站,一般的CRUD還湊合,于是就讓我寫一個(gè)sql的嵌套查詢來輸出一下在一段時(shí)間內(nèi)每個(gè)用戶最后一次的購(gòu)買的物品和購(gòu)買時(shí)間,恩。。。沒錯(cuò)。。。寫壞了。。。limit寫成了top,還好我機(jī)智,解釋說top是sqlserver的,mysql里用limit。最左面的面試官批評(píng)我說:“以后不能只寫那種簡(jiǎn)單的,稍微復(fù)雜一點(diǎn)的也要多寫寫,這張紙你拿回去吧,在你數(shù)據(jù)庫(kù)里運(yùn)行試試”,我心想“完了,這就回去了??!!!”不過還好沒有。。。接著最右面的面試官(加我qq的那個(gè)小leader)說:“你說你以前搞過算法競(jìng)賽,你能寫寫堆排序么?”我一愣,哎呀媽呀,只記得算法過程了。。。好吧,“那你就寫個(gè)堆排序吧”,于是面試官們就出去了。。。好忐忑啊,手機(jī)在旁邊就是不敢百度啊,硬著頭皮寫吧。。。過了一會(huì)兒,面試官們回來了,我基本也寫完了,然后他們就拿著來回看啊。。。我心里七上八下。。。。。。。不過還好,好像寫的沒什么問題。接著就問我數(shù)據(jù)分析處理怎么樣,我說跟著老師學(xué)過一點(diǎn)DM,參加過天貓大數(shù)據(jù)競(jìng)賽,可惜rank 1300+,相關(guān)工具用過Weka,大數(shù)據(jù)平臺(tái)hadoop正在自學(xué),我自學(xué)能力很強(qiáng)。他們表示無法證明我自學(xué)能力強(qiáng),還好我有準(zhǔn)備,這個(gè)專業(yè)top1在這里放著呢哈哈~。然后就是關(guān)于機(jī)器學(xué)習(xí)的問題了。問我會(huì)什么,我說分類聚類、分詞、關(guān)聯(lián)規(guī)則什么的。“那你分類都會(huì)什么”,我說k近鄰(當(dāng)時(shí)說成了k鄰近,其實(shí)我到現(xiàn)在都沒注意到底是k近鄰還是k鄰近,反正當(dāng)時(shí)面試官愣了一下,我還不如直接說knn)、樸素貝葉斯、SVM什么的,神經(jīng)一抽還很腦殘地把kmeans說進(jìn)去了,這明明是無監(jiān)督的聚類。。。然后問我他們有什么區(qū)別,我只說了NB是基于概率統(tǒng)計(jì)的算法模型,其他的是基于空間分割的。在SVM方面問的不是很深,萬幸沒有細(xì)問到四個(gè)kernal,要不我估計(jì)就好pass掉了。一個(gè)面試官說,你謝寫寫NB分類吧,好家伙。。。繼續(xù)硬著頭皮寫,寫完以后解釋了一下算法思想,先驗(yàn)概率和后驗(yàn)概率神馬的。最后還有什么不記得了,只記得最最最后,數(shù)據(jù)組高級(jí)項(xiàng)目組長(zhǎng)來了,然后又問了我畢業(yè)設(shè)計(jì)爬蟲是單線程的么,我說是單進(jìn)程多線程,還問了問余弦聚類特征向量是如何取的,我說用tf-idf,取前20詞,在比較時(shí)構(gòu)成40維的向量,還問堆排序?yàn)槭裁词莕logn的效率,這個(gè)我跪了。。。結(jié)束后,幾個(gè)在場(chǎng)的面試官都說可以,問我待遇有什么要求,我說我是應(yīng)屆生,而且我同學(xué)做的都是以開發(fā)為主,我也不太懂行情,你們看著給吧,于是。。。!!!!就是這么坑!!!!早知道我就多要點(diǎn)了,劉強(qiáng)東一定是把錢都給奶茶妹妹花了!!!不過后來leader說不滿意的話周三可以找人力的聊聊,結(jié)果我周二下午就去了,人力老大跟我笑著聊了一下午互聯(lián)網(wǎng)金融,聽得我是個(gè)暈頭轉(zhuǎn)向。鄰近下班的時(shí)候才說到正題,我重新提了要求,他說他們回去再商量一下,一周內(nèi)給回復(fù)。我心想,你要是不滿足我的新要求我就不去了呢!(開玩笑。。。畢竟JD也不小,我更看好這個(gè)平臺(tái)。)
總結(jié),計(jì)算機(jī)工程專業(yè)!=計(jì)算機(jī)專業(yè),要不是我們學(xué)校這么坑非要把我們忘軟件外包方向推從而提高就業(yè)率,很多有志騷年們還是有多種出路的。編碼不一定必須搞軟件開發(fā),數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、推薦、圖形圖像處理、云計(jì)算都是很好的方向,雖然本科教學(xué)過程中一般沒有這些,但是大量的課余時(shí)間都可以用來自學(xué)。一開始我是找王金龍博士了解DM這個(gè)方向,然后王導(dǎo)給我推薦了一些書以及相關(guān)的資料,不過后來王導(dǎo)忙著出國(guó)也不理我了。關(guān)于機(jī)器學(xué)習(xí),《集體編程智慧》、《統(tǒng)計(jì)學(xué)習(xí)方法》是非常好的入門書籍,我很推薦。其實(shí)這些入門書籍要是吃透了,尤其是《統(tǒng)計(jì)學(xué)習(xí)方法》里面的數(shù)學(xué)推導(dǎo)搞懂了,拿ML的offer很輕松。其他方面,數(shù)學(xué)很重要,除了高數(shù)線代概率,還有凸優(yōu)化,這個(gè)數(shù)學(xué)在本科階段基本沒有講,《矩陣論》也可以看看。網(wǎng)易斯坦福大學(xué)公開課、Coursea的ML課都非常好,講師都是Andrew Ng(敢不認(rèn)識(shí)他?)。數(shù)據(jù)挖掘方面,我也不是很深入,我只看過《數(shù)據(jù)挖掘?qū)д摗,浙江大學(xué)的那個(gè)數(shù)據(jù)挖掘視頻太老了。。。
其他的,編碼能力要很好,數(shù)據(jù)結(jié)構(gòu)算法一定要弄清,盡量都會(huì)寫;sql語句是硬功夫;多搞算法還是很有好處的。寫的很亂,各位將就看。
PS:為什么從開始關(guān)注JD股價(jià)開始,它就一直跌!!!
寫在后面。。剛剛財(cái)哥打電話。。說收到offer了!!財(cái)哥就是這么霸氣有木有!!!!
【大神面試京東數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)崗位成功拿到offer】相關(guān)文章:
面試經(jīng)驗(yàn)分享之機(jī)器學(xué)習(xí)、大數(shù)據(jù)問題03-20
數(shù)據(jù)挖掘論文07-16
數(shù)據(jù)挖掘論文07-15
數(shù)據(jù)挖掘論文(精品)07-29
面試拿到高分的技巧08-07
數(shù)據(jù)挖掘論文常用15篇07-29
成功面試的技巧和忠告08-20