崗位職責(zé):1.對(duì)海量數(shù)據(jù)進(jìn)行分析,并利用算法挖掘分析數(shù)據(jù)之間的相互作用關(guān)系和聯(lián)系,發(fā)現(xiàn)潛在規(guī)律,建立機(jī)器學(xué)習(xí)算法并優(yōu)化;2.負(fù)責(zé)基于大數(shù)據(jù)技術(shù)的海量數(shù)據(jù)的自動(dòng)化分析和處理工作;3.負(fù)責(zé)公司數(shù)據(jù)分析及挖掘項(xiàng)目的實(shí)施;4.理解數(shù)據(jù)分析和挖掘的應(yīng)用場(chǎng)景,抽象為數(shù)據(jù)產(chǎn)品需求;5.研究數(shù)據(jù)挖掘或統(tǒng)計(jì)學(xué)習(xí)領(lǐng)域的前沿技術(shù),并用于實(shí)際問(wèn)題的改善和優(yōu)化;6.通過(guò)對(duì)數(shù)據(jù)的敏銳洞察,深入挖掘產(chǎn)品潛在價(jià)值和需求,進(jìn)而提供更有價(jià)值的服務(wù);7.協(xié)助架構(gòu)師從技術(shù)層面完成所有的技術(shù)實(shí)施架構(gòu),包括Hadoop/Spark等大數(shù)據(jù)平臺(tái)、數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)模型等;8.負(fù)責(zé)數(shù)據(jù)挖掘算法設(shè)計(jì)和程序編寫。職位要求:1.應(yīng)用數(shù)學(xué),統(tǒng)計(jì)學(xué),經(jīng)濟(jì)學(xué),計(jì)算機(jī)等相關(guān)專業(yè);2.3-5年數(shù)據(jù)相關(guān)經(jīng)驗(yàn),有大規(guī)模數(shù)據(jù)挖掘經(jīng)驗(yàn);3.在統(tǒng)計(jì)((statistics)或機(jī)器學(xué)習(xí)(machine?learning)、文本分類或聚類(text?classification?and?clustering)、海量數(shù)據(jù)處理、分布式計(jì)算(distributed?computing)等方面有一定的理論功底和實(shí)踐經(jīng)驗(yàn);4?.?精通數(shù)據(jù)分析模型,如統(tǒng)計(jì)學(xué)習(xí)理論,貝葉斯統(tǒng)計(jì),算法信息理論,歸納推理等;并且了解它們的強(qiáng)弱之處;5.熟悉大規(guī)模數(shù)據(jù)分析技術(shù),掌握分布式機(jī)器學(xué)習(xí)的相關(guān)技術(shù),熟悉數(shù)據(jù)挖掘相關(guān)算法,如決策樹(shù)-decision?tree,?SVM、聚類-clustering,邏輯回歸-logistic?regression,貝葉斯-Bayesian?等。6.?具有深度CNN(Deep?Convolutional?Neural?Network)和深度RNN?(Deep?Recursive?Neural?Network)應(yīng)用經(jīng)驗(yàn)者;7.熟練掌握參數(shù)服務(wù)器的工作原理,至少熟悉一種開(kāi)源分布式深度學(xué)習(xí)架構(gòu);8.熟悉Hadoop,?Storm,Spark等大數(shù)據(jù)技術(shù)以及適應(yīng)場(chǎng)景,?有大規(guī)模數(shù)據(jù)處理和日志處理經(jīng)驗(yàn)的優(yōu)先,了解NoSQL技術(shù),有實(shí)際使用者優(yōu)先;9.精通Python語(yǔ)言,熟悉SQL和ETL相關(guān)流程,熟悉Linux環(huán)境及常用命令;10.對(duì)數(shù)據(jù)敏感,有強(qiáng)烈的好奇心,喜歡研究數(shù)據(jù)并從數(shù)據(jù)中發(fā)現(xiàn)價(jià)值;11.勤奮踏實(shí)、工作積極主動(dòng)、有責(zé)任心,能夠在壓力下工作;12.具有很強(qiáng)的分析問(wèn)題和解決問(wèn)題的能力,攻關(guān)疑難問(wèn)題的強(qiáng)烈興趣,善于學(xué)習(xí),具有很強(qiáng)的團(tuán)隊(duì)管理能力和溝通能力。