*與數(shù)據(jù)開(kāi)發(fā)人員和管理員一起工作
*處理大數(shù)據(jù)分析和可視化
*分析企業(yè)解決方案
*獨(dú)立設(shè)計(jì)和開(kāi)發(fā)應(yīng)用
*與客戶/合作伙伴進(jìn)行數(shù)據(jù)建模,算法和開(kāi)發(fā)
*負(fù)責(zé)軟件的設(shè)計(jì)和子系統(tǒng)的開(kāi)發(fā)
工作要求:
*統(tǒng)計(jì)學(xué),計(jì)算機(jī)科學(xué)/工程學(xué),應(yīng)用數(shù)學(xué)學(xué)位/碩士/博士學(xué)位
*至少5年軟件開(kāi)發(fā)工作經(jīng)驗(yàn)
*至少2年大數(shù)據(jù)分析項(xiàng)目相關(guān)經(jīng)驗(yàn)
*精通RDBMS,如Oracle,PostgresQL,MySQL。熟練掌握R,Python,Java,C?++或SAS等語(yǔ)言的統(tǒng)計(jì)編程。
*在大數(shù)據(jù)平臺(tái)(如Pivotal,Cloudera,Horton?/?works,SAP?HANA或其他分布式系統(tǒng))的工作經(jīng)驗(yàn)
*數(shù)據(jù)清理,數(shù)據(jù)轉(zhuǎn)換,特征選擇
*使用R,Mahout,Madlib,HAWQ,GBDP,Tableau,Qlik或同等工具經(jīng)驗(yàn)
*能夠使用R,Mahout,?Madlib,SPSS,HAWQ,GBDP,Tableau,Qlik,Rapidiner進(jìn)行數(shù)據(jù)處理
*能夠進(jìn)行數(shù)據(jù)挖掘,統(tǒng)計(jì)分析和開(kāi)發(fā)合適的預(yù)測(cè)模型,
*有機(jī)器學(xué)習(xí)算法的知識(shí)(Algorithm?such?as?Decision?Trees,?Logistics?Regression,?K-Nearest?neighbours,?Naive?Bayesian,?Neural?Network,?Support?Ventor?Machine,?Ensemble?Models)