工作職責(zé):?
1、負(fù)責(zé)大數(shù)據(jù)的數(shù)據(jù)采集與爬取、解析處理、入庫及備份等數(shù)據(jù)日常工作;
?2、負(fù)責(zé)數(shù)據(jù)的清洗、整理、整合及合并等工作;
??3、破解反爬機(jī)制,優(yōu)化爬蟲路由調(diào)度策略,同時(shí)負(fù)責(zé)反爬策略的設(shè)計(jì)及優(yōu)化;
?任職要求:
?1、計(jì)算機(jī)相關(guān)專業(yè),本科;
?2、有python研發(fā)經(jīng)驗(yàn);
?3、熟悉爬蟲原理,熟悉常見的反爬蟲技術(shù),有大型爬蟲項(xiàng)目開發(fā)經(jīng)驗(yàn)者優(yōu)先;?
4、掌握http協(xié)議,熟悉html、dom、xpath等常見的數(shù)據(jù)抽取技術(shù);
5、有大規(guī)模數(shù)據(jù)處理、數(shù)據(jù)挖掘、信息提取等經(jīng)驗(yàn)者優(yōu)先;
?6、承擔(dān)較大的工作壓力,具有良好的溝通和團(tuán)隊(duì)協(xié)作能力。