崗位職責(zé):
1、負(fù)責(zé)數(shù)據(jù)采集產(chǎn)品與項(xiàng)目的研發(fā)工作,進(jìn)行互聯(lián)網(wǎng)相關(guān)數(shù)據(jù)的抓取和解析;
2、負(fù)責(zé)采集系統(tǒng)下載策略、調(diào)度算法的設(shè)計(jì)和開(kāi)發(fā),實(shí)現(xiàn)大規(guī)?;ヂ?lián)網(wǎng)數(shù)據(jù)的抓??;
3、提升網(wǎng)頁(yè)抓取的效率和質(zhì)量,實(shí)現(xiàn)信息精準(zhǔn)抽?。?br />4、對(duì)已有采集系統(tǒng)作出合理的優(yōu)化和改進(jìn)。
任職要求:
1、計(jì)算機(jī)相關(guān)專業(yè)碩士及以上學(xué)歷,軟件設(shè)計(jì)與開(kāi)發(fā)經(jīng)驗(yàn)實(shí)習(xí)經(jīng)驗(yàn);
2、掌握J(rèn)ava、Python等編程語(yǔ)言,熟悉網(wǎng)頁(yè)抓取原理及技術(shù)、正則表達(dá)式、xpath,能夠總結(jié)分析不同網(wǎng)站的結(jié)構(gòu)特點(diǎn)與規(guī)律,能夠從結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)中獲取信息;
3、有分布式爬蟲(chóng)架構(gòu)經(jīng)驗(yàn)者優(yōu)先;
4、善于學(xué)習(xí)新知識(shí),有強(qiáng)烈的責(zé)任心和良好的團(tuán)隊(duì)協(xié)作精神、較好的溝通能力。