崗位職責(zé):
1.負(fù)責(zé)自然語言處理領(lǐng)域數(shù)據(jù)抽取、模型建立、模型訓(xùn)練、模型優(yōu)化、算法評估;
2.負(fù)責(zé)管道泄漏關(guān)系數(shù)據(jù)庫及行業(yè)知識圖譜的建立;
3.負(fù)責(zé)管道泄漏文本信息挖掘和分類、語義理解、智能問答、信息提取等,并應(yīng)用于實際場景;
4.主要場景包括基礎(chǔ)信息文本處理、特征信息文本處理、預(yù)防措施及法律法規(guī)庫文本處理,負(fù)責(zé)算法模型的開發(fā)、訓(xùn)練和調(diào)優(yōu);
5.跟蹤自然語言處理領(lǐng)域前沿動態(tài),并應(yīng)用于管道泄漏文本數(shù)據(jù)挖掘分析產(chǎn)品;
6.推動自然語言處理算法在實際場景的性能優(yōu)化與落地;
7.解決產(chǎn)品實際應(yīng)用中出現(xiàn)的相關(guān)問題。
任職要求:
1.本科及以上學(xué)歷,計算機(jī)/電子信息/自動化/數(shù)學(xué)/數(shù)理統(tǒng)計等相關(guān)專業(yè);
2.熟練掌握NLP/文本分類與聚類/深度學(xué)習(xí)/數(shù)據(jù)挖掘至少一方面基本算法;
3.熟悉NLP開源庫/深度學(xué)習(xí)開源框架,熟悉Java/Python等編程語言,熟悉Linux環(huán)境;
4.熟悉自然語言處理領(lǐng)域的基本概念和問題,包括:分詞、詞性標(biāo)注、命名實體識別、語法分析、語言模型、文檔分類等;
5.對Transformer等最新神經(jīng)網(wǎng)絡(luò)架構(gòu)有一定了解;
6.對BERT,?XLNet等最新預(yù)訓(xùn)練框架有一定了解。