崗位職責:
1.負責自然語言處理領域數(shù)據(jù)抽取、模型建立、模型訓練、模型優(yōu)化、算法評估;
2.負責管道泄漏關系數(shù)據(jù)庫及行業(yè)知識圖譜的建立;
3.負責管道泄漏文本信息挖掘和分類、語義理解、智能問答、信息提取等,并應用于實際場景;
4.主要場景包括基礎信息文本處理、特征信息文本處理、預防措施及法律法規(guī)庫文本處理,負責算法模型的開發(fā)、訓練和調(diào)優(yōu);
5.跟蹤自然語言處理領域前沿動態(tài),并應用于管道泄漏文本數(shù)據(jù)挖掘分析產(chǎn)品;
6.推動自然語言處理算法在實際場景的性能優(yōu)化與落地;
7.解決產(chǎn)品實際應用中出現(xiàn)的相關問題。
任職要求:
1.本科及以上學歷,計算機/電子信息/自動化/數(shù)學/數(shù)理統(tǒng)計等相關專業(yè);
2.熟練掌握NLP/文本分類與聚類/深度學習/數(shù)據(jù)挖掘至少一方面基本算法;
3.熟悉NLP開源庫/深度學習開源框架,熟悉Java/Python等編程語言,熟悉Linux環(huán)境;
4.熟悉自然語言處理領域的基本概念和問題,包括:分詞、詞性標注、命名實體識別、語法分析、語言模型、文檔分類等;
5.對Transformer等最新神經(jīng)網(wǎng)絡架構有一定了解;
6.對BERT,?XLNet等最新預訓練框架有一定了解。