崗位職責(zé):?1、負(fù)責(zé)大模型的探索規(guī)劃,包括技術(shù)研究、戰(zhàn)略規(guī)劃、方案設(shè)計等;
?2、負(fù)責(zé)大模型的行業(yè)信息調(diào)研、客戶需求分析對接,以完成模型自進(jìn)化為目標(biāo)設(shè)計整體架構(gòu),對自有方案和產(chǎn)品提出相應(yīng)改進(jìn)建議;
?3、負(fù)責(zé)大模型開發(fā)的全流程管理,包括相關(guān)屬性評測、海量訓(xùn)練數(shù)據(jù)準(zhǔn)備、產(chǎn)品化部署落地及項(xiàng)目成本控制等;
?4、結(jié)合業(yè)務(wù)領(lǐng)域真實(shí)問題,研究學(xué)習(xí)業(yè)內(nèi)領(lǐng)先思路,協(xié)助構(gòu)建行業(yè)領(lǐng)先的多模態(tài)核心能力。???
?
???任職資格:?
???1、計算機(jī)科學(xué)、人工智能、機(jī)器學(xué)習(xí)或相關(guān)領(lǐng)域,碩士及以上學(xué)歷;?
???2、具備優(yōu)秀的編程能力和經(jīng)驗(yàn),具有扎實(shí)的數(shù)據(jù)結(jié)構(gòu)和算法功底;?
???3、精通TensorFlow、PyTorch、DeepSpeed、Megatron、ColossalAI等深度學(xué)習(xí)框架,大模型訓(xùn)練、調(diào)優(yōu)經(jīng)驗(yàn);熟悉常見技術(shù)如SFT,P-tuning,?LoRA等;?
???4、閱讀過Transformers源碼,熟悉底層原理,熟悉FlashAttention等框架;?
???加分項(xiàng):?
???有較強(qiáng)的的中大型項(xiàng)目或個人開源項(xiàng)目經(jīng)驗(yàn);?
???有較強(qiáng)的鉆研精神和自驅(qū)力。