崗位職責(zé):
1、?負責(zé)業(yè)務(wù)上線,維護等日常運維工作,負責(zé)業(yè)務(wù)調(diào)優(yōu)及配合開發(fā)人員解決問題;
2、??評估系統(tǒng)性能和運行狀態(tài),建立量化指標,用數(shù)據(jù)指導(dǎo)優(yōu)化;
3、?負責(zé)監(jiān)控告警系統(tǒng)的設(shè)計和開發(fā),做到監(jiān)控可視化、故障自動化,7x24小時響應(yīng)故障處理,對平臺的運維質(zhì)量負責(zé);
4、?和研發(fā)團隊一起持續(xù)優(yōu)化線上系統(tǒng),并進行前瞻性容量規(guī)劃;
5、?設(shè)計和實現(xiàn)數(shù)據(jù)業(yè)務(wù)線監(jiān)控報警系統(tǒng)、自動構(gòu)建部署系統(tǒng)、集群部署系統(tǒng)等;
6、積累并規(guī)范化系統(tǒng)運維的***實踐并文檔化;
7、開發(fā)運維自動化工具,持續(xù)提升工作內(nèi)容的自動化比例;
8、技術(shù)文檔的整理和編寫。
崗位要求:
1、?本科及以上學(xué)歷,五年以上運維工作經(jīng)驗;
2、?熟悉互聯(lián)網(wǎng)公司常用的技術(shù),如Apache、Nginx、Mysql、memcache、TFS(分布式文件系統(tǒng)存儲)、LVS/Haproxy/Nginx、Docker等,進行高可用負載集群的架構(gòu)實現(xiàn);
3、?熟悉iptables、Linux內(nèi)核參數(shù)、MySQL主從復(fù)制、服務(wù)器間數(shù)據(jù)同步、調(diào)優(yōu)、系統(tǒng)安全、自動化部署;
4、?精通Linux操作系統(tǒng),熟悉shell或python等語言,熟悉自動化運維,擅長ansible/puppet/SaltStack其中至少一項工具;
5、?精通VMware虛擬化平臺、熟練使用docker進行運維部署工作;
6、?精通至少一種自動化測試框架和一種監(jiān)控系統(tǒng);
7、?熟悉Mysql/postgresql,能熟練掌握Mysql/postgresql的基本操作,能對Mysql/postgresql進行性能優(yōu)化,監(jiān)控Mysql/postgresql日常運行情況,熟悉主備、主從、安全機制;
8、?精通大型監(jiān)控架構(gòu)及原理,熟悉系統(tǒng)、應(yīng)用,數(shù)據(jù)庫等組件的監(jiān)控配置經(jīng)驗,熟悉后臺分布式系統(tǒng)的架構(gòu)及容災(zāi)設(shè)計;熟悉軟件發(fā)布,運維,優(yōu)化,對軟件全生命周期管理有一定認識;
9、?具備快速故障排錯的能力,具備一定的大型應(yīng)用系統(tǒng)的架構(gòu)優(yōu)化能力,優(yōu)秀的全局觀,對服務(wù)器硬件、操作系統(tǒng)、網(wǎng)絡(luò)、存儲、應(yīng)用中間件的工作原理等方面的技術(shù)有深入的理解和經(jīng)驗;
10、了解web各種安全漏洞者優(yōu)先,有大型分布式系統(tǒng)運維經(jīng)驗者優(yōu)先。