歡迎來到Linux教程網
Linux教程網
Linux教程網
Linux教程網
Linux教程網 >> Linux基礎 >> Linux教程 >> 如何成為一名合格的運維工程師——采訪資深運

如何成為一名合格的運維工程師——采訪資深運

日期:2017/2/27 16:06:19   编辑:Linux教程
采訪對象:高俊峰(南非螞蟻)
是一位資深系統管理員、系統架構師、DBA和技術顧問,對Linux和開源運維有些認識,曾出版Linux入門書籍《循序漸進Linux》和運維實戰書籍《高性能Linux服務器構建實戰》。今天有幸請到高總,和大家分享運維技術相關知識。

CU社區:
hi,高總,您好,很高興這次能采訪到您,運維版塊的網友應該比較熟悉您了,經常看到您在運維版塊發帖,回答網友的疑問,不過首先還是先給CU社區的網友打聲招呼,簡單介紹下自己嘛。

南非螞蟻:
大家好,我是高俊峰,在網上我經常以南非螞蟻這個昵稱跟大家交流,我主要從事系統管理,web架構設計,數據庫管理方面的工作,對Linux和開源運維 有些認識,曾出版Linux入門書籍《循序漸進Linux》和運維實戰書籍《高性能Linux服務器構建實戰》,今天很高興能在CU跟大家面對面的交流!

CU社區:
高總從事Linux運維已經多年,非常想知道在高總眼裡一名合格的運維工程師是如何定義的?

南非螞蟻:
一名合格的運維工程師,要具備兩個方面的能力,分別是:
個人素質方面:
1:溝通能力、團隊協作
2:主動性、執行力、精力旺盛、抗壓能力強
3:工作中膽大心細、不走尋常路
4:邏輯思維能力要強,為人謙和
5:有探索創新精神
技術方面:
1、開發能力,這個很重要,因為運維工具都需要自已開發,開發語言:c/c++(必備其中之一)、perl、python、php等、shell(awk,sed,expect….等),需要有過實際開發經驗,否則工作會非常痛苦。
2、應用方面需要了解:操作系統(主要是linux、bsd)、webserver相關 (nginx,apahe,php,lighttpd)、數據庫(mysql,oralce),還有類似系統優化,集群方面的東西。
3、網絡、安全,存儲等需要相當了解。
在這裡我把個人素質方面放到了第一位,是有一定含義的,因為從長遠的職業發展來說,個人素質方面決定了一個人的職業路線和發展前景。 技術方面雖然也是重點,但是就目前國內環境來講,技術當道還需要走很遠的路。

CU社區:
現在運維安全越來越緊迫,高總是如何帶領團隊做好運維監控和安全防范措施的?

南非螞蟻:
運維安全是個龐大的話題,涉及到網絡設備、安全設備、機房環境、主機系統、數據庫系統、應用系統等,對於這些軟、硬件的監控是保證運維安全的重要工 作,在運維監控方面,我們有一套安全管理流程和規章制度,在運維監控部署上,我們以nagios和cacti為基礎二次開發了一套功能完備的監控軟件,支 持集中式和分布式相結合的部署方式,在數據采集方面,可以支持分布式主動輪詢或被動接受的方式采集數據,我們的數據采集能夠支持秒級單位的采樣周期,最後 通過web界面展示物理拓撲結構,並通過物理拓撲結構提供全網的狀態信息,最後通過顏色變化表示出來,在軟件或者硬件出現故障時,可以迅速發現網絡故障點 的位置,從而保證運維安全。在故障或者風險出現時,我們有多樣化的響應與執行方式,常用的有聲音、短信、E-mail等多種方式進行告警提示,同時結合監 控系統強大的事件分析能力,迅速定位問題進而解決問題。
總而言之,對於企業安全運維管理來說,三分技術,七分管理。建立一套完善的安全管理規章制度是很有必要的。

CU社區:
在從事運維工作中,有沒有遇到過工作中的瓶頸?是否走過彎路?跟大家分享下經驗和教訓。

南非螞蟻:
彎路是肯定走過的,在我剛接手運維團隊的時候,無論是運維管理制度還是監控軟件等都處於不健全或者癱瘓的狀態,眾多的開源軟件無法實現因地制宜,有些應 用構架根本不適合我們的環境,但是仍然再用,進而導致應用系統性能低下,同時在應用出現故障時,監控軟件沒有統一接口,數據收集不准確,不完善,報警手段 不及時,導致故障很難及時發現,故障點很難精確定位,為此不知道鑽了多少次機房,在機房熬過了一個又一個不眠之夜。
經過多年的運維,我認為,要帶好一個運維團隊,必須要做好下面幾個方面工作。
1:定制一套適合自己環境的運維管理流程和制度,例如定期巡查制度,故障搶救制度,責任到人制度等。
2:有一個屬於自己的運維監控軟件,監控軟件很多,適合自己的才是最好的,不要盲目追求功能,如果無法滿足自己的需求,最好進行二次開發。
3:建立一個完備的監控軟件報警體系,軟、硬件出現故障要在第一時間發現,進而迅速解決問題,不然只能鑽機房熬夜了。

CU社區:
一個出色的運維,不僅僅需要了解掌握架構上所需要的技術知識,還需要在實際生產環境中寫出的適合業務的工具來提高效率,減輕我們自己的壓力。對於自動化運維這一塊,不知高總有什麼經驗跟大家分享嗎?對集群和架構這方面是否也有比較好的經驗分享給大家?

南非螞蟻:
充分利用現有的開源技術,結合自己的實際應用環境,進行監控軟件的二次開發和整合,是我們運維團隊的堅持的一個准則,在自動化運維方面,我們經常使用的 工具有自動安裝工具Kickstart、Cobbler等,配置管理類的有Puppet,目前正在將這些工具整合進我們開發的監控系統中,最終實現自動安 裝、自動配置、自動報警的聯動系統。
對於應用系統的集群構架,我們基本都是利用開源軟件進行整合實現的,我們使用比較多的構架有keepalived+lvs、 HAproxy+keepalived、Nginx+Keepalived等方案或者組合方案。其實這些方案的組合已經能夠滿足我們大部分的集群應用需 求。所以做二次開發的很少。

CU社區:
在招聘linux運維工程師的時候,你最關注的是他們的那些素質?在團隊成員技術等各方面日益成熟的時候,您又是如何留住這些人才的?

南非螞蟻:
對於運維人員,我更注重的不是技術本身,而是溝通能力,做事方式,當然技術也是衡量運維人員的標准,但是我認為僅占30%。現在做任何事情,溝通能力都 顯得非常重要,在一個運維團隊中,及時、准確的溝通,不但可以節省很多時間和成本, 而且也是留著人才的關鍵。
根據運維人員的不同性格,讓他們在擅長的領域發揮自己的優勢,這是我的一個原則,有些運維人員性格外向,喜歡溝通交流,那麼就讓他做相關的協調和管 理工作,而有些運維人員更喜歡細心的鑽研技術,那麼我們就給他提供學習空間,提供實踐環境,讓他成為這個領域的專家。

CU社區:
上次咱們的數據庫大會我們有個議題是35歲後的技術人生,都說技術人35歲是個坎,那麼對於您,對於IT運維這個職業,您對35歲之後的技術人生有什麼想法?

南非螞蟻:
對於技術人員來說,實時的轉型是很有必要的,但是不能一概而論,是否轉型,轉型的方向要結合自己的實際情況而定。
5年前你是個高級程序員,如果你醉心技術,而現實生活沒有太大壓力的話,那麼現在你可以繼續深造做個技術總監;如果你厭倦了程序員生活,並且自己的溝通和協調能力還可以,那麼你也可以嘗試轉型技術管理;如果你有很強的溝通能力,那麼轉型銷售領域也未嘗不可。
我認為35歲不是技術的坎,而是一個內心的坎,結合自己實際,結合公司的應用環境,實時而變,才能在技術的領域游刃有余。
Copyright © Linux教程網 All Rights Reserved