數字化運維:IT運維架構的數字化轉型 嘉為科技 著
定 價:¥99
中 教 價:¥59.40 (6.00折)
庫 存 數: 9
這是一本能指導企業掌握數字化運維方法和構建數字化運維體系的著作。嘉為科技是運維領域的頭部企業,在運維領域深耕20余年,本書既有嘉為科技實戰經驗和理論研究成果的總結,又有他們對未來數字化運維解決方案的新思考。
本書以傳統運維管理體系(PPTR)為基座,在融合數字化轉型、ITIL4、DevOps、SRE以及敏捷精益思想的基礎上,首先提出了數字化運維管理體系 OPDM(Operation Process Data Measurement,平臺化工具、高速化流程、數據化驅動、體系化度量),然后詳細講解了數字化運維一體化平臺的建設路徑和方法。
通過閱讀本書,你將:*深入理解監體系,全鏈路端到端的監控告警、可觀測的服務感知體系。*深入理解管體系,以應用為中心的CMDB配置管理方法論和數據閉環體系。*深入理解控體系,通過自動化巡檢、安全基線比對、補丁更新、應用發布、資源自動交付、多云管理等場景理解企業生產如何降本提效。*深入理解服體系,從ITSM服務管理到ESM企業服務管理的邏輯演進。深入理解業務連續性保障能力建設,如災備演練、應急服務、重保和護網服務等。*深入理解營體系,運維度量指標體系到運營可視化展示的演進過程。*深入理解數體系,通過運維大數據分析與治理能力建設,理解運維數據治理。*深入理解智體系,探索智能運維體系的DAO模型,從數據管理、智能分析到場景服務,以及智能運維與生產場景的融合。
此外,書中給出的不同行業運維體系轉型的真實案例,也為讀者開展運維數字化轉型工作提供了難得的參考和借鑒。
適讀人群 :1.各種水平層次的專業運維人員。2.開發工程師、測試工程師、架構師等。本書認為運維能力是整體技術架構能力的體現,運維層面爆發的問題或故障,一定是整體技術架構中存在問題
(1)作者背景資深:嘉為科技是研發與運維一體化領域的頭部企業,先后獲得騰訊、紅杉資本、鐘鼎資本投資,騰訊藍鯨戰略合作伙伴。(2)作者經驗豐富:嘉為科技從事運維服務和研究20余年,為政府、金融、能源、交通、央國企、醫療、教育等行業的近千家客戶提供服務。(3)獨創方法體系:以傳統運維管理體系(PPTR)為基座,在融合數字化轉型、ITIL4、DevOps、SRE以及敏捷精益思想的基礎上,獨創數字化運維管理體系 OPDM(Operation Process Data Measurement)。(4)從零構建數字化運維一體化平臺:詳細講解數字化運維一體化平臺的8大要素和能力體系,及其建設路徑和方法。(5)13位運維專家力薦:工銀科技副總侯志榮、騰訊藍鯨創始人黨受輝等13位運維專家高度評價并推薦。
【為什么要寫這本書】數字化轉型已經成為大勢所趨,各行各業正朝著數字化方向轉型,利用數字化轉型方法論和前沿科學技術實現降本、提質、增效,從而提升競爭力。數字化轉型是一項長期工作,包含的要素非常豐富,如數字化轉型頂層設計、組織架構設計、領軍人的數字化思想轉型、前沿科技的應用、業務和技術的融合,真正做到流程打通、系統打通、數據打通和業務系統端到端聯動融合。如何實現業務與技術的融合?如何實現從業務到研發、運維、運營的全鏈路端到端數據閉環?傳統煙囪式的研發系統、運維系統、運營系統已經無法滿足當今數字化轉型的需要,各行各業的運維人員都急需一套適用于數字化時代的運維管理方法論和一個數字化運維一體化平臺。嘉為科技過去20年在數字化運維方面做了大量探索和嘗試,形成了一套數字化運維管理方法論和一個數字化運維一體化平臺,供大家學習和參考。
【讀者對象】各行業IT/科技部門管理人員,如CIO(首席信息官)、CTO(首席技術官)、總工程師、數據中心高管、運維總監、運維管理人員。各行業從事運維工作的人員,如運維工程師、運維架構師等。企業架構師、售前架構師、產品經理,以及運維管理體系的研究者和愛好者。
【主要內容】本書共16章內容,具體介紹如下。第1~3章介紹運維數字化轉型的現狀與挑戰,并提出數字化運維一體化架構,基于傳統的運維管理模型PPTR衍生出新一代數字化運維管理模型OPDM,同時介紹運維管理到工具體系的演進邏輯。第4~12章著重介紹數字化運維一體化平臺和八大能力中心的建設,包含可觀測能力、CMDB配置管理能力、自動化運維能力、敏捷ITSM能力、統一運維門戶能力、運維管理度量指標體系、運維可視化能力以及運維數據治理能力的建設。第13、14章介紹數字化運維一體化平臺的AIOps前沿技術和業務連續性保障能力。前沿技術包含AIOps的概念、能力建設、實踐場景;業務連續性保障能力包含IT應急管理能力、重保服務能力、護網服務能力三大板塊。第15、16章介紹運維管理體系轉型落地的最佳實踐,以及運維管理體系轉型案例,深度剖析了某商業銀行、某能源集團、某高端制造企業在數字化運維管理體系落地后的效果。
嘉為科技是基于騰訊藍鯨智云打造的IT研發運營一體化解決方案品牌,覆蓋DevOps、一體化運維、智能運營(AIOps)、多云資源管理、企業業務服務等多個IT管理領域。研運至簡,無限可為!嘉為藍鯨正在為政府、金融、能源、交通、制造、醫療等眾多行業大中型客戶,提供數字化轉型升級過程中的重要價值幫助客戶落地真正自主可控的研發運營一體化平臺,逐步實現自動化、數據化以及智能化的IT運營。
第1章 數字化時代的運維現狀及挑戰 1
1.1 國內外IT運維現狀分析 1
1.1.1 國外IT運維現狀分析 1
1.1.2 國內IT運維現狀分析 3
1.2 數字化運維的價值重塑 5
1.3 數字化運維模式的挑戰 7
第2章 數字化運維管理體系 9
2.1 傳統運維管理體系模型 9
2.1.1 人員 10
2.1.2 流程 17
2.1.3 技術 20
2.1.4 資源 24
2.2 數字化運維管理體系模型 25
2.2.1 平臺化工具 26
2.2.2 高速化流程 28
2.2.3 數據化驅動 31
2.2.4 體系化度量 34
2.3 數字化運維的建設思路 38
2.3.1 運維數字化轉型的建設 38
2.3.2 運維組織的建設 40
2.3.3 運維服務管理的建設 41
2.3.4 運維工具的建設 42
2.3.5 數字化運維場景的演進 43
第3章 從運維管理到工具體系 45
3.1 從運維管理到工具體系的建設邏輯 45
3.1.1 運維管理和工具體系的關聯分析 45
3.1.2 從運維管理到工具體系的拆解模型 47
3.1.3 運維工具體系的建設方法與原則 48
3.2 工具體系的平臺化架構 49
3.2.1 單工具領域 49
3.2.2 組合工具領域 51
3.2.3 平臺架構抽象 59
3.2.4 數據與AI加持 61
3.2.5 實踐案例 65
第4章 數字化運維一體化平臺 67
4.1 運維一體化平臺的建設背景 67
4.1.1 業務與技術發展趨勢 67
4.1.2 互聯網中臺建設浪潮 69
4.1.3 運維平臺現狀 70
4.2 運維一體化平臺的能力要素 71
4.3 運維一體化平臺的建設路徑 73
4.3.1 平臺建設的3個階段 73
4.3.2 數據化和智能化 75
4.4 運維一體化平臺的PaaS能力 76
4.4.1 PaaS的概念 76
4.4.2 PaaS的能力 76
4.4.3 iPaaS的能力 78
4.4.4 aPaaS的能力 79
第5章 可觀測能力建設 81
5.1 可觀測體系的發展 81
5.1.1 監控的發展歷程 81
5.1.2 可觀測理論 83
5.1.3 可觀測價值驅動 88
5.2 可觀測系統的建設方法 89
5.2.1 企業面臨的可觀測挑戰 89
5.2.2 可觀測系統的設計模式 90
5.2.3 可觀測系統的建設路徑 96
5.3 可觀測系統落地實踐 98
5.3.1 可觀測工具體系設計 98
5.3.2 指標監控 104
5.3.3 日志建設 114
5.3.4 鏈路追蹤 120
5.3.5 告警閉環 125
第6章 CMDB配置管理能力建設 137
6.1 傳統CMDB建設方法剖析 137
6.1.1 CMDB的發展史 137
6.1.2 CMDB建設的失敗原因 138
6.2 消費驅動的CMDB建設方法 139
6.2.1 CMDB的建設原則和實現方法 139
6.2.2 CMDB的建設目標與范圍 140
6.2.3 與CMDB建設相關的角色和組織 141
6.2.4 CMDB模型管理 142
6.2.5 CMDB數據維護 151
6.2.6 CMDB運營與度量 159
6.2.7 CMDB工具選型 160
第7章 自動化運維能力建設 168
7.1 企業自動化運維現狀與需求 168
7.1.1 企業自動化運維現狀 168
7.1.2 企業自動化運維需求 172
7.2 自動化運維平臺設計 175
7.2.1 自動化運維平臺的設計理念 175
7.2.2 自動化運維平臺的設計 176
7.2.3 常見的自動化運維場景設計 178
7.3 多云環境自動化運維 182
7.3.1 多云環境自動化運維的主要場景 182
7.3.2 多云環境自動化運維面臨的挑戰 183
7.3.3 多云環境自動化運維的要點 183
7.3.4 多云環境自動化運維的實踐 186
第8章 敏捷ITSM能力建設 190
8.1 建設背景 190
8.1.1 VUCA時代的挑戰 190
8.1.2 ITSM現狀和挑戰 191
8.2 關于敏捷 192
8.2.1 什么是敏捷 192
8.2.2 ITIL的發展 193
8.2.3 流程敏捷化的特性 194
8.2.4 敏捷流程打通組織的經脈 195
8.3 敏捷ITSM架構規劃 196
8.3.1 業務設計 196
8.3.2 工具架構 197
8.3.3 關鍵能力 198
8.4 敏捷ITSM建設路徑 199
第9章 統一運維門戶能力建設 200
9.1 建設背景 200
9.2 一站式與個性化 201
9.3 架構規劃 202
9.3.1 業務設計 202
9.3.2 工具架構 202
9.3.3 關鍵能力 203
9.4 實踐案例 205
第10章 運維管理度量指標體系設計 207
10.1 度量指標體系概述 207
10.1.1 基本概念 207
10.1.2 建設原則 208
10.1.3 建設的必要性 208
10.1.4 度量指標體系要素 209
10.2 度量指標體系的設計 213
10.2.1 運維價值度量指標 213
10.2.2 運維服務體系度量指標 215
10.2.3 運維業務管理度量指標 218
10.2.4 運維工具建設成效度量指標 219
第11章 運維可視化能力建設 231
11.1 建設背景 231
11.2 工程可視化要求 233
11.2.1 實用性和高顏值 233
11.2.2 低成本和高效率 233
11.3 工具架構規劃 233
11.3.1 業務設計 233
11.3.2 工具架構 233
11.3.3 關鍵能力 234
11.4 實踐案例 238
第12章 運維數據治理能力建設 242
12.1 運維數據治理的背景與收益 242
12.1.1 運維數據治理的背景 242
12.1.2 運維數據治理的收益 243
12.2 運維數據治理的方法和技術落地 244
12.2.1 運維數據治理的方法 244
12.2.2 運維數據分析場景 248
12.2.3 運維數據治理的技術落地 250
12.3 運維數據治理體系建設 256
12.3.1 運維數據治理的管理模式 256
12.3.2 運維數據治理的組織架構 257
12.3.3 運維數據治理的管理流程 257
12.3.4 運維數據治理的技術平臺 258
12.3.5 運維數據治理的質量管理 259
第13章 AIOps建設思路與場景應用 261
13.1 AIOps概述 261
13.1.1 AIOps的基本概念 261
13.1.2 AIOps的發展歷程 262
13.1.3 AIOps成熟度模型 263
13.2 AIOps能力建設 268
13.2.1 AIOps整體建設思路 268
13.2.2 AIOps平臺能力建設 269
13.2.3 AIOps場景能力建設 271
13.3 AIOps實踐場景 274
13.3.1 單指標異常檢測 274
13.3.2 日志聚類 277
13.3.3 日志異常檢測 280
13.3.4 根因分析 285
13.3.5 告警關聯分析 291
13.4 AIOps未來展望 294
第14章 業務連續性保障能力建設 296
14.1 IT應急管理能力建設 296
14.1.1 IT應急管理的相關理論 296
14.1.2 IT應急管理能力建設的挑戰 299
14.1.3 IT應急管理的業務架構設計 300
14.1.4 IT應急管理平臺設計 303
14.2 重保服務能力建設 308
14.2.1 重保專項活動的背景 308
14.2.2 重保組織與過程管控 309
14.3 護網服務能力建設 312
14.3.1 護網行動的背景 312
14.3.2 護網行動的主要工作及痛點分析 313
14.3.3 護網行動的應對方案 314
14.3.4 護網典型案例 315
第15章 運維管理體系轉型落地的最佳實踐 317
15.1 建設路徑 317
15.1.1 自動化階段 318
15.1.2 數據化階段 322
15.1.3 智能化階段 326
15.2 實踐方法論 329
15.2.1 設定目標 329
15.2.2 實施步驟 333
15.2.3 實施注意事項 339
第16章 運維管理體系轉型案例 344
16.1 某商業銀行研運一體化建設案例 344
16.1.1 運維轉型項目概述 344
16.1.2 繪制運維藍圖 345
16.1.3 權威的配置管理 347
16.1.4 統一的監控告警 348
16.1.5 運維能力服務化 348
16.2 某能源集團研運一體化建設案例 350
16.2.1 運維轉型項目概述 350
16.2.2 建設統一運維平臺 351
16.2.3 建設統一配置管理平臺 353
16.2.4 實現運維的自動化 353
16.3 某高端制造企業研運一體化建設案例 355
16.3.1 運維轉型項目概述 355
16.3.2 轉型項目的量化指標 356
16.3.3 轉型項目的建設內容 356