本書介紹了OpenShift核心概念和部署策略,包括多集群OpenShift容器平臺部署,以及按照最佳實踐管理OpenShift集群。本書還探討了部署工作負載到OpenShift的最佳實踐、通過最先進的概念監控OpenShift集群,并結合示例構建和部署Kubernetes來自動管理任務,配置OpenShift集群。
里克·拉考,Rick Rackow是一位致力于采用云和容器的資深專家。作為紅帽OpenShift Dedicated SRE團隊的站點可靠性工程師,Rick管理和維護著無數大規模的OpenShift集群,并通過開發和遵循本書的最佳實踐來確保這些集群的可靠性。
前言
第1章 概述
1.1 傳統運維團隊
1.2 站點可靠性工程如何提供幫助
1.3 OpenShift作為站點可靠性工程師的工具
1.4 SRE團隊的個人挑戰
第2章 安裝OpenShift
2.1 OKD、OCP和其他方式
2.2 使用OpenShift Local的本地集群
2.3 規劃集群規模
2.4 基本OpenShift安裝
2.5 總結
第3章 在OpenShift上運行工作負載
3.1 部署代碼
3.2 訪問已部署的服務
3.3 公開服務
3.4 使用TLS保護服務
3.5 總結
第4章 安全
4.1 集群訪問
4.2 基于角色的訪問控制
4.3 ServiceAccount
4.4 威脅建模
4.5 工作負載
4.6 總結
第5章 自動化構建
5.1 OpenShift鏡像構建
5.2 紅帽OpenShift Pipelines
5.3 總結
第6章 集群內監控棧
6.1 Cluster Monitoring Operator
6.2 指標可視化
6.3 總結
第7章 高級監控和可觀測性策略
7.1 面向服務的監控
7.2 日志
7.3 可視化
7.4 總結
第8章 自動化OpenShift集群運維
8.1 重復性運維任務
8.2 重復性運維任務自動化
8.3 集群配置
8.4 使用OpenShift GitOps管理集群配置
8.5 總結
第9章 開發自定義operator以實現集群運維自動化
9.1 Operator SDK
9.2 operator設計
9.3 引導operator
9.4 設置一個用于開發的CA目錄
9.5 設計自定義資源定義
9.6 安裝自定義資源定義
9.7 本地operator開發
9.8 調和函數
9.9 部署operator
9.10 創建和更新OpenShift資源
9.11 指定RBAC權限
9.12 將流量路由到operator
9.13 添加額外的控制器
9.14 更新資源狀態
9.15 總結
第10章 規模化運營OpenShift集群的實用模式
10.1 集群生命周期
10.2 集群配置
10.3 日志
10.4 監控
10.5 警報
10.6 自動化
10.7 值班
10.8 事故管理
10.9 訪問OpenShift集群
10.10 舞臺是你的