WordPress 跨雲災難復原技術說明文檔
展示 AWS 主服務(EKS、RDS)與 GCP 備援環境(Kubeadm、MySQL Replica)的整體架構
包含 Route 53 流量管理、VPN 連接及 Claude AI 智能監控整合
AWS 主從集群的詳細架構圖,涵蓋 VPC 網路設計、子網規劃、
安全群組、ALB 負載均衡器、Terraform 自動化部署及 GitHub CI/CD 流程
| 配置項目 | AWS RDS (Master) | GCP MySQL (Slave) |
|---|---|---|
| Server ID | 1 | 2 |
| Binlog 格式 | ROW | ROW |
| 讀寫模式 | Read/Write | Read-Only |
| 複製模式 | - | 單線程 + IDEMPOTENT |
| Binlog 保留 | 168 小時 (7 天) | - |
| 告警規則 | 觸發條件 | 嚴重等級 |
|---|---|---|
| InstanceDown | 實例離線超過 1 分鐘 | Critical |
| PodNotRunning | Pod 狀態非 Running | Warning |
| PodRestartedMoreThanTwice | Pod 重啟次數 > 2 | Warning |
| NoAvailableReplicas | Deployment 無可用副本 | Critical |
| HighCpuUsage | CPU 使用率 > 80% | Warning |
Pod 因記憶體不足被強制終止,AI 自動調整資源限制並重新部署
容器持續崩潰重啟,AI 診斷配置錯誤並自動修正
資源配額超出限制,AI 自動調整配置以符合配額要求
| 參數 | Phase 1 (IKE) | Phase 2 (IPSec) |
|---|---|---|
| 加密演算法 | AES-256-CBC | AES-256-GCM |
| 完整性 | SHA-256 | SHA-256 |
| DH 群組 | Group 14 (2048-bit) | Group 14 (PFS) |
| 生存時間 | 28800 秒 (8 小時) | |
模擬 AWS 主站完全故障情境,演示 Route53 健康檢查失敗後自動將流量切換至 GCP 備援站點,確保服務不中斷