1. 審計目標:確認機房達到業務連續性與資訊安全要求;
2. 範圍:電力、制冷、網路、機櫃、伺服器配置、備援、CDN/DDoS策略;
3. 成果指標:PUE、年可用率、單點故障數量、恢復時間(RTO)與資料遺失(RPO);
4. 對象:物理機、VPS/虛擬化主機、負載平衡器、DNS與CDN設定;
5. 法規與合規:是否符合ISO27001、SOC2或當地個資保護要求;
6. 審計方法:文件審查、現場巡檢、滲透測試與網路流量分析。
1. 電力冗餘:確認是否為2N或N+1,UPS與發電機切換時間小於10秒;
2. PUE指標:理想PUE≤1.4,實務審計取樣若PUE>1.6需改善;
3. 溫濕度控制:目標溫度24±2°C,相對濕度40–60%;
4. 監測日誌:查閱近12個月電力事件,計算平均每年停電次數與總停機時間;
5. 案例數據:審計樣本顯示PUE=1.3、UPS切換成功率100%、年可用率99.995%(年停機約26分鐘)。
1. 連線拓撲:是否採用BGP多線與不同上游ISP以避免單點宕機;
2. 帶寬與SLA:核對每鏈路帶寬、雙向吞吐(例如10Gbps/線)與SLA延遲/丟包指標;
3. DDoS防護:是否有清洗中心、速率限制、黑洞與異常流量告警;
4. DNS與域名設計:是否啟用Anycast、二級DNS分散與TTL設定優化;
5. 範例監測表格(簡化):
| 項目 | 檢測值 | 指標/備註 |
|---|---|---|
| 上游連線 | 2 ISP (BGP) | 建議至少2家 |
| 峰值帶寬 | 10 Gbps | 含彈性擴容 |
| 平均丟包 | 0.02% | 目標<0.1% |
1. 範例主機:2U 雙路 Intel Xeon Silver 4214 ×2,內存64GB ECC;
2. 磁碟與RAID:4×1.92TB NVMe,RAID10,平均讀延遲<1ms;
3. 網卡與IO:雙10GbE SFP+,支持SR-IOV與VLAN分割;
4. 虛擬化:KVM/ESXi 分群,VM密度控制在每物理機≤20台以保穩定性;
5. 監控數據:CPU平均負載30%,磁碟IOPS 5k,95百分位響應<120ms。
1. CDN佈署:採Anycast節點就近回源,減少到源站的負載與延遲;
2. 清洗策略:自動化閥值(例如突增>2x正常流量)觸發流量轉發至清洗中心;
3. WAF與應用層防護:阻擋常見Web攻擊、API濫用與Bot行為;
4. 測試演練:定期模擬DDoS與故障切換演練,驗證RTO≤15分鐘為佳;
5. 日誌與取證:流量取樣與PCAP保存策略,便於攻擊溯源與法務協助。
1. 監控項目:主機、容器、網路、DNS、SSL到期、UPS與發電機狀態;
2. 告警級別:Info/Warning/Critical 分級並用Pager/SMS/Email通知;
3. SOP文件:包含切換路徑、工程聯絡清單與回覆模板;
4. 真实案例:2023年台北某電商在審計前為單線接入,月均丟包2.1%,部署BGP多線與清洗後丟包降至0.02%,月均可用率從99.85%提升至99.995%;
5. 改善成果:RTO從90分鐘降至12分鐘,年化損失顯著下降,審計建議被納入年度CAPEX。