云计算课程总结

有关云计算课程CS3328的内容总结

🧭《云计算技术》知识图谱(Final 2025版)

一、云的内涵与特征(Lecture 01)

  • 云计算定义:按需、共享、可计量的虚拟化计算资源服务体系。
  • 五大核心特征(NIST)

    • 按需自助服务(On-Demand Self Service)
    • 广泛网络访问(Broad Network Access)
    • 资源池化(Resource Pooling)
    • 快速弹性(Rapid Elasticity)
    • 可计量服务(Measured Service)
  • 三大服务层次:IaaS / PaaS / SaaS。
  • 技术支撑:虚拟化、分布式计算、自动化与SOA。

二、云的模型与场景(Lecture 02)

  • 部署模型:公有云、私有云、混合云、社区云;
  • 典型应用:政务云、工业云、AI训练云;
  • 服务模式演进:从资源托管 → 平台编排 → 功能即服务 (FaaS);
  • 行业趋势:多云(multi-cloud)、边缘云(edge-cloud)、云网融合。

三、云分布式计算(Lecture 03)

  • MapReduce:Map(映射)+ Reduce(聚合)模型;
  • 适用场景:日志分析、文本挖掘、排序统计;
  • 性能长尾问题 (Tail Latency)

    • 由节点差异、网络波动等引起;
    • 优化策略:任务复制、渐进调度、异步聚合。

四、仓库级计算机 WSC(Lecture 04)

  • WSC 概念:以数据中心为计算单元的超大规模系统;
  • 组成:计算节点、通信网络、存储系统、基础设施;
  • PUE (Power Usage Effectiveness)
  • 优化方向:冷热通道隔离、液冷技术、可再生能源。

五、云中数据通信(Lecture 05)

  • 存储系统演化:DAS → NAS → SAN → 分布式文件系统;
  • 数据访问延迟层次:内存 < SSD < HDD;
  • 数据中心网络拓扑

    • 树形、Clos/Fat-Tree、Spine-Leaf;
  • 通信优化

    • RDMA(远程直接内存访问)
    • SDN(软件定义网络)实现流量编程。

六、虚拟化与容器(Lecture 06)

  • 虚拟化层级:ISA(指令集)→ ABI(应用二进制)→ API;
  • 虚拟机类型

    • System VM(KVM/Xen)
    • Process VM(JVM);
  • 三原则(Popek-Goldberg):等价性、资源控制、效率;
  • 容器化发展

    • Docker、Kubernetes 实现轻量级多租户;
    • Cloud Native理念推动微服务架构。

七、负载迁移与调度(Lecture 07)

  • 调度体系

    • 客户OS调度进程 → vCPU;
    • Hypervisor调度vCPU → pCPU;
  • 典型算法

    • Xen Credit Scheduler:Weight + Cap;
    • 支持抢占、公平与比例调度;
  • 虚拟机热迁移(Live Migration)

    • 预拷贝(Pre-copy)与后拷贝(Post-copy);
    • 平衡停机时间与迁移延迟。

八、软件定义一切 SDDC(Lecture 08)

  • 理念:计算、存储、网络全部虚拟化并统一管理;
  • 典型架构(VMware SDDC)

    • vSphere + NSX + Virtual SAN + vRealize;
  • 资源池化技术

    • Intel RSA、Google WSC;
  • 关键思想:基础设施即代码(IaC),软件重构硬件边界。

九、云计算中间件(Lecture 09)

  • 主要类型

    • RPC(远程过程调用)
    • MOM(消息队列)
    • ORB(对象代理)
    • 数据访问中间件;
  • 云原生编排系统

    • Borg → Omega → Kubernetes;
  • 调度体系结构

    • 单调度器 / 两级调度 / 共享状态调度;
  • 中间件作用

    • 连接分布式服务,提升伸缩性与容错性。

十、数据中心节能(Lecture 10)

  • 功耗模型
  • 节能策略

    • DVFS(动态电压与频率调节)
    • Race-to-Halt(竞速停机)
    • EARtH(能耗感知调度)
  • 能耗匀增性 (Energy-Proportionality)

    • 服务器功率与负载线性相关;
    • 目标是“负载越高能效越好”。

十一、资源利用优化(Lecture 11)

  • 资源墙问题

    • 内存墙(memory wall);
    • 暗硅效应(dark silicon);
  • 资源利用率困境

    • 后台开销、过度冗余;
    • LC(Latency-Critical) vs BE(Best-Effort)任务混布调度;
  • 优化方向

    • 超额供给(Over-Provisioning)超额认购(Over-Subscription)
    • UPS储能削峰;
    • 跨层功耗管理:DVFS + 任务迁移 + 能耗建模;
  • 关键目标:在性能、可靠性与能耗之间动态均衡。

十二、可靠性与可用性(Lecture 12)

(1) 可靠性模型

  • 故障率(Failure Rate)、平均无故障时间 MTBF;
  • 故障曲线呈“浴盆形”:早期失效 → 稳定期 → 老化期;
  • 可靠性墙:容错机制对并行加速比的上限约束。

(2) 冗余技术层次

类型说明
N无冗余
N+1单备份
2N双路冗余
2N+2高可用系统
aN/b按容量比例冗余

(3) 容灾备份体系

  • 冷备 (Cold):成本低,RTO高;
  • 温备 (Warm):DB保持同步;
  • 热备 (Hot):双活数据中心;
  • 多活 (Multi-Active):跨地域协同容灾;
  • CAP原理:一致性、可用性、分区容忍性三者不可兼得。

(4) 安全与能效攻击

  • 云安全多层防护:IaaS/PaaS/SaaS 层分级安全;
  • 性能视角的安全威胁

    • 恶意资源竞争;
    • 缓存干扰;
    • 功率攻击(Power Attack)与能效攻击(Efficiency Attack);
  • 典型攻击模型:

    • 超额功率操控 → UPS 失效;
    • 改变访问分布 → 缓存命中率骤降。

🌐 综合知识结构(逻辑主线)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
graph TD
A[云的内涵与模型] --> B[分布式计算]
B --> C[仓库级计算机]
C --> D[数据通信与存储]
D --> E[虚拟化与容器]
E --> F[负载迁移与调度]
F --> G[软件定义数据中心]
G --> H[中间件与资源调度]
H --> I[数据中心节能]
I --> J[资源利用优化]
J --> K[可靠性与可用性]

A --> A1[IaaS/PaaS/SaaS 模型]
B --> B1[MapReduce与Tail Latency]
C --> C1[PUE与能源效率]
D --> D1[SDN与分布式存储]
E --> E1[KVM/Docker/K8s虚拟化层次]
F --> F1[Live Migration与Xen调度]
G --> G1[SDDC与资源池化]
H --> H1[Kubernetes与调度算法]
I --> I1[DVFS与Race-to-Halt]
J --> J1[LC/BE任务调度与功耗墙]
K --> K1[冗余机制与多活灾备]
K --> K2[CAP定理与安全攻击]