AWS Well-Architected Framework 的六大支柱是什么？

Operational Excellence、Security、Reliability、Performance Efficiency、成本优化和 Sustainability。Sustainability 支柱于 2021 年加入，用以涵盖云上工作负载的环境影响。

AWS Region 与 Availability Zone 的区别是什么？

Region 是一个地理区域（比如位于巴黎的 eu-west-3）。每个 Region 包含多个 Availability Zone（AZ），每个 AZ 都是物理上独立的数据中心，拥有独立的电力、制冷和网络。

什么时候选 EC2，什么时候选 AWS Lambda？

对于长时间运行、有状态服务、自定义运行时和负载可预测的场景选 EC2。对于短时、事件驱动、只想为执行时间付费且能接受 15 分钟超时的工作负载选 Lambda。

AWS 比独立服务器或 VPS 更贵吗？

对于稳定、可预测的负载，独立服务器或 VPS 通常更便宜。当你需要弹性扩缩容、多区域部署，或者需要 RDS、DynamoDB 这类托管服务（否则要自己搭建运维）时，AWS 在成本上反而更划算。

主页 » 博客 » 什么是 AWS 架构？云设计与基础设施完整指南

什么是 AWS 架构？云设计与基础设施完整指南

2025年11月7日
23:35
作者： Adrien Roche
更新于 2026年5月20日
网络

快速回答

AWS 架构是 Amazon Web Services 提供的一整套设计原则、服务和基础设施模式，用于在云上构建可扩展、可靠且安全的应用。其核心是 AWS Well-Architected Framework（六大支柱）、30+ 个区域和 100+ 个可用区，以及覆盖计算（EC2、Lambda）、存储（S3、EBS）、网络（VPC、CloudFront）和数据库（RDS、DynamoDB）的 200+ 项服务。

要点速览

AWS Well-Architected Framework 共有 6 大支柱：运营卓越、安全、可靠性、性能效率、成本优化和可持续性。
Region 是相互独立的地理区域；Availability Zone 则是同一个 Region 内相互隔离的数据中心。
计算类服务涵盖 EC2（虚拟机）、Lambda（Serverless）、ECS/EKS（容器）以及 Fargate（Serverless 容器）。
始终按照故障容忍来设计：用多 AZ 实现高可用，用多 Region 做灾备，用自动扩缩容应对负载。
默认就要采用 IAM 最小权限、VPC 私有子网以及 KMS 加密。

引言

Amazon Web Services（AWS）是全球领先的云计算平台，服务于从初创公司到《财富》500 强企业在内的数百万家组织。理解 AWS 架构对任何设计可扩展、可靠且安全云解决方案的人来说都至关重要。它涵盖了一整套设计原则、服务集成模式和基础设施组织策略，让组织能够在云上构建世界级应用。

这份完整指南讲解了 AWS 架构的基础、核心服务类别、架构最佳实践以及真实世界的实现模式。无论你是刚踏入云端，还是在为企业级方案做架构设计，这份指南都将为你提供做出明智架构决策、构建稳健 AWS 部署所需的知识。

什么是 AWS 架构？

定义

AWS 架构指的是使用 Amazon Web Services 设计和组织云基础设施的方式。它涵盖如何选择服务、如何集成、组件之间数据如何流动，以及系统如何扩展、性能与安全。

高效的 AWS 架构在多个相互竞争的需求之间取得平衡:

Performance: Meeting application responsiveness requirements
可扩展性：在不重新设计架构的前提下应对业务增长
Reliability: Maintaining availability despite failures
Security: Protecting data and applications from unauthorized access
成本效率：在不牺牲需求的前提下优化开支
Operational Excellence: Enabling efficient management and monitoring

与需要固定容量规划的传统本地基础设施不同,AWS 架构利用云的弹性和按需付费机制,使基础设施精确匹配应用需求。

核心架构原则

1.面向故障的设计

云系统不可避免地会出现组件故障。高效的架构假定故障会发生,并以优雅降级的方式进行设计:

冗余：将工作负载分布到多个可用区，确保任何单点故障都无法导致整个系统瘫痪。

Health Checks: Implement monitoring detecting failed components, automatically routing traffic away from unhealthy instances.

Resilience: Design applications tolerating temporary unavailability of dependent services.

数据备份：在地理上分布的多个位置保存多份数据副本。

2.松耦合

紧耦合的系统在单个组件故障时即告失败。通过异步通信实现的松耦合可确保故障保持局部化:

Message Queues: Decouple services using SQS or SNS
事件驱动架构: 服务对事件作出响应，而不是依赖直接调用
API Contracts: Define clear interfaces enabling service independence
微服务：将单体系统拆分为可独立部署的服务

3. 弹性与自动扩缩

云的核心优势在于弹性资源分配——高峰时增加容量,低谷时移除容量:

Auto-Scaling Groups: Automatically adjust instance counts based on demand
负载均衡：在多个实例之间分发流量
数据库扩展: Use read replicas and sharding for data tier expansion
无服务器服务：无需容量规划即可自动扩展

4. 并行思维

多线程、分布式处理可加速工作负载:

分布式计算：在多台机器上并行处理大型数据集
并发处理：同时处理多个请求
Data Parallelism: Process different data portions simultaneously
Pipeline Parallelism: Process different stages simultaneously

按类别划分的核心 AWS 服务

计算服务

EC2 (Elastic Compute Cloud): 提供细粒度控制和配置灵活性的虚拟机。

Lambda: 无服务器函数,无需管理服务器即可执行代码,只为执行时间付费。

ECS (Elastic Container Service): 简化应用部署的容器编排。

Auto Scaling: 根据需求和指标自动调整资源。

存储服务

S3 (Simple Storage Service): 高可用的对象存储,适合几乎无限的数据量。

EBS (Elastic Block Store): 挂载到 EC2 实例的块存储卷。

EFS (Elastic File System): 支持并发访问的可扩展网络文件系统。

Glacier: 检索频率极低的长期归档存储。

数据库服务

RDS (Relational Database Service): Managed relational databases (MySQL, PostgreSQL, Oracle, SQL Server).

DynamoDB: 面向不可预测工作负载的全托管 NoSQL 数据库。

ElastiCache: 提升应用性能的内存缓存。

Redshift: 面向分析型负载的数据仓库。

网络服务

VPC (Virtual Private Cloud): 具备完全控制权的隔离网络环境。

ELB (Elastic Load Balancer): 在多个目标之间分配流量。

Route 53: 具有路由策略和健康检查的 DNS 服务。

CloudFront: 在全球范围内分发内容的内容分发网络 (CDN)。

安全与管理

IAM (Identity and Access Management): 控制用户对 AWS 资源的访问。

KMS (Key Management Service): 加密密钥管理。

Secrets Manager: 存储并轮换敏感信息。

CloudTrail: 审计与合规日志记录。

应用服务

SNS (Simple Notification Service): 发布-订阅消息。

SQS (Simple Queue Service): 用于异步处理的消息队列。

Step Functions: 编排复杂的工作流。

API Gateway: 创建、发布和管理 API。

Well-Architected Framework

AWS 定义了指导云架构设计的五大支柱：

1. 运营卓越

设计可实现有效运营管理的系统:

代码化基础设施以确保一致性和可重复性
可见性的监控与日志记录
定期回顾以发现改进点
常见操作的文档化流程

2. 安全

在整个生命周期中保护数据和系统:

静态和传输中的加密
使用安全组进行网络隔离
基于身份的访问控制
对未授权活动的持续监控

3. 可靠性

设计能够在挑战中保持功能的系统:

跨区域部署以实现地理弹性
透明恢复的自动故障转移
保留部分功能的优雅降级
定期测试灾难恢复流程

4. 性能效率

优化资源利用率和响应能力:

根据工作负载需求对实例进行合理调整
通过缓存降低延迟
用于地理分发的内容分发网络
用于非阻塞操作的异步处理

5. 成本优化

在满足需求的同时尽量减少支出:

面向可预测工作负载的预留实例
面向容错型灵活工作负载的 Spot 实例
通过合理调整大小消除未使用的容量
对异常支出的监控与告警

常见架构模式

三层架构

将关注点分离到不同的层中:

Presentation Tier: Web servers (EC2, ALB) delivering user interfaces

Application Tier: Application servers (EC2, Lambda) implementing business logic

Data Tier: Databases (RDS, DynamoDB) persisting information

优势:可扩展性、关注点分离、独立分层优化

微服务架构

将单体应用分解为独立、可部署的服务:

Service Characteristics:

单一职责
独立部署
技术无关
松耦合通信

支持微服务的 AWS 服务：

用于容器编排的 ECS/EKS
用于无服务器函数的 Lambda
用于服务交互的 API Gateway
用于异步通信的 SNS/SQS

事件驱动架构

应用对事件做出响应,而不是轮询:

Flow: Event Production → Event Stream (SNS/SQS) → Event Consumers

Advantages: Loose coupling, asynchronous processing, scalability

无服务器架构

彻底消除服务器管理:

Compute: Lambda for functions
Storage: S3 for object storage
Database: DynamoDB for data persistence
APIs: API Gateway for HTTP endpoints

扩展与弹性

垂直扩展

提升单个实例的能力(更大的 CPU、内存):

优点:简单,保留单一实例
缺点:需要停机、硬件限制、成本效率低
用例:临时缓解、小型工作负载

水平扩展

增加实例数量以分配负载:

优点:无停机、理论上无限扩展、成本高效
缺点:复杂、需无状态设计
用例:增长型工作负载、高可用需求

自动扩缩实现

Metrics-Based Scaling: Adjust capacity based on CloudWatch metrics (CPU, memory, network)

Schedule-Based Scaling: Anticipate predictable demand changes

Target Tracking: Maintain metric at desired level

数据库扩展

读副本：在多个实例之间分发读流量

分片：按键将数据在实例之间进行分区

DynamoDB：在设定的限制范围内自动扩缩

安全与合规架构

网络安全

VPC Design: Isolate resources in private subnets inaccessible from internet

Security Groups: Instance-level firewall controlling traffic

NACL：子网级别的防火墙，提供额外的安全防护层

VPN/Direct Connect: Encrypted private connections to AWS

数据安全

Encryption at Rest: KMS encryption for databases and storage

Encryption in Transit: TLS for all data movement

Access Control: IAM policies limiting data access

Data Classification: Different protection levels for different data sensitivity

合规

Regulatory Standards: AWS maintains compliance with HIPAA, PCI-DSS, SOC 2, etc.

Audit Trails: CloudTrail logs all API calls for compliance review

Encryption Keys: KMS enables encryption key management and rotation

Regular Assessments: Security audits and penetration testing

灾难恢复与业务连续性

恢复时间目标 (RTO)

系统在故障后必须以多快速度恢复。AWS 架构策略:

低 RTO：多区域 active-active 部署，故障切换即时完成
中等 RTO：通过定期快照实现快速恢复
高 RTO：可接受用于非关键系统

恢复点目标 (RPO)

可接受的最大数据丢失量。架构决策:

Near-Zero RPO: Synchronous replication to another region
Minutes RPO: Regular database snapshots
Hours RPO: Daily backups

备份策略

Automated Snapshots: Regular EBS snapshots stored in S3

跨区域复制：在多个区域之间自动复制数据

AWS Backup：跨服务的集中式备份管理

Point-in-Time Recovery: Restore databases to any previous point

成本优化策略

实例选择

Reserved Instances: 30-70% discount for committed capacity

Spot Instances: Up to 90% discount for fault-tolerant workloads

On-Demand: Pay-as-you-go for unpredictable workloads

Savings Plans: Flexible discount model

存储优化

S3 Tiering: Move infrequently accessed data to cheaper tiers

Lifecycle Policies: Automatically archive or delete old data

Compression: Reduce storage requirements

Deduplication: Eliminate redundant data

计算优化

Right-Sizing: Analyze actual utilization, adjust instance types

Reserved Instances: Commit to predictable workloads

Scheduled Scaling: Reduce capacity during low-demand periods

Reserved Capacity: Pre-purchase database capacity at discounts

为什么各类组织都选择 AWS 架构

全球各类组织选择 AWS,源于其根本性优势:

可扩展性：从初创发展到全球运营，不受基础设施限制

Reliability: 99.99% uptime SLAs backed by AWS infrastructure

Security: Enterprise-grade security compliance and certifications

全球覆盖：在全球 30 多个区域部署应用

Cost Efficiency: 按需付费;通过缩减规模来减少成本

Innovation: 持续的服务创新,无需自行托管

通过 RDP 与远程访问管理 AWS 基础设施

许多组织通过远程桌面连接和 SSH 管理 AWS 基础设施,尤其用于:

从远程位置管理 Web 控制台
基于 Windows 的控制中心上的管理工具
应用服务器管理
数据库管理界面
监控与告警仪表盘

专业的 AWS 基础设施管理

RDP.Monster 为 AWS 基础设施管理提供集成解决方案:

Windows 管理服务器

用于 AWS 控制台管理的远程访问
管理工具托管
监控仪表板服务器
集中式基础设施控制

面向 AWS 的 Linux/Unix 服务器

通过 SSH 进行命令行管理
Lambda 开发与测试
通过 shell 脚本实现基础设施自动化
API 网关托管

优化 AWS 运营的 VPS 解决方案

用于 AWS 管理工具的专用资源
用于远程访问的可靠连接
用于业务连续性的自动故障转移
与 AWS 区域匹配的全球服务器位置

通过 RDP.Monster 部署企业级基础设施，优化 AWS 架构管理

结语

AWS 架构是设计同时具备可扩展性、可靠性、安全性、高性能和成本效率的云应用与基础设施的艺术与科学。 Well-Architected Framework provides proven guidance; the diverse AWS service catalog enables virtually any design requirement.

高效的 AWS 架构需要理解服务能力、识别设计模式,并在相互竞争的优先事项之间做出明智的取舍。成功的组织通过监控、分析和实验持续完善其架构,在控制成本的同时充分发挥 AWS 的潜能。

随着云采用加速和架构日趋复杂,与同时了解 AWS 和企业运营需求的基础设施供应商合作变得越来越有价值。

Building enterprise AWS infrastructure requiring robust management and operational support? RDP.Monster provides integrated solutions for AWS infrastructure operations and management. Explore comprehensive AWS management infrastructure today.

常见问题

AWS Region 和 Availability Zone 有什么区别？

Region 是地理区域，其中包含多个相互隔离的数据中心（Availability Zone）。

为了高可用，要把工作负载部署在一个 Region 内的多个 AZ；为了灾备，则要跨多个 Region 部署。

我应该用 EC2 还是 Lambda？

对于流量不确定、事件驱动、需求又比较简单的工作负载，选 Lambda。

对于需要长时间运行、并且需要细粒度控制和自定义能力的服务，选 EC2。

怎么避免 AWS 账单意外失控？

用 AWS Budgets 设置告警、用 Trusted Advisor 获取建议、对可预测的负载购买预留实例（Reserved Instances），并定期复盘成本。

多区域部署最好怎么做？

灾备场景用 active-passive（按需切换）；高可用场景用 active-active（分布式处理）。

根据所选方案，对数据进行相应的同步。

如何按照 AWS 合规要求来设计架构？

查阅 AWS 合规文档、全面启用加密、保留审计日志、定期审视配置，并充分利用 AWS 提供的合规资源。

RDS 和 DynamoDB 有什么区别？

RDS 是关系型数据库（结构化数据、复杂查询）；DynamoDB 是 NoSQL（非结构化、查询简单、极致扩展能力）。

AWS 资源应该多久备份一次？

频率取决于 RPO。关键应用需要近乎实时的复制；非关键系统每日快照即可。

把现有应用迁到 AWS 容易吗？

AWS Database Migration Service、Application Discovery Service 和 Server Migration Service 都能帮助你完成迁移。

对于复杂应用，建议预留 3-6 个月的迁移周期。

Adrien Roche — 基础设施与主机托管编辑

系统工程师，拥有 10 年以上运维 Windows Server 和 Linux 集群的经验。Adrien 负责 rdp.monster 的基础设施文档，并撰写关于 RDP、VPS 托管、服务器管理、网络和隐私工具的指南。

网络