发布于：2021-04-02更新于：2021-04-02

Docker 技术概述

在软件开发中，有一个经典的痛点：“程序在我电脑里运行得好好的，换个环境怎么就不行了？”这种因环境差异导致的不一致性，曾是开发与运维之间主要的摩擦点。

Docker 通过改变应用的构建、分发与运行方式，系统地解决了这一问题，并逐渐成为现代云计算与微服务架构的基础设施。

一、为什么我们需要 Docker

1. 解决分发与部署的一致性

Docker 的核心价值在于标准化应用的交付方式。在云原生时代，应用需要摆脱对具体硬件和环境配置的依赖，实现快速迁移与弹性扩展。

传统方式：需要在目标机器上分别安装软件、配置依赖、调整变量。一旦本地与生产环境在内核版本或系统库上存在细微差异，就极易引发错误。
Docker 方式：通过镜像将应用及其完整运行环境整体打包。镜像屏蔽了底层环境差异，部署体验接近“安装即运行”。

2. 容器与虚拟机的技术对比

在 Docker 普及之前，虚拟机（VM）是最常见的隔离方案。但虚拟机需要为每个实例运行一套完整的客户操作系统，在资源占用和启动效率上存在劣势。

特性	容器 (Docker)	虚拟机 (VM)
启动时间	秒级	分钟级
镜像体积	KB ~ MB 级别	GB 级别
系统资源损耗	极低 (约 0~5%)	较高 (约 5~15%)
单机支持规模	可运行上千个	通常为几十个

二、核心架构与基础概念

Docker 采用典型的客户端-服务器（C/S）架构，主要包含以下组件：

Docker Daemon (dockerd)：常驻后台的守护进程，负责管理镜像、容器、网络和存储卷。
Docker Client：用户交互入口，负责解析命令并将请求发送给 Daemon。
Docker Registry：镜像仓库，负责集中存储和分发镜像，如 Docker Hub 或私有仓库。

三个基础抽象：

Image (镜像)：容器运行的只读模板，包含代码、运行时依赖、系统库及配置。镜像构建后保持不可变。
Container (容器)：镜像的运行时实例。它在只读层之上叠加一个可写层，本质上是运行在受限环境中的进程。
Repository (仓库)：镜像仓库与逻辑集合，负责镜像的集中存储与分发。

三、底层原理：如何保证一致性？

为了确保应用在不同环境下行为一致，Docker 重点解决了文件系统与运行隔离两个维度的问题。

1. 文件系统一致性

Docker 镜像通过打包 rootfs（根文件系统），固化了应用运行所需的目录结构、配置和系统库。为了提高效率，它引入了 Union FS（联合文件系统）：

分层存储：镜像由多层只读层组成，每一层对应一次构建指令。
层共享：不同镜像可以复用相同的基础层，大幅减少磁盘占用。
写时复制 (CoW)：容器启动后，所有运行时的修改仅作用于最上层的独立可写层，不影响底层镜像。

2. 环境隔离与资源控制

Docker 依赖 Linux 内核的两项核心机制来确保容器互不干扰，从而保证执行效果的一致：

Namespace (视图隔离)：为进程提供隔离视图，包括 UTS（主机名）、PID（进程编号）、Network（网络栈）、Mount（挂载点）、*IPC- 及 User。这使容器内的进程认为自己拥有独立的操作系统资源。
Cgroups (资源限制)：用于对进程可使用的 CPU、内存、磁盘 IO 等资源进行限制和统计，防止单个容器过度占用资源导致宿主机或其他容器瘫痪。

四、演进：从单机到集群编排

随着应用规模的扩大，手动管理容器变得不可行，容器编排工具随之出现：

Docker Compose：面向单机环境的多容器编排工具，通过一个 YAML 文件定义完整的应用拓扑，适合本地开发测试。
Docker Swarm：Docker 官方提供的原生集群方案，适合中小规模场景，但在生产中的应用逐渐减少。
Kubernetes (K8s)：行业事实标准。通过 Pod、Service 等抽象，提供自动扩缩容、自愈和滚动更新等强大的集群调度能力。

结语

Docker 的成功并不在于引入了全新的底层技术，而在于它对 Linux 内核能力的合理组合与抽象，将复杂的隔离机制封装为一套易于使用的应用交付标准。

本文采用署名-非商业性使用-相同方式共享 4.0 国际许可协议，转载请注明出处。