深度解析 Docker cp 命令：从入门、原理到安全最佳实践

Mttao 收录于类别 Docker

2025-06-22 2025-06-22 约 3082 字预计阅读 7 分钟

docker container cp 是一个我们日常与 Docker 交互时经常使用的命令，它看似简单，但我们对其内部实现原理及安全风险，却了解不深。本文将带你深入剖析这个命令，从基础用法到核心源码，再到安全漏洞和最佳实践，让你真正掌握它。

1. 基础用法

命令作用

docker container cp (或简写为 docker cp) 的主要作用是在 主机的文件系统 和 一个正在运行的容器的文件系统 之间双向复制文件或目录。

命令语法

它的语法与我们熟悉的 scp 或 cp 命令非常相似。

bash

# 从容器复制到主机
docker cp <containerId>:<path/in/container> <path/on/host>

# 从主机复制到容器
docker cp <path/on/host> <containerId>:<path/in/container>

示例:

bash

# 将容器 my-nginx 里的 /etc/nginx/nginx.conf 文件复制到主机的当前目录下
docker cp my-nginx:/etc/nginx/nginx.conf .

# 将主机上的 my-app.jar 文件复制到容器 my-app 的 /app 目录下
docker cp my-app.jar my-app:/app/

2. 实现原理与源码分析

很多人以为 docker cp 是一个直接的文件系统操作，但实际上它是一个 客户端-服务端 (C/S) 架构的 API 调用，其核心是 tar 归档流。

核心机制：API 与 Tar 流

无论你从容器复制文件还是向容器复制文件，整个流程如下：

客户端解析: docker CLI (客户端) 解析你的命令。
API 请求:
- 复制到容器: 客户端首先将要复制的文件或目录在本地打包成一个 tar 归档文件，然后通过调用 Docker Daemon 的 PUT /containers/{id}/archive API，将这个 tar 流作为请求体 (Request Body) 发送给 Docker 服务端。
- 从容器复制: 客户端调用 GET /containers/{id}/archive API，并告知服务端需要哪个路径下的文件。
服务端处理: Docker Daemon (服务端) 收到请求后：
- 复制到容器: 服务端接收 tar 流，并直接在容器的文件系统内解压。
- 从容器复制: 服务端将容器内的指定文件/目录打包成一个 tar 流，并将其作为 HTTP 响应 (Response) 发送回客户端。
客户端完成:
- 复制到容器: 服务端完成解压后，API 调用结束。
- 从容器复制: 客户端接收到服务端的 tar 流响应，并在本地解压，从而完成文件复制。

源码视角：客户端实现 (Go)

在 Docker CLI 的源码 (docker/cli) 中，我们可以看到这个过程的清晰实现。以下是简化的 Go 代码片段，展示了 CopyToContainer 的核心逻辑。

// (代码位于 docker/cli/cli/command/container/cp.go 和 client/interface.go)

// CopyToContainer 将内容复制到容器中
func (cli *Client) CopyToContainer(ctx context.Context, container, path string, content io.Reader, options CopyToContainerOptions) error {
    // 准备 API 请求
    // 这里的核心是 API 端点：/containers/{id}/archive
    apiPath := "/containers/" + container + "/archive"

    query := url.Values{}
    query.Set("path", path)
    query.Set("noOverwriteDirNonDir", strconv.FormatBool(options.NoOverwriteDirNonDir))

    // 发起一个 PUT 请求，请求体就是 tar 归档流 (content)
    resp, err := cli.put(ctx, apiPath, query, content, headers)
    if err != nil {
        return err
    }
    ensureReaderClosed(resp)
    return nil
}

解读: 客户端的 CopyToContainer 函数本质上是向 /containers/{id}/archive 发起了一个 PUT 请求，并将本地文件打包后的 io.Reader (tar 流) 作为请求体发送。

源码视角：服务端实现 (Go)

在 Moby 项目 (moby/moby) 的源码中，我们可以找到处理这个 API 请求的服务端逻辑。

// (代码位于 moby/moby/api/server/router/container/container_routes.go)

// putContainersArchive 处理向容器复制文件的 PUT 请求
func (s *containerRouter) putContainersArchive(ctx context.Context, w http.ResponseWriter, r *http.Request, vars map[string]string) error {
    // ... 解析参数 ...
    container, err := s.backend.ContainerGet(vars["name"])
    if err != nil {
        return err
    }

    // 调用后端的 ExtractToDir 方法，r.Body 就是客户端传来的 tar 流
    if err := s.backend.ContainerExtractToDir(container.Name, query.Get("path"), r.Body); err != nil {
        return err
    }

    w.WriteHeader(http.StatusOK)
    return nil
}

解读: 服务端的路由将请求交给了 putContainersArchive 函数，该函数的核心动作是调用 ContainerExtractToDir，它直接将请求体 (r.Body，也就是 tar 流) 在容器指定的路径下解压。

3. 实用场景举例

从容器拷贝日志

当应用日志没有通过数据卷挂载出来时，我们可以通过docker cp 命令将容器内部复制到宿主机对应的指定目录

bash

# 从一个名为 "my-prod-app" 的容器中拉取应用的日志文件
docker cp my-prod-app:/var/log/app.log ./app-debug.log

向容器上传配置文件

在不重启容器的情况下，动态更新一个应用的配置。

bash

# 更新 Nginx 的配置文件
docker cp nginx.conf my-nginx:/etc/nginx/nginx.conf

# 进入容器让 Nginx 重新加载配置
docker exec my-nginx nginx -s reload

在脚本中自动化

在 CI/CD 或部署脚本中，用于传输构建产物。

bash

#!/bin/bash
CONTAINER_ID=$(docker ps -qf "name=my-web-server")
BUILD_ARTIFACT="./dist/index.html"

if [ -n "$CONTAINER_ID" ]; then
  echo "Copying $BUILD_ARTIFACT to $CONTAINER_ID:/usr/share/nginx/html/"
  docker cp "$BUILD_ARTIFACT" "$CONTAINER_ID:/usr/share/nginx/html/"
  echo "Copy complete."
else
  echo "Error: Container not found."
  exit 1
fi

4. 限制与常见问题

性能瓶颈

由于其 tar 打包和解包的机制，docker cp 在处理 大量小文件 时性能极差。每一个文件都需要被添加到 tar 归档中，这个过程是串行的，开销很大。对于大文件，虽然性能尚可，但它不是流式的，会在内存中创建缓冲区，可能消耗大量内存。

用户与权限 (UID/GID)

默认情况下，docker cp 会保留文件的用户和组信息。如果你从容器中（通常以 root 用户运行）复制文件到主机，该文件在主机上的所有者也会是 root。这可能导致权限问题，需要手动 chown 修改所有者。

符号链接 (Symbolic Links)

docker cp 在处理符号链接时的行为需要特别注意：

复制到容器时: 如果源是一个符号链接，它会复制链接本身，而不是链接指向的目标文件。
从容器复制时: 如果容器内的路径是一个符号链接，它会复制链接指向的内容（文件或目录）。这个不一致的行为是导致一些安全漏洞的根源。

无法操作停止的容器

docker cp 依赖于一个正在运行的 Docker Daemon API，但它可以对已停止的容器进行操作。这是一个常见的误解。你可以从一个已停止的容器中拷贝数据，因为它的文件系统仍然存在。

5. 安全风险深度剖析

docker cp 最大的问题在于其安全模型，它是一个典型的 “困惑的副手” (Confused Deputy) 问题的例子。

“困惑的副手”问题

你 (攻击者): 一个低权限用户，只能操作容器。
副手 (Docker Daemon): 一个拥有系统最高权限 (root) 的进程。
困惑的动作: 你通过 docker cp 命令，向高权限的 Docker Daemon 发出一个看似无害的请求。但由于实现上的缺陷，这个高权限的“副手”在执行你的请求时，可能会被欺骗去操作它本不该操作的宿主机资源，从而实现容器逃逸。

高危漏洞案例：CVE-2019-14271

这个漏洞完美地诠释了上述风险。

漏洞评级: 严重 (Critical), CVSS v3.1 评分: 9.8
漏洞原理:
1. Docker 在执行 docker cp 时，会在容器内部启动一个名为 docker-tar 的辅助进程。这个进程虽然在容器的命名空间内，但它是以宿主机的 root 用户身份运行的。
2. 攻击者可以在容器内用恶意的库文件替换掉正常的系统库（如 libnss_*.so）。
3. 当 docker cp 被触发时，docker-tar 进程启动并尝试加载这些 libnss 库。
4. 由于它加载的是攻击者替换的恶意库，并且它是以 root 身份运行的，恶意代码就在宿主机上以 root 权限执行了。
后果: 攻击者可以从一个看似隔离的容器中，完全控制宿主机，实现彻底的容器逃逸。

6. 最佳替代方案对比

鉴于 docker cp 的种种问题，我们应该在绝大多数情况下使用更安全、更高效的替代方案。

方案对比表

方法	优点	缺点	最佳场景
`Dockerfile COPY/ADD`	声明式、不可变、安全	只能在构建时使用	将应用代码、静态配置等固化到镜像中。
`数据卷 (Volumes)`	高性能、持久化、解耦	需要预先规划和管理	数据库文件、用户上传内容、应用运行时状态。
`绑定挂载 (Bind Mounts)`	实时同步、方便开发	耦合宿主机路径、有权限风险	本地开发环境，实时查看代码变更。
`docker exec + tar`	控制力强、可绕过 `cp` 限制	命令复杂、手动操作	紧急情况下手动打包传输复杂数据。

方案详解

Dockerfile COPY/ADD: 这是将代码和资源放入镜像的首选方式。它符合不可变基础设施的理念，构建出的镜像是自包含且可预测的。
数据卷 (Volumes): 这是管理容器运行时数据的标准方式。由 Docker 管理，与宿主机文件系统解耦，性能优秀，且易于备份和迁移。
绑定挂载 (Bind Mounts): 主要用于开发环境，它将宿主机上的一个目录直接映射到容器内。这非常方便，但破坏了容器的隔离性，且可能引发权限问题，不推荐在生产环境中使用。

docker exec + tar: 这是 docker cp 的手动版本，更灵活但更复杂。

bash

# 从容器复制到主机
docker exec my-container tar czf - /path/in/container > local-archive.tar.gz

# 从主机复制到容器
tar czf - ./local-file | docker exec -i my-container tar xzf - -C /path/in/container

7. 结论

docker cp 是一个为紧急诊断和手动干预而设计的工具，它就像一把锋利但危险的手术刀。在自动化流程、CI/CD 流水线或任何生产环境的日常操作中，它都应该被严格禁止。

最佳实践法则:

构建时数据用 COPY: 所有静态的、随应用一起部署的代码和配置，都应该在 Dockerfile 中使用 COPY 命令。
运行时数据用 Volumes: 所有需要持久化的、由应用在运行时产生的数据（如数据库文件、用户上传），都必须使用数据卷。
开发环境用 Bind Mounts: 仅在本地开发时，为了方便实时编码，才考虑使用绑定挂载。
将 docker cp 视为最后的救命稻草: 只有当你需要从一个没有配置数据卷的“黑盒”容器中紧急拉取日志或诊断文件时，才使用它。
保护 Docker Socket: 永远不要将 Docker 的 Unix 套接字 (/var/run/docker.sock) 挂载到不可信的容器中，这等同于交出宿主机的 root 权限，也使得 docker cp 的风险敞口大开。

通过遵循这些原则，你可以构建出更安全、更健壮、更易于维护的容器化应用，从根本上避免 docker cp 带来的潜在风险。

目录

深度解析 Docker cp 命令：从入门、原理到安全最佳实践

1. 基础用法

命令作用

命令语法

2. 实现原理与源码分析

核心机制：API 与 Tar 流

源码视角：客户端实现 (Go)

源码视角：服务端实现 (Go)

3. 实用场景举例

从容器拷贝日志

向容器上传配置文件

在脚本中自动化

4. 限制与常见问题

性能瓶颈

用户与权限 (UID/GID)

符号链接 (Symbolic Links)

无法操作停止的容器

5. 安全风险深度剖析

“困惑的副手”问题

高危漏洞案例：CVE-2019-14271

6. 最佳替代方案对比

方案对比表

方案详解

7. 结论

相关内容

基于Cinnamon 的 Linux 系统上安装和配置Docker引擎的使用指南

Docker容器开机自启动配置完整指南