零拷贝 - cs-book

Linux 零拷贝技术原理

零拷贝技术旨在减少数据在用户空间和内核空间之间的拷贝次数，从而提高数据传输效率，降低 CPU 负载。在 Linux 中，主要有以下几种零拷贝技术：

mmap + write

原理: 使用 mmap() 系统调用将文件映射到用户空间的虚拟内存地址，然后使用 write() 系统调用将数据直接写入到内核缓冲区，避免了数据从内核空间到用户空间的拷贝。适用场景: 文件传输、网络传输等需要大量数据传输的场景。缺点: 需要应用程序管理数据的缓存，增加了应用的复杂性。可能导致文件内容的修改直接反映到磁盘上，需要谨慎使用。 2. sendfile

原理: 使用 sendfile() 系统调用将数据从一个文件描述符直接传输到另一个文件描述符，避免了数据在内核空间和用户空间之间的拷贝。适用场景: 网络服务器发送静态文件等场景。缺点: 只能用于文件到套接字的传输，不支持其他类型的文件操作。需要内核支持 sendfile() 系统调用。 3. splice

原理: 使用 splice() 系统调用将数据在两个文件描述符之间移动，避免了数据在内核空间和用户空间之间的拷贝。适用场景: 管道通信、网络传输等场景。缺点: 需要内核支持 splice() 系统调用。两个文件描述符必须是管道设备或套接字。 4. tee

原理: 使用 tee() 系统调用将数据从一个管道复制到另一个管道，避免了数据在内核空间和用户空间之间的拷贝。适用场景: 需要将数据复制到多个目标的场景。缺点: 需要内核支持 tee() 系统调用。两个文件描述符必须是管道设备。 5. sendfile + DMA gather copy

原理: 结合 sendfile() 和 DMA gather copy 技术，将多个分散的数据块直接传输到网络设备，避免了数据在内核空间的拷贝。适用场景: 高性能网络服务器发送大量小文件等场景。缺点: 需要硬件支持 DMA gather copy。需要内核支持相关特性。总结:

零拷贝技术可以显著提高数据传输效率，降低 CPU 负载，但不同的技术有不同的适用场景和限制。选择合适的零拷贝技术需要根据具体的应用场景和需求进行评估。