NCCL 集合通信算子总结
NCCL(NVIDIA Collective Communications Library)主要提供面向多 GPU / 多机场景的集合通信(collective communication)能力,常用于深度学习训练中的梯度同步、参数分发和结果聚合。核心集合通信算子┌─────────────────
查看全文
技术文章
NCCL(NVIDIA Collective Communications Library)主要提供面向多 GPU / 多机场景的集合通信(collective communication)能力,常用于深度学习训练中的梯度同步、参数分发和结果聚合。核心集合通信算子┌─────────────────
查看全文