上节介绍所有节点执行了bootstrap网络连接的建立,接下来介绍下拓扑分析。由于GPU机器架构是多种多样的,一台机器上可能有多个网卡,多个GPU卡,卡间连接也各不相同,因此需要对机器内设备连接拓扑进行分析,以使性能在各种拓扑结构下都尽可能好。接着上回继续看initTransportsRank。static ncclResult_t initTranspor...
CSDN · 2023-04-27 08:03:00
千寻位置CEO陈金培:发展时空智能,我们从一己之力迈向生态之力
机器之心 · 2023-04-26 20:58:00