Última pergunta sobre Nvlink

0
Responda

Como fazer cópia de memória ponto a ponto com eficiência para GPUs sem acesso direto ao NVLINK?

Tento fazer a comunicação ponto a ponto na estação de trabalho DGX com 8 GPUs. Posso obter um bom desempenho usando cudaMemcpyPeer entre GPUs com acesso direto NVLINK. Mas algumas GPUs não têm acesso direto umas às outras. Acho que posso usar algumas GPUs como ponto intermediário para usar NVLINK. Assim, os dados podem ser transferidos sem usar PCIe. Mas é difícil para mim escrever um plano de roteamento para cada dispositivo manualmente. Existe alguma API ou solução melhor?

nvidia nvlink gpu cuda

1
Responda

Comportamento estranho de cudaMemcpyAsync: 1. cudaMemcpyKind não faz diferença. 2. A cópia falha, mas silenciosamente

Estou me familiarizando com um novo cluster equipado com GPUs Pascal P100 + Nvlink. Eu escrevi um programa de ping-pong para testar as larguras de banda e acesso ponto a ponto gpu< -> gpu e gpu< -> cpu. (Estou ciente de que as amostras cuda contêm esse programa, mas eu queria fazer isso sozinho para melhor compreensão.) As larguras de banda do Nvlink parecem razoáveis ​​(~ 35 GB/s bidirecional, com o máximo teórico sendo 40). No entanto, ao depurar o pingue-pongue, descobri um comportamento estranho.

cuda cuda uva nvlink

Etiquetas quentes

© 2021   OlaMundo.Org