Pertanyaan Terbaru Tentang Nvlink

0
Menjawab

Bagaimana cara melakukan penyalinan memori point-to-point secara efisien untuk GPU tanpa akses NVLINK langsung?

Saya mencoba melakukan komunikasi point-to-point pada DGX workstation dengan 8 GPU. Saya dapat mencapai kinerja yang baik menggunakan cudaMemcpyPeer antara GPU dengan akses NVLINK langsung. Tetapi beberapa GPU tidak memiliki akses langsung satu sama lain. Saya rasa saya bisa menggunakan beberapa GPU sebagai titik perantara untuk menggunakan NVLINK. Sehingga data dapat ditransfer tanpa menggunakan PCIe. Tetapi sulit bagi saya untuk menulis rencana perutean untuk setiap perangkat secara manual. Apakah ada API atau solusi yang lebih baik?

nvidia nvlink gpu cuda

1
Menjawab

Perilaku aneh cudaMemcpyAsync: 1. cudaMemcpyKind tidak ada bedanya. 2. Salin gagal, tapi diam-diam

Saya membiasakan diri dengan kluster baru yang dilengkapi dengan Pascal P100 GPU + Nvlink. Saya menulis program ping-pong untuk menguji gpu< -> gpu dan gpu< -> bandwidth cpu dan akses peer-to-peer. (Saya tahu sampel cuda berisi program semacam itu, tetapi saya ingin melakukannya sendiri untuk pemahaman yang lebih baik.) Bandwidth nvlink tampak wajar (~ 35 GB/s dua arah, dengan maksimum teoritis 40). Namun, saat men-debug ping-pong saya menemukan beberapa perilaku aneh.

cuda cuda uva nvlink

Tag Populer

© 2021   Pemrograman.Net