トップ 差分 一覧 Farm ソース 検索 ヘルプ PDF RSS ログイン

Diary/2017-11-13

論文読み

Twitterで,@ogawa_tterさんに教えてもらったので読んでみた
Evaluating On-Node GPU Interconnects for Deep Learning Workloads
http://www.dcs.warwick.ac.uk/pmbs/pmbs/PMBS/papers/paper1.pdf

NVLinkは速いけどワークロードによっては(ResNetみたいな),
PCIe接続なGPUサーバー(GX8)でも結構いい速度でるよ,という話.
DGX-1の8-GPUのNVLinkでの同期が遅いこと,
メッセージサイズが小さい段階でPCIeが早めにサチること,が鍵なのかな.