Advertisement
Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- Using: cuda
- STAGE:2023-12-23 20:42:45 9912:16316 ..\third_party\kineto\libkineto\src\ActivityProfilerController.cpp:312] Completed Stage: Warm Up
- STAGE:2023-12-23 20:43:11 9912:16316 ..\third_party\kineto\libkineto\src\ActivityProfilerController.cpp:318] Completed Stage: Collection
- STAGE:2023-12-23 20:43:11 9912:16316 ..\third_party\kineto\libkineto\src\ActivityProfilerController.cpp:322] Completed Stage: Post Processing
- -------------------------------- ------------ ------------ ------------ ------------ ------------ ------------
- Name Self CPU % Self CPU CPU total % CPU total CPU time avg # of Calls
- -------------------------------- ------------ ------------ ------------ ------------ ------------ ------------
- defaults 0.00% 2.000us 0.00% 2.000us 2.000us 1
- defaults 0.00% 0.000us 0.00% 0.000us 0.000us 1
- defaults 0.00% 1.000us 0.00% 1.000us 1.000us 1
- defaults 0.00% 1.000us 0.00% 1.000us 1.000us 1
- defaults 0.00% 0.000us 0.00% 0.000us 0.000us 1
- defaults 0.00% 1.000us 0.00% 1.000us 1.000us 1
- forward 0.09% 22.044ms 100.00% 24.371s 24.371s 1
- aten::conv2d 0.00% 26.000us 99.12% 24.158s 24.158s 1
- aten::convolution 0.00% 107.000us 99.12% 24.158s 24.158s 1
- aten::_convolution 0.00% 297.000us 99.12% 24.158s 24.158s 1
- aten::cudnn_convolution 97.77% 23.828s 97.77% 23.828s 23.828s 1
- aten::reshape 0.00% 10.000us 0.00% 24.000us 24.000us 1
- aten::view 0.00% 14.000us 0.00% 14.000us 14.000us 1
- aten::add_ 1.35% 329.706ms 1.35% 329.706ms 329.706ms 1
- aten::batch_norm 0.00% 382.000us 0.05% 12.857ms 12.857ms 1
- aten::_batch_norm_impl_index 0.00% 799.000us 0.05% 12.475ms 12.475ms 1
- aten::cudnn_batch_norm 0.00% 483.000us 0.05% 11.676ms 11.676ms 1
- aten::empty_like 0.02% 3.949ms 0.05% 11.184ms 11.184ms 1
- aten::empty 0.03% 7.235ms 0.03% 7.235ms 7.235ms 1
- aten::view 0.00% 3.000us 0.00% 3.000us 3.000us 1
- aten::empty 0.00% 4.000us 0.00% 4.000us 4.000us 1
- aten::empty 0.00% 1.000us 0.00% 1.000us 1.000us 1
- aten::empty 0.00% 1.000us 0.00% 1.000us 1.000us 1
- aten::relu 0.00% 157.000us 0.00% 209.000us 209.000us 1
- aten::clamp_min 0.00% 52.000us 0.00% 52.000us 52.000us 1
- aten::conv2d 0.00% 7.000us 0.21% 52.236ms 52.236ms 1
- aten::convolution 0.00% 18.000us 0.21% 52.229ms 52.229ms 1
- aten::_convolution 0.00% 22.000us 0.21% 52.211ms 52.211ms 1
- aten::cudnn_convolution 0.21% 51.822ms 0.21% 51.822ms 51.822ms 1
- aten::reshape 0.00% 3.000us 0.00% 7.000us 7.000us 1
- aten::view 0.00% 4.000us 0.00% 4.000us 4.000us 1
- aten::add_ 0.00% 360.000us 0.00% 360.000us 360.000us 1
- aten::batch_norm 0.00% 4.000us 0.00% 114.000us 114.000us 1
- aten::_batch_norm_impl_index 0.00% 6.000us 0.00% 110.000us 110.000us 1
- aten::cudnn_batch_norm 0.00% 77.000us 0.00% 104.000us 104.000us 1
- aten::empty_like 0.00% 3.000us 0.00% 24.000us 24.000us 1
- aten::empty 0.00% 21.000us 0.00% 21.000us 21.000us 1
- aten::view 0.00% 1.000us 0.00% 1.000us 1.000us 1
- aten::empty 0.00% 1.000us 0.00% 1.000us 1.000us 1
- aten::empty 0.00% 1.000us 0.00% 1.000us 1.000us 1
- aten::empty 0.00% 0.000us 0.00% 0.000us 0.000us 1
- aten::relu 0.00% 209.000us 0.00% 240.000us 240.000us 1
- aten::clamp_min 0.00% 31.000us 0.00% 31.000us 31.000us 1
- aten::conv2d 0.00% 7.000us 0.00% 497.000us 497.000us 1
- aten::convolution 0.00% 13.000us 0.00% 490.000us 490.000us 1
- aten::_convolution 0.00% 12.000us 0.00% 477.000us 477.000us 1
- aten::cudnn_convolution 0.00% 442.000us 0.00% 442.000us 442.000us 1
- aten::reshape 0.00% 1.000us 0.00% 3.000us 3.000us 1
- aten::view 0.00% 2.000us 0.00% 2.000us 2.000us 1
- aten::add_ 0.00% 20.000us 0.00% 20.000us 20.000us 1
- aten::batch_norm 0.00% 2.000us 0.00% 109.000us 109.000us 1
- aten::_batch_norm_impl_index 0.00% 4.000us 0.00% 107.000us 107.000us 1
- aten::cudnn_batch_norm 0.00% 93.000us 0.00% 103.000us 103.000us 1
- aten::empty_like 0.00% 1.000us 0.00% 6.000us 6.000us 1
- aten::empty 0.00% 5.000us 0.00% 5.000us 5.000us 1
- aten::view 0.00% 1.000us 0.00% 1.000us 1.000us 1
- aten::empty 0.00% 1.000us 0.00% 1.000us 1.000us 1
- aten::empty 0.00% 1.000us 0.00% 1.000us 1.000us 1
- aten::empty 0.00% 1.000us 0.00% 1.000us 1.000us 1
- aten::add 0.00% 57.000us 0.00% 57.000us 57.000us 1
- aten::add 0.00% 25.000us 0.00% 25.000us 25.000us 1
- aten::relu 0.00% 10.000us 0.00% 38.000us 38.000us 1
- aten::clamp_min 0.00% 28.000us 0.00% 28.000us 28.000us 1
- aten::conv2d 0.00% 4.000us 0.00% 997.000us 997.000us 1
- aten::convolution 0.00% 11.000us 0.00% 993.000us 993.000us 1
- aten::_convolution 0.00% 9.000us 0.00% 982.000us 982.000us 1
- aten::cudnn_convolution 0.00% 861.000us 0.00% 861.000us 861.000us 1
- aten::reshape 0.00% 1.000us 0.00% 3.000us 3.000us 1
- aten::view 0.00% 2.000us 0.00% 2.000us 2.000us 1
- aten::add_ 0.00% 109.000us 0.00% 109.000us 109.000us 1
- aten::batch_norm 0.00% 22.000us 0.00% 488.000us 488.000us 1
- aten::_batch_norm_impl_index 0.00% 76.000us 0.00% 466.000us 466.000us 1
- aten::cudnn_batch_norm 0.00% 380.000us 0.00% 390.000us 390.000us 1
- aten::empty_like 0.00% 2.000us 0.00% 7.000us 7.000us 1
- aten::empty 0.00% 5.000us 0.00% 5.000us 5.000us 1
- aten::view 0.00% 1.000us 0.00% 1.000us 1.000us 1
- aten::empty 0.00% 1.000us 0.00% 1.000us 1.000us 1
- aten::empty 0.00% 0.000us 0.00% 0.000us 0.000us 1
- aten::empty 0.00% 1.000us 0.00% 1.000us 1.000us 1
- aten::relu 0.00% 13.000us 0.00% 442.000us 442.000us 1
- aten::clamp_min 0.00% 429.000us 0.00% 429.000us 429.000us 1
- aten::conv2d 0.00% 4.000us 0.00% 903.000us 903.000us 1
- aten::convolution 0.00% 9.000us 0.00% 899.000us 899.000us 1
- aten::_convolution 0.00% 31.000us 0.00% 890.000us 890.000us 1
- aten::cudnn_convolution 0.00% 764.000us 0.00% 764.000us 764.000us 1
- aten::reshape 0.00% 1.000us 0.00% 3.000us 3.000us 1
- aten::view 0.00% 2.000us 0.00% 2.000us 2.000us 1
- aten::add_ 0.00% 92.000us 0.00% 92.000us 92.000us 1
- aten::batch_norm 0.00% 2.000us 0.00% 54.000us 54.000us 1
- aten::_batch_norm_impl_index 0.00% 3.000us 0.00% 52.000us 52.000us 1
- aten::cudnn_batch_norm 0.00% 39.000us 0.00% 49.000us 49.000us 1
- aten::empty_like 0.00% 1.000us 0.00% 6.000us 6.000us 1
- aten::empty 0.00% 5.000us 0.00% 5.000us 5.000us 1
- aten::view 0.00% 1.000us 0.00% 1.000us 1.000us 1
- aten::empty 0.00% 1.000us 0.00% 1.000us 1.000us 1
- aten::empty 0.00% 1.000us 0.00% 1.000us 1.000us 1
- aten::empty 0.00% 1.000us 0.00% 1.000us 1.000us 1
- aten::add 0.00% 80.000us 0.00% 80.000us 80.000us 1
- aten::add 0.00% 26.000us 0.00% 26.000us 26.000us 1
- aten::relu 0.00% 7.000us 0.00% 23.000us 23.000us 1
- -------------------------------- ------------ ------------ ------------ ------------ ------------ ------------
- Self CPU time total: 24.371s
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement