Advertisement
alkkofficial

forward pass profiling

Dec 23rd, 2023
61
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
text 12.43 KB | None | 0 0
  1. Using: cuda
  2. STAGE:2023-12-23 20:42:45 9912:16316 ..\third_party\kineto\libkineto\src\ActivityProfilerController.cpp:312] Completed Stage: Warm Up
  3. STAGE:2023-12-23 20:43:11 9912:16316 ..\third_party\kineto\libkineto\src\ActivityProfilerController.cpp:318] Completed Stage: Collection
  4. STAGE:2023-12-23 20:43:11 9912:16316 ..\third_party\kineto\libkineto\src\ActivityProfilerController.cpp:322] Completed Stage: Post Processing
  5. -------------------------------- ------------ ------------ ------------ ------------ ------------ ------------
  6. Name Self CPU % Self CPU CPU total % CPU total CPU time avg # of Calls
  7. -------------------------------- ------------ ------------ ------------ ------------ ------------ ------------
  8. defaults 0.00% 2.000us 0.00% 2.000us 2.000us 1
  9. defaults 0.00% 0.000us 0.00% 0.000us 0.000us 1
  10. defaults 0.00% 1.000us 0.00% 1.000us 1.000us 1
  11. defaults 0.00% 1.000us 0.00% 1.000us 1.000us 1
  12. defaults 0.00% 0.000us 0.00% 0.000us 0.000us 1
  13. defaults 0.00% 1.000us 0.00% 1.000us 1.000us 1
  14. forward 0.09% 22.044ms 100.00% 24.371s 24.371s 1
  15. aten::conv2d 0.00% 26.000us 99.12% 24.158s 24.158s 1
  16. aten::convolution 0.00% 107.000us 99.12% 24.158s 24.158s 1
  17. aten::_convolution 0.00% 297.000us 99.12% 24.158s 24.158s 1
  18. aten::cudnn_convolution 97.77% 23.828s 97.77% 23.828s 23.828s 1
  19. aten::reshape 0.00% 10.000us 0.00% 24.000us 24.000us 1
  20. aten::view 0.00% 14.000us 0.00% 14.000us 14.000us 1
  21. aten::add_ 1.35% 329.706ms 1.35% 329.706ms 329.706ms 1
  22. aten::batch_norm 0.00% 382.000us 0.05% 12.857ms 12.857ms 1
  23. aten::_batch_norm_impl_index 0.00% 799.000us 0.05% 12.475ms 12.475ms 1
  24. aten::cudnn_batch_norm 0.00% 483.000us 0.05% 11.676ms 11.676ms 1
  25. aten::empty_like 0.02% 3.949ms 0.05% 11.184ms 11.184ms 1
  26. aten::empty 0.03% 7.235ms 0.03% 7.235ms 7.235ms 1
  27. aten::view 0.00% 3.000us 0.00% 3.000us 3.000us 1
  28. aten::empty 0.00% 4.000us 0.00% 4.000us 4.000us 1
  29. aten::empty 0.00% 1.000us 0.00% 1.000us 1.000us 1
  30. aten::empty 0.00% 1.000us 0.00% 1.000us 1.000us 1
  31. aten::relu 0.00% 157.000us 0.00% 209.000us 209.000us 1
  32. aten::clamp_min 0.00% 52.000us 0.00% 52.000us 52.000us 1
  33. aten::conv2d 0.00% 7.000us 0.21% 52.236ms 52.236ms 1
  34. aten::convolution 0.00% 18.000us 0.21% 52.229ms 52.229ms 1
  35. aten::_convolution 0.00% 22.000us 0.21% 52.211ms 52.211ms 1
  36. aten::cudnn_convolution 0.21% 51.822ms 0.21% 51.822ms 51.822ms 1
  37. aten::reshape 0.00% 3.000us 0.00% 7.000us 7.000us 1
  38. aten::view 0.00% 4.000us 0.00% 4.000us 4.000us 1
  39. aten::add_ 0.00% 360.000us 0.00% 360.000us 360.000us 1
  40. aten::batch_norm 0.00% 4.000us 0.00% 114.000us 114.000us 1
  41. aten::_batch_norm_impl_index 0.00% 6.000us 0.00% 110.000us 110.000us 1
  42. aten::cudnn_batch_norm 0.00% 77.000us 0.00% 104.000us 104.000us 1
  43. aten::empty_like 0.00% 3.000us 0.00% 24.000us 24.000us 1
  44. aten::empty 0.00% 21.000us 0.00% 21.000us 21.000us 1
  45. aten::view 0.00% 1.000us 0.00% 1.000us 1.000us 1
  46. aten::empty 0.00% 1.000us 0.00% 1.000us 1.000us 1
  47. aten::empty 0.00% 1.000us 0.00% 1.000us 1.000us 1
  48. aten::empty 0.00% 0.000us 0.00% 0.000us 0.000us 1
  49. aten::relu 0.00% 209.000us 0.00% 240.000us 240.000us 1
  50. aten::clamp_min 0.00% 31.000us 0.00% 31.000us 31.000us 1
  51. aten::conv2d 0.00% 7.000us 0.00% 497.000us 497.000us 1
  52. aten::convolution 0.00% 13.000us 0.00% 490.000us 490.000us 1
  53. aten::_convolution 0.00% 12.000us 0.00% 477.000us 477.000us 1
  54. aten::cudnn_convolution 0.00% 442.000us 0.00% 442.000us 442.000us 1
  55. aten::reshape 0.00% 1.000us 0.00% 3.000us 3.000us 1
  56. aten::view 0.00% 2.000us 0.00% 2.000us 2.000us 1
  57. aten::add_ 0.00% 20.000us 0.00% 20.000us 20.000us 1
  58. aten::batch_norm 0.00% 2.000us 0.00% 109.000us 109.000us 1
  59. aten::_batch_norm_impl_index 0.00% 4.000us 0.00% 107.000us 107.000us 1
  60. aten::cudnn_batch_norm 0.00% 93.000us 0.00% 103.000us 103.000us 1
  61. aten::empty_like 0.00% 1.000us 0.00% 6.000us 6.000us 1
  62. aten::empty 0.00% 5.000us 0.00% 5.000us 5.000us 1
  63. aten::view 0.00% 1.000us 0.00% 1.000us 1.000us 1
  64. aten::empty 0.00% 1.000us 0.00% 1.000us 1.000us 1
  65. aten::empty 0.00% 1.000us 0.00% 1.000us 1.000us 1
  66. aten::empty 0.00% 1.000us 0.00% 1.000us 1.000us 1
  67. aten::add 0.00% 57.000us 0.00% 57.000us 57.000us 1
  68. aten::add 0.00% 25.000us 0.00% 25.000us 25.000us 1
  69. aten::relu 0.00% 10.000us 0.00% 38.000us 38.000us 1
  70. aten::clamp_min 0.00% 28.000us 0.00% 28.000us 28.000us 1
  71. aten::conv2d 0.00% 4.000us 0.00% 997.000us 997.000us 1
  72. aten::convolution 0.00% 11.000us 0.00% 993.000us 993.000us 1
  73. aten::_convolution 0.00% 9.000us 0.00% 982.000us 982.000us 1
  74. aten::cudnn_convolution 0.00% 861.000us 0.00% 861.000us 861.000us 1
  75. aten::reshape 0.00% 1.000us 0.00% 3.000us 3.000us 1
  76. aten::view 0.00% 2.000us 0.00% 2.000us 2.000us 1
  77. aten::add_ 0.00% 109.000us 0.00% 109.000us 109.000us 1
  78. aten::batch_norm 0.00% 22.000us 0.00% 488.000us 488.000us 1
  79. aten::_batch_norm_impl_index 0.00% 76.000us 0.00% 466.000us 466.000us 1
  80. aten::cudnn_batch_norm 0.00% 380.000us 0.00% 390.000us 390.000us 1
  81. aten::empty_like 0.00% 2.000us 0.00% 7.000us 7.000us 1
  82. aten::empty 0.00% 5.000us 0.00% 5.000us 5.000us 1
  83. aten::view 0.00% 1.000us 0.00% 1.000us 1.000us 1
  84. aten::empty 0.00% 1.000us 0.00% 1.000us 1.000us 1
  85. aten::empty 0.00% 0.000us 0.00% 0.000us 0.000us 1
  86. aten::empty 0.00% 1.000us 0.00% 1.000us 1.000us 1
  87. aten::relu 0.00% 13.000us 0.00% 442.000us 442.000us 1
  88. aten::clamp_min 0.00% 429.000us 0.00% 429.000us 429.000us 1
  89. aten::conv2d 0.00% 4.000us 0.00% 903.000us 903.000us 1
  90. aten::convolution 0.00% 9.000us 0.00% 899.000us 899.000us 1
  91. aten::_convolution 0.00% 31.000us 0.00% 890.000us 890.000us 1
  92. aten::cudnn_convolution 0.00% 764.000us 0.00% 764.000us 764.000us 1
  93. aten::reshape 0.00% 1.000us 0.00% 3.000us 3.000us 1
  94. aten::view 0.00% 2.000us 0.00% 2.000us 2.000us 1
  95. aten::add_ 0.00% 92.000us 0.00% 92.000us 92.000us 1
  96. aten::batch_norm 0.00% 2.000us 0.00% 54.000us 54.000us 1
  97. aten::_batch_norm_impl_index 0.00% 3.000us 0.00% 52.000us 52.000us 1
  98. aten::cudnn_batch_norm 0.00% 39.000us 0.00% 49.000us 49.000us 1
  99. aten::empty_like 0.00% 1.000us 0.00% 6.000us 6.000us 1
  100. aten::empty 0.00% 5.000us 0.00% 5.000us 5.000us 1
  101. aten::view 0.00% 1.000us 0.00% 1.000us 1.000us 1
  102. aten::empty 0.00% 1.000us 0.00% 1.000us 1.000us 1
  103. aten::empty 0.00% 1.000us 0.00% 1.000us 1.000us 1
  104. aten::empty 0.00% 1.000us 0.00% 1.000us 1.000us 1
  105. aten::add 0.00% 80.000us 0.00% 80.000us 80.000us 1
  106. aten::add 0.00% 26.000us 0.00% 26.000us 26.000us 1
  107. aten::relu 0.00% 7.000us 0.00% 23.000us 23.000us 1
  108. -------------------------------- ------------ ------------ ------------ ------------ ------------ ------------
  109. Self CPU time total: 24.371s
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement