GPU对2的幂次的batch可以发挥更佳的性能,因此设置成16、32、64、128...时往往要比设置为整10、整100的倍数时表现更优 https://zhuanlan.zhihu.com/p/27763696
深度学习 参数笔记
原文:https://www.cnblogs.com/cekong/p/11233432.html