利用GPU训练网络时遇到的一些问题
1. OSError: [Error 12] Cannot allocate memory
解决办法: 出现这个错误时我是绝望的。。。因为我看了别人的解决办法,要加内存条才能解决。。。但是我不甘心,想了很久——发现了一个解决办法:将 DataLoader 中的 num_workers
设置为1。缺点:数据加载必然变得很慢,可怜我的内存条只有 8 个G
2. RuntimeError: CUDA error: device-side assert triggered
解决办法: 检查类别数目设置是否有误!标签分类应该从 0 开始,如果共有10类,则类别应是从 0 开始直到 19
3. CUDA error: out of memory
解决办法: 可以适当缩小 batch size 来解决
版权声明:本文为xxxxxxxxx原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。