深度学习框架的张量形状格式?
蓝海大脑炼丹神器深度学习液冷工作站研究人员表示:
图像张量的形状有两种约定,通道在前(channel-first)和通道在后(channel-last)的约定,常用深度学习框架使用的数据张量形状总结如下:
Pytorch/Caffe: (N, C, H, W);
TensorFlow/Keras: (N, H, W, C)。
举例理解就是Pytorch 的卷积层和池化层的输入 shape 格式为 (N, C, H, W),Keras 的卷积层和池化层的输入 shape 格式为 (N, H, W, C)。
值得注意的是 OpenCV 读取图像后返回的矩阵 shape 的格式是 (H, W, C)格式。
蓝海大脑 京ICP备18017748号-1