本文主要是介绍为什么Creating a tensor from a list of numpy.ndarrays is extremely slow,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
1.问题简介
今天运行一个DQN的代码时出现了如下图的warning:
UserWarning: Creating a tensor from a list of numpy.ndarrays is extremely slow. Please consider converting the list to a single numpy.ndarray with numpy.array() before converting to a tensor. (Triggered internally at C:\cb\pytorch_1000000000000\work\torch\csrc\utils\tensor_new.cpp:210.)state = torch.tensor([state], dtype=torch.float).to(self.device)
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-V58j2dP8-1651050416214)(C:\Users\admin\AppData\Roaming\Typora\typora-user-images\image-20220427155113673.png)]](https://img-blog.csdnimg.cn/34500dfd3113483089887f495e320f06.png)
警告说我们创建用一个包含numpy.ndarrays的列表创建tensor太慢了,建议我们转换为tensor之前考虑用numpy.array()将列表转换为一个单独的numpy.ndarry。
所以就想对tensor的转换这部分学习一下。
找到一篇文章:https://zhuanlan.zhihu.com/p/429901066
这篇文章介绍了一下这个问题,但是自己对于代码运行过程中数据类型的变换不是很懂,想弄透彻一点,所以记录一下代码的调试过程中变量类型的变换。
2.实验与结论
先说结论
如果list中没有ndarrays,则选择list->tensor更快。
如果list中有ndarrays,则选择list->ndarrays->tensor更快;
注:为了减小偶然因素的影响,所以将转换的部分运行10遍
2.1 list->tensor(注:list中的元素不含numpy.ndarrays)
import numpy as np
import torch
import timel = [i for i in range(50000000)] # 五千万
stime = time.time()
for _ in range(10):a = torch.tensor(l)
etime = time.time()
print(f'用时: {etime-stime}s')
用时: 25.838355541229248s
调试过程中的变量记录:
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-w24lkNAV-1651050416215)(C:\Users\admin\AppData\Roaming\Typora\typora-user-images\image-20220427163413678.png)]](https://img-blog.csdnimg.cn/61a19e45faee40d8a0f537c913932e7c.png)
2.2 list->numpy.ndarrays->tensor(注:list中的元素不含numpy.ndarrays)
import numpy as np
import torch
import timel = [i for i in range(50000000)] # 五千万
stime = time.time()
for _ in range(10):a = torch.tensor(np.array(l))
etime = time.time()
print(f'用时: {etime-stime}s')
用时: 31.836950540542603s
调试过程中的变量记录:
import numpy as np
import torchl = [1, 2, 3, 4, 5]
a = np.array(l)
b = torch.tensor(a)
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-O5RrXfpg-1651050416216)(C:\Users\admin\AppData\Roaming\Typora\typora-user-images\image-20220427164241324.png)]](https://img-blog.csdnimg.cn/75affe56cbea458b822ab3da13b17a28.png)
结论一:可以看到如果list中的元素不含有numpy.ndarrays时直接将list->tensor更快
2.3 list->tensor(注:list中的元素含numpy.ndarrays)
import numpy as np
import torch
import timel = [np.ones(1) for i in range(5000000)] # 五百万
stime = time.time()
torch.tensor(l)
etime = time.time()
print(f'用时: {etime-stime}s')
用时: 3.9938528537750244s
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-DsAOIor1-1651050416216)(C:\Users\admin\AppData\Roaming\Typora\typora-user-images\image-20220427165742016.png)]](https://img-blog.csdnimg.cn/ba6c3dd811ea4f90a506e5e195269cb1.png)
调试过程中的变量记录:
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-gOOEAHvg-1651050416217)(C:\Users\admin\AppData\Roaming\Typora\typora-user-images\image-20220427170003067.png)]](https://img-blog.csdnimg.cn/580800d0df7d47c780dcb97d2cdd7082.png)
2.4 list->numpy.ndarraays->tensor(注:list中的元素含numpy.ndarrays)
l = [np.ones(1) for i in range(5000000)] # 五百万
stime = time.time()
a = np.array(l)
b = torch.tensor(a)
etime = time.time()
print(f'用时: {etime-stime}s')
![[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-GhwRAbJ5-1651050416218)(C:\Users\admin\AppData\Roaming\Typora\typora-user-images\image-20220427170322440.png)]](https://img-blog.csdnimg.cn/d1e775df085244c5a39ff68da8ac475a.png)
用时: 1.8933970928192139s
调试过程中的变量记录:

结论二:如果list中有ndarrays,则选择list->ndarrays->tensor更快
这篇关于为什么Creating a tensor from a list of numpy.ndarrays is extremely slow的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!