pytorch 自定义初始化权重的方法
pytorch 自定义初始化权重的方法
首选注意:torch.ensor 与 torch.Tensor的区别
常用操作 torch.tensor是一个包含多个同类数据类型数据的多维矩阵。
常用参数
dtype: tessor的数据类型,总共有八种数据类型。其中默认的类型是torch.FloatTensor,而且这种类型的别名也可以写作torch.Tensor。
核心思想就是构造和该层权重同一尺寸的矩阵去对该层权重赋值。但是,值得注意的是,pytorch中各层权重的数据类型是nn.Parameter,而不是Tensor或者Variable**。
import torch
import torch.nn as nn
import torch.optim as optim
import numpy as np
*一个卷积层,我们可以看到它的权值是随机初始化的
w=torch.nn.Conv2d(2,2,3,padding=1)
print(w.weight)
*种方法
print(“1.使用另一个Conv层的权值”)
q=torch.nn.Conv2d(2,2,3,padding=1) # 假设q代表一个训练好的卷积层
print(q.weight) # 可以看到q的权重和w是不同的
w.weight=q.weight # 把一个Conv层的权重赋值给另一个Conv层
print(w.weight)
第二种方法
print(“2.使用来自Tensor的权值”)
ones=torch.Tensor(np.ones([2,2,3,3])) # 先创建一个自定义权值的Tensor,这里为了方便将所有权值设为1
w.weight=torch.nn.Parameter(ones) # 把Tensor的值作为权值赋值给Conv层,这里需要先转为torch.nn.Parameter类型,否则将报错
print(w.weight)
完整实现线性权值变化
#===================================================
x = torch.randn(128,20) # N = 128组,特征20
print(x.size())
m = torch.nn.Linear(20,30) # 输入特征数、输出特征30
# m.weight = torch.rand(30,20)
new_Wight = torch.Tensor(np.ones([30,20])) # torch.Tensor = torch.FloatTensor 默认float类型
m.weight = torch.nn.Parameter(new_Wight) # 自定义权值初始化
print(m.weight.size()) # 权值 30*20
print(m.bias.size()) # 偏置 30
out = m(x)
print(out.size())
print(m.weight)
print(m.bias)
# print(list(m.parameters())) # 查看参数
参考:https://www.jb51.net/article/167881.htm
附:Variable和Parameter的区别
Parameter是torch.autograd.Variable的一个子类,常被用于Module的参数。例如权重和偏置。
Parameters和Modules一起使用的时候会有一些特殊的属性。parameters赋值给Module的属性的时候,它会被自动加到Module的参数列表中,即会出现在Parameter()迭代器中。将Varaible赋给Module的时候没有这样的属性。这可以在nn.Module的实现中详细看一下。这样做是为了保存模型的时候只保存权重偏置参数,不保存节点值。所以复写Variable加以区分。
另外一个不同是parameter不能设置volatile,而且require_grad默认设置为true。Varaible默认设置为False.
参数:
parameter.data 得到tensor数据
parameter.requires_grad 默认为True, BP过程中会求导
Parameter一般是在Modules中作为权重和偏置,自动加入参数列表,可以进行保存恢复。和Variable具有相同的运算。
我们可以这样简单区分,在计算图中,数据(包括输入数据和计算过程中产生的feature map等)时variable类型,该类型不会被保存到模型中。 网络的权重是parameter类型,在计算过程中会被更新,将会被保存到模型中。