• 首页
  • EMR中文网
  • EMR中文网

    你的位置:VEGA中文网 > EMR中文网 >

    pytorch之scatter_的用法及说明

    发布日期:2025-01-04 10:25    点击次数:153
    pytorch scatter_的用法 scatter_(input, dim, index, src)将src中数据根据index中的索引按照dim的方向填进input中 这个函数可以从转换成onehot编码来理解。 看下面代码: 简要说明 这段代码的目的就是将李表[1,2,1,2,0]转成one-hot编码的形式。 因为有5个数据,然后数值范围从0~2,所以需要设置3列,所以目标矩阵应该是5x3。 scatter_ 中第一个1表示沿着维度1的方向也就是列的方向,第二个参数表示需要填值的索引,第三个参数表示填的值。 比如以输出结果的第一行为例,原本 torch.zeros 使得第一行的元素都是0,但是 scatter_ 的第二个输入参数第一行是1(因为经过unsqueeze后第一行只有一个元素了),所以输出结果的第一行的第1个元素(从0开始)应该填上 scatter 最后一个参数所表示的值,剩下的以此类推。 不过其实得到onehot编码可以用pandas.get_dummies .scatter_函数 .scatter_函数放置元素或者修改元素。 torch.zeros(3,5),先创建一个3行5列的全为0的tensor,后续使用scatter函数往里放置元素,如何放置按照参数1和参数2的规定,放置哪些元素,按照参数3的规定。 具体来说 上述.scatter_(参数1,参数2,参数3)中,参数0/1表示,按行/列进行元素的放置(维度再高类比扩展),参数2用于找索引(找torch.zeros中位置),参数3为希望放入的元素。例如当参数3为x的时候,torch.zeros(3,5)中填入的为x中的元素;当参数3为1的时候,形成的tensor中为1,即表示希望放入的元素为1。 如何放置,先从简单的,放置的元素为1开始: 第一步,先看参数2,找index。 参数2的值是一个tensor: 例如,其中第1行第0列(1,0)的值为2,即index=2。 第二步,根据index确定行/列,看参数1。 本例中参数1为0,按行放置,因此在torch.zeros(3,5)的第2行(注意从0开始)填入1,那么,在第2行(从0开始)的哪一列填入1呢,需要遵循的原则是:第一步中index所在位置为第1列,因此放入第1列。因此在torch.zeros(3,5)的(2,1)位置上放入1。 即往torch.zeros(3,5)中填入元素的时候,torch.zeros(3,5)中元素的列与x的列是相同的,这一点当x是具体数值的时候比较清晰。可以看出x的列与torch.zeros(3,5)最后填完之后的列中的元素是对应的,比如第1列的元素不会跑到第2列去,但是行不一定。 那么,复杂一点,如果放置的元素不是1,而是需要把x中的元素放入呢。增加第三步,目前已经找到参数2中 (1,0) 的index是2了,再看参数3,此时参数3为x,在x中找 (1,0) 位置上的元素是0.0630,因此这时候在第二步中,放入第1行第0列的元素不是1,而是0.0630。因此在torch.zeros(3,5)的(2,1)位置上放入0.0630。 Note: 第二步中,如果参数=1,表示按行放置,则先确定行再确定列;如果参数=0,表示按列放置,则先确定列再确定行。本例中因为是按行放置,要求torch.zeros(3,5)的列与x的列是相同的,否则没法做到列列对应;如果是按列方式,则要求【被填入的torch】与x的行是相同的,否则没法做到行行对应。参数2中的值控制的是【被填入的torch】的x行或者x列,因此参数2中的最大值,不应该超过【被填入的torch】的行/列(按列排序/按行排序)–>参数2控制位置。 ->按行排序,列列对应;按列排序,行行对应。 参数2,参数1,最后再看参数3。 index数值找到确定行/列,再看index位置,确定列/行。 总结 以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。