对于训练过程里的代码有个疑问150~161 #3

sweetxing · 2020-07-05T02:29:24Z

optimizer_c中优化的是vnet的参数，但是损失l_g_meta中我没有看到vnet网络的参与，我有点想不清楚网络是如何迭代的

xjtushujun · 2020-07-11T04:51:33Z

请参考文章关于更新MW-Net参数的数学表达式。

jingzhengli · 2020-12-10T06:20:39Z

optimizer_c中优化的是vnet的参数，但是损失l_g_meta中我没有看到vnet网络的参与，我有点想不清楚网络是如何迭代的
损失l_g_meta是meta_model和vnet网络的共同参与计算的，所以是在一个计算图中的。这也是meta_model存在的意义，做一个桥梁作用。
226行：
l_g_meta.backward()
这一步更新的不仅是临时模型的参数，也包含了vnet

justlovebarbecue · 2021-02-04T04:26:25Z

@xjtushujun @jingzhengli 您好，我也是看到这个地方，有些不理解。meta_model 本身是不包含vnet的，vnet的梯度是怎么计算出来的呢？我发现meta_model.update_params这行代码应该很重要，我去掉这行，vnet的梯度就不能计算了。可是这行代码调用的函数只和meta_model相关，是怎么能和vnet有联系的呢？如果方便麻烦讲解一下，谢谢您！

YAaNnGg · 2021-04-27T14:11:05Z

It's related to the update_params() method defined in MetaModule class in resnet.py.

trafficpre · 2022-04-24T08:28:53Z

关于网络参数更新的问题想请教一下，
optimizer_c.zero_grad()
l_g_meta.backward()
optimizer_c.step()
这几行应该是要更新vnet网络的参数，但是vnet.state_dict()观察发现网络参数并没有变化。还有后边优化model参数的时候也是一样的问题，麻烦解释一下，谢谢！

Dawn-LX · 2022-08-11T05:23:33Z

same problem, can anyone explain this? I understand all the math in the paper, but I dont understand the code for gradient calculation.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

对于训练过程里的代码有个疑问150~161 #3

对于训练过程里的代码有个疑问150~161 #3

sweetxing commented Jul 5, 2020 •

edited

Loading

xjtushujun commented Jul 11, 2020

jingzhengli commented Dec 10, 2020

justlovebarbecue commented Feb 4, 2021

YAaNnGg commented Apr 27, 2021

trafficpre commented Apr 24, 2022

Dawn-LX commented Aug 11, 2022 •

edited

Loading

对于训练过程里的代码有个疑问150~161 #3

对于训练过程里的代码有个疑问150~161 #3

Comments

sweetxing commented Jul 5, 2020 • edited Loading

xjtushujun commented Jul 11, 2020

jingzhengli commented Dec 10, 2020

justlovebarbecue commented Feb 4, 2021

YAaNnGg commented Apr 27, 2021

trafficpre commented Apr 24, 2022

Dawn-LX commented Aug 11, 2022 • edited Loading

sweetxing commented Jul 5, 2020 •

edited

Loading

Dawn-LX commented Aug 11, 2022 •

edited

Loading