这个bug改了3个小时,必须要狠狠记下来,真无语啊!(导致这个bug的原因极其多,我这里也仅限于一部分)
原因:
连接CNN和LSTM时,使用conv1d对文本进行卷积时出现TypeError: 'Tensor' object is not callable
猜测应该是在class类中不能直接进行维度转换;同时不能出现input等与库名相似的字段名。

解决:
将上述截图中的二三行代码替换到def forward中,其实不用管torch.randn,直接使用permute对结果进行维度转换 ,再调用上述截图的第一行conv1卷积层

另外:1.一定注意lstm的输出是个tuple,可以使用下述代码取出output
lstm_out, _ = self.lstm(cat_input)
2.集成神经网络时,一定注意输入输出的维度 和它俩是否对应的问题,否则可能会导致loss无法降低。编集成网络的代码在某种程度上就是对shape进行操作。
本文记录了一次关于如何修复CNN与LSTM连接时遇到的TypeError,重点在于解决卷积操作和维度转换问题,以及注意事项,如lstm输出处理和网络结构对应性检查。
2045

被折叠的 条评论
为什么被折叠?



