fastai
fastai12-NLP Dive
数据集 model1 没什么特别的, 就是输入的三个字符串是一个一个读取的, h记忆 hidden state 在循环神经网络的每一步中更新的激活 class LMModel1(Module): def __init__(self, vocab_sz, n_hidden): self.i_h = nn.Embedding(vocab_sz, n_hidden) self.h_h = nn.Linear(n_hidden, n_hidden) self.h_o = nn.Linear(n_hidden,vocab_sz) def forward(self, x): h