对大家有帮助的问答会被标记为“推荐”,看完课程过来浏览一下别人提的问题,会帮你学得更全面
l
老师,这个for循环我没看懂,我总觉得字典里一直都是一个词,因为没有把此添加到空的字典里。
老师,这一节课视频里讲的这个项目代码在资料下载里也没有找到
老师,我想问下 在skip_grammer模型中,隐藏层到输出层中间的W矩阵是共享的嘛?如果说有n个输出结果就要做n词sofamax吗?隐藏层的是 一样的,W矩阵也是 一样的,n次softmax的结果不也一样吗?还有就是为什么不直接用一次softmax然后直接取top n呢?
老师您好,我不太明白,这里在预测的时候为什么要给一个初始的static,我们在前面定义网络的时候不是已经给了初始的static吗
如果一个项目没有reqirments.txt文件, 我该怎样配置环境启动这个项目呢?
交到crf为什么是3维的,我理解标签是一个维度,词的个数是第二个维度,就两个维度,视频中您讲的是3个维度?哪3个?
老师,hmm_segment 的代码没有啊,这一章的最后三节是crf的内容,应该在机器学习那块儿,我当时就没找到
老师,训练的时候,为什么feed_previous=False?train和predict不都一样把上一时刻的输出作为下一时刻的输入?训练的时候如果不连起来,那模型跟predict的时候少了很多连线,参数还准吗?
训练的时候,decoder inputs是事先有的吗?有的话,数据是从哪里来的?
老师,我问一下,numpy,nltk等操作数据非常方便,如果数据量非常大怎么办,它们能直接操作吗?还是用spark啥的分布式计算?