【文本分类】《短文本分类的ResLCNN模型》

阿里云国内75折 回扣 微信号:monov8
阿里云国际,腾讯云国际,低至75折。AWS 93折 免费开户实名账号 代冲值 优惠多多 微信号:monov8 飞机:@monov6


·阅读摘要:
  提出基于3层LSTM和CNN网络结构的ResLCNN深度学习模型。该模型使用了3层LSTM获取文本的长距离依赖,用CNN通过卷积获取句子局部特征,同时使用了残差模型,在第1层LSTM层与CNN层之间加入恒等映射,构建残差层,缓解深层模型梯度消失问题。
·参考文献:
  [1] 短文本分类的ResLCNN模型

参考论文信息

  论文名称:《短文本分类的ResLCNN模型》

  发布期刊:《软件学报》

  期刊信息:CSCD

【文本分类】《短文本分类的ResLCNN模型》_深度学习


  本文是2017年提出的,模型较为简单,年份也比较老,感觉没太大的参考价值了。

模型结构

  模型结构如下:

【文本分类】《短文本分类的ResLCNN模型》_神经网络_02

1. 长短时记忆网络

【文本分类】《短文本分类的ResLCNN模型》_深度学习_03

2. 卷积神经网络

  通过卷积层对单词进行卷积运算,将低级特征组合形成更高级的特征表示,可以得到更高级的特征信息,这可以直观地理解为从单词到词组的特征学习,比如学习词组 neural network的含义。然后通过池化层(max-over-time pooling),针对卷积得到的若干特征值,保留最有价值的特征。

3. ResLCNN模型

  ResLCNN模型以Word2vec和GloVe词向量构成的句子矩阵作为输入,第1层LSTM根据隐藏层和记忆单元获取文本时序特征,随后残差层包含两层 LSTM,接着 CNN层使用多个卷积核进行卷积运算,并提取最优卷积特征通过softmax分类。ResLCNN模型为了获取更复杂的特征,将3层LSTM结合CNN构建深层网络,同时在第1层LSTM输出与CNN层输入之间添加恒等映射,构建残差层缓解训练模型阶段低网络层梯度消失问题。


阿里云国内75折 回扣 微信号:monov8
阿里云国际,腾讯云国际,低至75折。AWS 93折 免费开户实名账号 代冲值 优惠多多 微信号:monov8 飞机:@monov6