Self-Attention-自注意机制

阿里云国内75折回扣微信号：monov8

阿里云国际，腾讯云国际，低至75折。AWS 93折免费开户实名账号代冲值优惠多多微信号：monov8 飞机：@monov6

Original paper:

Bahdanau, Cho, & Bengio. Neural machine translation by jointly learning to align and translate. In ICLR, 2015.
Cheng, Dong, & Lapata. Long Short-Term Memory-Networks for Machine Reading. In EMNLP, 2016.

Self-Attention-自注意机制

在此之前你应该知道
Simple RNN Model
Long Short Term Memory (LSTM)
Attention-自注意机制
初始c₀ = 0h₀ = 0 全0向量
在这里插入图片描述
simple-RNN新的状态h_t依赖于新的输入X₁和上次状态h_t-1
两者不一样的地方在于h₀换成了c₀

c₁ = h₁,
重复以下计算

想要计算新的C₂首先得计算h_i与h₂的相关性a_i相关性计算在上一篇Attention-自注意机制有介绍这里便不累赘了
在这里插入图片描述

在这里插入图片描述

不断重复以上过程

通过self-attention自注意RNN 不太容易忘记且容易关注相关信息。
在这里插入图片描述

阿里云国内75折回扣微信号：monov8

阿里云国际，腾讯云国际，低至75折。AWS 93折免费开户实名账号代冲值优惠多多微信号：monov8 飞机：@monov6

返回列表

上一篇：[DiceCTF 2023] 3个简单题

下一篇：图文详解shell中的文本处理工具

“Self-Attention-自注意机制” 的相关文章

【编码】PHP中文路径问题详解1年前 (2023-02-02)

关于可迭代对象、迭代器对象、生成器对象1年前 (2023-02-02)

网络编程1年前 (2023-02-02)

学习笔记——CentOS中的帮助命令；常用快捷键；文件目录类命令1年前 (2023-02-02)

国产API工具爆火，为什么大家都开始用Eolink了？1年前 (2023-02-02)

学习笔记——安卓的下载路径；创建一个空的安卓project；Android中的日志工具划分1年前 (2023-02-02)

程序员的520花式绘制爱心代码大全_爱心代码1年前 (2023-02-02)

2021最全大数据学习路线（建议收藏）_大数据学习路线1年前 (2023-02-02)

Anaconda和pip常用命令汇总：简单，通俗易懂1年前 (2023-02-02)

基于JavaSpringboot+vue国风汉服文化交流宣传系统1年前 (2023-02-02)