博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
LSTM中的推导(LATEX写的)
阅读量:4078 次
发布时间:2019-05-25

本文共 501 字,大约阅读时间需要 1 分钟。

Long Short-term memory is a kind of recurrent neural networks. It has additional gates and its' architecture is bellow:

This architecture can avoid the gradient vanishing and keep the long-term memory, so this is a very powerful neural network.

We can get these formulations:

The symbol   denotes the indexs of all units,  denotes the output of unit   .

First of all, we define the truncated item:

In the later derivation, we may use the  to denote  for conventional.

Secondly, we will derive the derivative.

你可能感兴趣的文章
JVM并发机制探讨—内存模型、内存可见性和指令重排序
查看>>
nginx+tomcat+memcached (msm)实现 session同步复制
查看>>
WAV文件解析
查看>>
WPF中PATH使用AI导出SVG的方法
查看>>
QT打开项目提示no valid settings file could be found
查看>>
java LinkedList与ArrayList迭代器遍历和for遍历对比
查看>>
coursesa课程 Python 3 programming 统计文件有多少单词
查看>>
多线程使用随机函数需要注意的一点
查看>>
getpeername,getsockname
查看>>
所谓的进步和提升,就是完成认知升级
查看>>
如何用好碎片化时间,让思维更有效率?
查看>>
No.182 - LeetCode1325 - C指针的魅力
查看>>
Encoding Schemes
查看>>
带WiringPi库的交叉笔译如何处理二之软链接概念
查看>>
Java8 HashMap集合解析
查看>>
自定义 select 下拉框 多选插件
查看>>
linux和windows内存布局验证
查看>>
Linux常用统计命令之wc
查看>>
fastcgi_param 详解
查看>>
搞定Java面试中的数据结构问题
查看>>