What is Transformer and How it Works?
这篇博客对深度学习中的Transformer架构及其工作原理进行了详细介绍。
December 7, 2024External

这篇博客对深度学习中的Transformer架构及其工作原理进行了详细介绍。

这篇博客是对深度学习中常见的一些优化算法进行整理的笔记,其中主要围绕以随机梯度方法为代表的一阶优化算法进行介绍。

这篇博客是基于Keras对三个经典的神经网络项目进行学习的笔记,分别为IMDB电影二分类问题、Reuters新闻主题多分类问题和Boston房价预测回归问题。

这篇博客是在学习深度学习时整理的笔记,其中主要介绍了计算图的概念、前向传播与反向传播算法及其实现等内容。