大海

神经网络实现-pytorch

发表于 2019-05-18 更新于 2021-07-09 分类于机器学习/machine learning

本文字数： 7.2k 阅读时长 ≈ 13 分钟

使用pytorch实现3层神经网络模型ThreeNet

阅读全文 »

神经网络实现-numpy

发表于 2019-05-17 更新于 2021-07-09 分类于机器学习/machine learning

本文字数： 24k 阅读时长 ≈ 44 分钟

使用numpy实现神经网络模型

使用单层神经网络OneNet实现逻辑或、逻辑与和逻辑非分类
使用2层神经网络TwoNet实现逻辑异或分类
使用3层神经网络ThreeNet实现iris数据集和mnist数据集分类

阅读全文 »

神经网络推导-矩阵计算

发表于 2019-05-15 更新于 2021-07-09 分类于机器学习/machine learning

本文字数： 14k 阅读时长 ≈ 25 分钟

为了理清如何进行神经网络的前向传播和反向传播的推导，找了很多资料，前向传播比较简单，重点在于如何进行反向传播的梯度计算

cs231n课程推荐的计算方式是先进行单个元素求导，再逐步泛化到批量数据求梯度，参考

阅读全文 »

实值标量函数一阶微分和Jacobian矩阵辨识

发表于 2019-05-14 更新于 2021-03-31 分类于数学/math

本文字数： 2.2k 阅读时长 ≈ 4 分钟

神经网络的反向传播可以通过对损失函数进行微分得到各层权重矩阵的梯度

其中对损失函数求梯度是实值标量函数一阶微分，其中关键的部分是得到Jacobian矩阵，从而转置获取梯度矩阵

阅读全文 »

Jacobian矩阵和梯度矩阵

发表于 2019-05-13 更新于 2021-03-31 分类于数学/math

本文字数： 8.9k 阅读时长 ≈ 16 分钟

在pytorch的autograd包中，利用Jacobian（雅格比）矩阵进行梯度的计算。学习实值标量函数、实值向量函数和实值矩阵函数相对于实向量变元或矩阵变元的偏导

阅读全文 »

矩阵基础

发表于 2019-05-10 更新于 2021-03-31 分类于数学/math

本文字数： 6.8k 阅读时长 ≈ 12 分钟

小结矩阵求解过程中的基础知识

标量、向量和矩阵
矩阵乘法/积
转置、共扼、共扼转置
矩阵的迹
向量化和矩阵化

阅读全文 »

导数、微分和梯度

发表于 2019-05-08 更新于 2021-03-31 分类于数学/math

本文字数： 5.7k 阅读时长 ≈ 10 分钟

最近推导神经网络的前向传播和反向传播过程，经常会遇到有关导数、微分和梯度的内容，对它们的概念进行一次小结

导数
微分
偏导数
全微分
方向导数
梯度

阅读全文 »

神经网络推导-批量数据

发表于 2019-05-06 更新于 2021-07-09 分类于机器学习/machine learning

本文字数： 24k 阅读时长 ≈ 44 分钟

输入批量数据到神经网络，进行前向传播和反向传播的推导

阅读全文 »

神经网络推导-单个数据

发表于 2019-05-01 更新于 2021-07-09 分类于机器学习/machine learning

本文字数： 17k 阅读时长 ≈ 31 分钟

输入单个数据到神经网络，进行前向传播和反向传播的推导

阅读全文 »

激活函数

发表于 2019-04-30 更新于 2021-04-14 分类于深度学习/deeplearning

本文字数： 2.4k 阅读时长 ≈ 4 分钟

介绍激活函数及其特性

Sigmoid
Tanh
ReLU
Leaky ReLU
Maxout

阅读全文 »