《meaching learning》机器学习学习记录4.神经网络

简介: 备注:其中Latex公式并没有完整显示,但是总体不影响阅读!

机器学习笔记4 - 神经网络

线性回归和逻辑回归都有一个缺点,当特征太多,计算负荷会很大,

引入神经网络

在神经网络中,参数称为权重(weight)

4-1

其中$x_1,x_2,x_3$是输入单元,$a_1,a_2,a_3$是中间单元,负责处理数据传递到下一层,最后是输出单元,其用来计算$h_\theta(x)$。

在一个三层网络中,第一层成为输入层( Input Layer),最后一层称为输出层( Output Layer),中间一层成为隐藏层 (Hidden Layers)。我们为每一层都增加一个偏置单元(bias unit),得到如下图:

4-2

$a^{(j)}_i$表示第$j$层的第$i$个激活单元。$\theta^{(j)}$代表从第$j$层映射到第$j+1$层时的权重矩阵,比如$\theta^{(1)}$表示从第一层映射到第二层的权重矩阵。该矩阵的大小为:以第$j+1$层的激活单元数量为行数,以第$j$层激活单元数加1为列数的矩阵。例:上图神经网络中$\theta^{(1)}$​尺寸为3*4:

对于上图所示的模型,激活单元和输出分别表达为:

4-3

前向传播算法:从左向右的算法,(每一个a都是由上一层所有的$x$和每一个$x$所对一个的决定的)

把$x,\theta,a$​分别用矩阵表示,我们可以得到$\theta*X=a$:

4-4

我们使用向量化的方法来代替循环编码

如下神经网络,我们来计算第二层的值:

4-5

上述计算完成后添加$a^{(2)}_0=1$​,计算输出值如下:

4-6

令$z^{(3)}=\theta^{(2)}a^{(2)}$,则$h_\theta(x)=a^{(3)}=g(z^{(3)})$.

如上是针对一个训练实例的计算,对整个训练集进行计算需要将训练集的特征矩阵进行转置,使得同一个实例的特征都在同一列,即:

$$ z^{(2)}=\theta^{(1)}*X^T $$

$$ a^{(2)}=g(z^{(2)}) $$

如下图,当把神经网络的左半部分遮住,右半部分其实就是以$a_0,a_1,a_2,a_3$​,按照逻辑回归的方式输出$h_\theta(x)$​​。

4-7

神经网络其实就是逻辑回归,只是我们把逻辑回归的输入变量变成了中间层,即:

4-8

我们可以将$a_0,a_1,a_2,a_3$看成相比于$x_0,x_1,x_2,x_3$更高级的特征值,是$x$的进化,其能更好的预测新数据​

特征的直观理解

在神经网络中,原始特征是输入层。

如下通过单层神经元表示逻辑运算,比如逻辑与(AND),逻辑或(OR).

用如下神经网络来表示AND函数

4-9

其中$\theta_0=-30,\theta_1=20,\theta_2=20$,输出函数$h_\theta(x)$为$h_\theta(x)=g(-30+20x_1+20x_2)$

已知$g(x)$​图像是:

4-10

得到真值表:

4-11

同理对于OR函数

4-12

整体一样,$\theta$​取值不同。

逻辑非(NOT)函数:

4-13

XNOR函数(输入的两个值必须一样,均为1或均为0),即

$XNOR=(x_1ANDx_2)OR((NOTx_1)AND(NOTx_2))$

首先得到$(NOTx_1)AND(NOTx_2)$的神经元:

4-14

将$AND$神经元与$(NOTx_1)AND(NOTx_2)$​的神经元以及$OR$​神经元进行组合,

4-15

实现了XNOR运算功能的神经网络

神经网络的优势在于可以构造出很多复杂的杉树,得到更加厉害的特征值。

多类分类问题

4-16

相关文章
|
10月前
|
机器学习/深度学习 数据采集 运维
机器学习在网络流量预测中的应用:运维人员的智慧水晶球?
机器学习在网络流量预测中的应用:运维人员的智慧水晶球?
504 19
|
10月前
|
机器学习/深度学习 算法 数据安全/隐私保护
基于机器学习的人脸识别算法matlab仿真,对比GRNN,PNN,DNN以及BP四种网络
本项目展示了人脸识别算法的运行效果(无水印),基于MATLAB2022A开发。核心程序包含详细中文注释及操作视频。理论部分介绍了广义回归神经网络(GRNN)、概率神经网络(PNN)、深度神经网络(DNN)和反向传播(BP)神经网络在人脸识别中的应用,涵盖各算法的结构特点与性能比较。
|
11月前
|
机器学习/深度学习 边缘计算 运维
机器学习在网络安全中的防护:智能化的安全屏障
机器学习在网络安全中的防护:智能化的安全屏障
522 15
|
机器学习/深度学习 人工智能 数据挖掘
打破传统:机器学习与神经网络获2024年诺贝尔物理学奖引发的思考
诺贝尔物理学奖首次授予机器学习与神经网络领域,标志该技术在物理学研究中的重要地位。本文探讨了这一决定对物理学研究的深远影响,包括数据分析、理论物理突破及未来科研方向的启示,同时分析了其对学术跨界合作与全球科研产业的影响。
246 4
|
机器学习/深度学习 数据采集 算法
机器学习在医疗诊断中的前沿应用,包括神经网络、决策树和支持向量机等方法,及其在医学影像、疾病预测和基因数据分析中的具体应用
医疗诊断是医学的核心,其准确性和效率至关重要。本文探讨了机器学习在医疗诊断中的前沿应用,包括神经网络、决策树和支持向量机等方法,及其在医学影像、疾病预测和基因数据分析中的具体应用。文章还讨论了Python在构建机器学习模型中的作用,面临的挑战及应对策略,并展望了未来的发展趋势。
833 1
|
机器学习/深度学习 自然语言处理 算法
深入理解机器学习算法:从线性回归到神经网络
深入理解机器学习算法:从线性回归到神经网络
|
机器学习/深度学习 人工智能 算法
【玉米病害识别】Python+卷积神经网络算法+人工智能+深度学习+计算机课设项目+TensorFlow+模型训练
玉米病害识别系统,本系统使用Python作为主要开发语言,通过收集了8种常见的玉米叶部病害图片数据集('矮花叶病', '健康', '灰斑病一般', '灰斑病严重', '锈病一般', '锈病严重', '叶斑病一般', '叶斑病严重'),然后基于TensorFlow搭建卷积神经网络算法模型,通过对数据集进行多轮迭代训练,最后得到一个识别精度较高的模型文件。再使用Django搭建Web网页操作平台,实现用户上传一张玉米病害图片识别其名称。
237 0
【玉米病害识别】Python+卷积神经网络算法+人工智能+深度学习+计算机课设项目+TensorFlow+模型训练
|
机器学习/深度学习 安全 网络安全
利用机器学习优化网络安全威胁检测
【9月更文挑战第20天】在数字时代,网络安全成为企业和个人面临的重大挑战。传统的安全措施往往无法有效应对日益复杂的网络攻击手段。本文将探讨如何通过机器学习技术来提升威胁检测的效率和准确性,旨在为读者提供一种创新的视角,以理解和实施机器学习在网络安全中的应用,从而更好地保护数据和系统免受侵害。
|
机器学习/深度学习 人工智能 安全
人工智能与机器学习在网络安全中的应用
人工智能与机器学习在网络安全中的应用
395 0
|
机器学习/深度学习 存储 算法
基于机器学习的地震预测(Earthquake Prediction with Machine Learning)(下)
基于机器学习的地震预测(Earthquake Prediction with Machine Learning)
377 0