什么是神经网络?

人工神经网络 (ANN),通常被称为神经网络 (NN),是受构成人类大脑的生物神经网络启发的计算系统。

神经网络图

神经网络:简史

神经网络听起来像令人振奋的新技术,但这个领域本身并不是什么新鲜事物。1958 年,美国心理学家弗兰克·罗森布拉特 (Frank Rosenblatt) 构思并试图建造一种反应像人类思维一样的机器。他将自己的机器命名为 “感知器”。

出于所有实际目的,人工神经网络以类似人类的方式通过范例进行学习。外部输入的接收、处理和操作方式与人脑相同。

神经网络的分层结构

我们知道,人脑的不同部分是用来处理各种信息的。大脑的这些部分按层次排列。当信息进入大脑时,神经元的每一层或每一级都会完成其特殊的工作,即处理传入的信息,获得洞见,然后将它们传递到下一个更高级的层。例如,当你走过一家面包店时,你的大脑会分阶段对新鲜出炉的面包的香味做出反应:

  • 数据输入:新鲜出炉的面包的味道
  • 想法:这让我想起了我的童年
  • 决策:我想我会买一些面包
  • 记忆:但我已经吃过午饭了
  • 推理:也许我可以吃点零食
  • 行动:我要买一个那种面包

这就是大脑分阶段运作的方式。人工神经网络的工作方式类似。神经网络试图模拟这种多层次的方法来处理各种信息输入并根据它们做出决策。

在细胞或单个神经元层面,功能是微调的。神经元是大脑中的神经细胞。神经细胞具有称为树突的细小延伸。它们接收信号,然后将其传输到细胞体。细胞体处理刺激,并决定触发网络中其他神经元的信号。如果细胞决定这样做,细胞体上被称为轴突的延伸部分将通过化学传输将信号传递给其他细胞。神经网络的运作灵感来自于我们大脑中神经元的功能,尽管其技术作用机制与生物学机制不同。

超融合分析:沉浸式、智能式和实时式
超融合分析:沉浸式、智能式和实时式
借助超融合分析,加快生成洞见并提升业务成果。

神经网络如何以类似于人脑的方式运作

最基本形式的人工神经网络有三层神经元。信息从一层神经元流向另一层,就像在人脑中一样:

  • 输入层:数据进入系统的入口点
  • 隐藏层:处理信息的地方
  • 输出层:系统根据数据决定如何继续操作的位置

更复杂的人工神经网络拥有多层,有些是隐藏的。

神经网络通过节点或连接单元的集合来运行,就像人工神经元一样。这些节点松散地模拟动物大脑中的神经元网络。就像人类一样,人造神经元以刺激的形式接收信号,对其进行处理,并向与其连接的其他神经元发出信号。

相似之处也就仅此而已。

人工神经网络的神经元运作

在人工神经网络中,人工神经元以实数信号的形式接受刺激。然后:

  • 每个神经元的输出由其输入之和的非线性函数计算。
  • 神经元之间的连接称为边缘。
  • 神经元和边缘都有权重。此参数会随着学习的进行而调整和更改。
  • 权重会增加或减小连接处信号的强度。
  • 神经元可能有一个阈值。只有当聚合信号超过此阈值时,才会向前发送信号。

如前所述,神经元聚合成层。不同的层可能会对其输入进行不同的修改。信号以上面讨论的方式从第一层(输入层)移动到最后一层(输出层),有时会在层之间多次穿越。

神经网络本质上包含某种形式的学习规则,它根据神经连接所呈现的输入模式修改神经连接的权重,就像成长中的孩子学会从动物的示例中识别动物。

神经网络和深度学习

谈到神经网络,就不可能不提深度学习。尽管“神经网络” 和 “深度学习” 这两个术语彼此不同,但通常互换使用。然而,两者是密切相关的,因为一方依赖另一方发挥作用。如果神经网络不存在,深度学习也不存在:

  • 深度学习成了已处于前沿的实体人工智能的优势。
  • 深度学习不同于机器学习,后者旨在教会计算机处理数据和从数据中学习。
  • 借助深度学习,计算机可以不断训练自己处理数据、从中学习数据并构建更多功能。更复杂的人工神经网络的多个层次使之成为可能。
  • 复杂的神经网络包含输入层和输出层,就像简单形式的神经网络一样,但它们也包含多个隐藏层中。因此,它们被称为深度神经网络,有利于深度学习。
  • 深度学习系统会自学,并随着发展变得更加 “知识渊博”,通过多个隐藏层过滤信息,其方式类似于人类大脑的所有复杂性。

为什么深度学习对组织很重要

深度学习就像新的淘金热或科技界的最新石油发现。深度学习的潜力激起了大型成熟企业以及新兴初创公司以及其他各种公司的兴趣。为什么?

这是数据驱动的大环境的一部分,特别是由于大数据重要性的提升。如果你将互联网衍生的数据视为存储在数据库、数据仓库和数据湖中的原油,等待使用各种数据分析工具进行钻探,那么深度学习就是炼油厂,它将原油数据转换为你可以使用的最终产品。

市场中充斥着因数据催生的各种分析工具,深度学习是这些数据的终结者:没有高效和最先进的处理单元,提取任何有价值的东西都是空谈。

深度学习有可能通过自动执行重复性任务来取代人类。但是,深度学习无法取代人类科学家或工程师创建和维护深度学习应用程序的思维过程。

区分机器学习和其他类型的学习

机器学习

说到机器学习的方法,关键在于训练学习算法,例如线性回归、K 均值、决策树、随机森林、k 最近邻 (KNN) 算法以及支持向量机 (支持向量机) 算法。

这些算法会筛选数据集,随着数据集的发展而不断学习,以适应新的情况,并寻找有趣且富有洞见的数据模式。数据是这些算法发挥最佳作用的关键基础。

监督学习

可以对用于训练机器学习的数据集进行标注。该数据集附带答案,用于告知计算机正确答案。例如,扫描收件箱中是否有垃圾邮件的计算机可以参考带标签的数据集,以了解哪些电子邮件是垃圾邮件,哪些是合法电子邮件。这就是所谓的监督学习。监督回归或分类是通过线性回归和 K 最近邻算法实现的。

无监督学习

如果没有对数据集进行标注,并且使用诸如 K-means 之类的算法,在没有任何参考表的情况下将其定向到聚合聚类模式,则称为无监督学习

神经网络和模糊逻辑

顺便说一句,区分神经网络和模糊逻辑也很重要。模糊逻辑允许根据不精确或模糊的数据做出具体决策。另一方面,神经网络试图在不首先设计数学模型的情况下加入类似人类的思维过程来解决问题。

神经网络与传统计算有何不同?

为了更好地理解计算如何与人工神经网络一起工作,必须了解传统的 “串行” 计算机及其软件过程信息。

串行计算机具有中央处理器,该中央处理器可以寻址存储数据和指令的存储器位置阵列。处理器从存储器地址中读取指令和指令所需的任何数据。然后执行该指令,并将结果保存在指定的存储位置。

在串行系统或标准并行系统中,计算步骤是确定的、按顺序执行且符合逻辑。此外,给定变量的状态可以从一个操作跟踪到另一个操作。

神经网络的工作原理

相比之下,人工神经网络既不是按顺序执行的,也不一定是确定的。它们不包含任何复杂的中央处理器。相反,它们由几个简单的处理器组成,这些处理器从其他处理器获取其输入的加权总和。

神经网络不执行编程指令。它们对呈现给它的输入模式并行(以模拟方式或实际方式)响应。

神经网络不包含任何单独的内存地址用于数据存储。相反,信息包含在网络的整体激活状态中。知识由网络本身代表,实际上它远远超过了其各个组成部分的总和。

神经网络相对于传统技术的优势

如果存在关系是动态或非线性的问题,可以期望神经网络非常有效地进行自我训练。如果内部数据模式很强,这种能力将进一步增强。它在某种程度上还取决于应用程序本身。

神经网络是标准技术的分析替代方案,在某种程度上仅限于诸如线性、正态性和变量独立性的严格假设等概念。

借助神经网络检查各种关系的能力,用户可以更轻松地快速对可能很难甚至不可能理解的现象进行建模。

您是哪位数据科学超级英雄?
您是哪位数据科学超级英雄?
下载此电子书,了解自己作为数据科学家脱颖而出所需的六大技能。

神经网络的局限性

潜在用户应该注意一些具体问题,特别是与反向传播神经网络和某些其他类型的网络有关的问题。

流程无法解释

反向传播神经网络被称为终极黑匣子。除了概述一般架构并可能使用一些随机数作为种子之外,用户需要做的就是提供输入,继续训练,然后接收输出。某些软件包允许用户对网络随时间推移的进度进行采样。在这些情况下,学习本身会自行进展。

最终输出是一个经过训练的自主网络,因为它不提供定义超出其自身内部数学关系的方程或系数。网络本身就是这种关系的最终方程式。

训练速度较慢

此外,反向传播网络的训练速度往往比其他类型的网络慢,有时需要数千个周期。这是因为机器的中央处理器必须分别计算每个节点和连接的功能。这可能非常麻烦,并且会在包含大量数据的超大型网络中引起问题。但是,当代机器的工作速度确实快到足以避开这个问题。

神经网络的应用

神经网络是通用的近似值。如果系统具有较高的误差容忍度,它们恰好能发挥最佳效果。

神经网络的用处:

  • 用于理解关联或发现一组模式中的常规元素
  • 无论是数量还是参数的多样性,数据都非常庞大
  • 变量之间的关系被模糊地理解
  • 传统方法在描述关系方面不充分的地方

这种受生物学启发的美好范例是我们这个时代最精妙的技术发展之一。