什么是深度学习?
深度学习 ( DL )是 机器学习(ML) 的子领域,它使用的算法类似于神经元在人脑中的使用方式。深度学习根据人类大脑的工作方式创建人工神经网络和分层。深度学习是一种机器学习技术,它教计算机我们人类轻松自然地做的事情 —— 从我们遇到的例子中学习。
你可以在无人驾驶汽车中看到深度学习技术,这种技术能够区分红灯和绿灯,将人从路边辨别出来,甚至可以衡量两辆汽车之间的距离。这项技术可以实现手机的语音激活、在电视上进行人脸识别以及在个人设备上进行手势操作。近年来,深度学习一直有充分的理由引起大量关注。
深度学习的历史
回到它的起源,深度学习首次出现于 1943 年,当时沃伦·麦卡洛赫和沃尔特·皮茨使用数学和算法创建复制神经网络的计算系统。20 世纪 50 年代、60 年代、70 年代和 80 年代取得了一些小的进展。深度学习的最大演变发生在 1999 年,当时计算机处理速度和图形处理单元被开发出来。在未来十年中,笨拙而低效的系统变得快 1000 倍。
直到 2005 年前后,深度学习才开始作为一个术语在技术对话中经常出现。杰弗里·辛顿和鲁斯兰·萨拉克霍特迪诺夫发表了一篇论文,解释了如何训练包含多层的神经网络 —— 一次一个层 —— 在那时这个词就变得流行了。通过在 2012 年使用可以识别猫的算法,谷歌将事情提升到了新的水平。它被称为 “猫咪实验”,利用无人监督的学习向系统展示 10,000,000 张猫的图像,并训练它以识别猫。这是部分成功,比其先辈做的更好,但识别的猫不到 16%。
然后,谷歌在两年后投资了总部位于英国的情报初创企业深度思维(DeepMind) ,2016 年谷歌深度思维的算法阿尔法狗 (AlphAgo) 通过学习复杂的棋盘游戏 Go 创造了历史,在首尔的比赛中击败一名职业人类玩家。
深度学习是机器学习的子领域,是一个通过研究自己的算法不断学习和改进的领域。深度学习将其工作建立在模仿人类思维而创造的人造神经网络上。直到最近,这些神经网络的计算能力有限,因此复杂性也有限。
随着 大数据分析 的飞跃进步,神经网络变得越来越复杂而精巧。这导致计算机在观察、学习和应对复杂情况方面加快步伐,有时比人类思想更快。模型将继续使用大量标记数据和具有多层的神经网络进行训练。借助图像分类、翻译能力和语音识别技术,深度学习甚至在完全没有人工帮助的情况下解码模式识别。

深度学习实现了什么?
深度学习是我们日常生活的一部分。例如,当你在 Facebook 上传照片时,深度学习会通过自动标记朋友来帮助您。如果您使用像 Siri、Cortana 或 Alexa 这样的数字助手,自然语言处理和语音识别就是帮助他们为你服务的原因。在 Skype 上与国际客户会面时,您可以实时收听翻译。您的电子邮件服务提供商无需您自己操作即可识别垃圾邮件。这份清单可以一直列下去。
像谷歌这样的巨头多年来一直在利用深度学习,并且目前正致力于提供更高级别的解决方案。他们能够生成模仿人类声音的语音,而且听起来像语音系统一样自然。谷歌翻译利用深度学习和图像识别来进行语音翻译和书面语言识别。谷歌的 PlaNet 可以告诉您拍摄照片的任何地方,其 TensorFlow 已经开发了一系列人工智能 (AI) 应用程序。
现在有许多行业将深度学习作为其功能的核心:
航空航天和国防
深度学习被广泛用于帮助卫星识别具体物体或关心的区域,并将其归类为对士兵来说安全的或不安全的。
医学研究
医学研究领域广泛使用深度学习。例如,在正在进行的癌症研究中,深度学习用于自动检测癌细胞的存在。加州大学洛杉矶分校的人们创建了一款先进的显微镜,它使用高端数据教授深度学习应用程序如何精确识别癌细胞。深度学习的范围最终将允许医学研究创造出专为人的基因组结构量身定制的个性化药物。
工业自动化
重型机械行业需要大量安全措施。深度学习通过检测到重型机器不安全半径范围内的任何人或物体,来提高工人在此类环境中的安全性。
聊天机器人和服务机器人
深度学习驱动了与客户互动的所有聊天机器人和服务机器人,使他们能够为日益复杂的语音和文本查询提供智能答案。这是不断发展的。
图像着色
曾经是手动完成的长期任务现在可以委托给计算机。可以使用深度学习算法为黑白图像着色,深度学习算法能够将图像的内容放在上下文中,然后用正确的颜色准确地重新创建它们。
面部识别
此利用深度学习的功能不仅被用于一系列安全目的,而且很快将允许在商店购买。面部识别已在机场广泛使用,以实现无缝、无纸化的办理登机手续。深度学习将使事情更进一步发展,使面部识别即使在人们发型变化或照明不够理想的情况下作为付款手段。
深度学习如何运作?
为了了解计算机如何使用深度学习,他们使用的过程类似于幼儿正在学习如何识别狗。正如成年人所说的那样,幼儿首先学习如何将图片与狗这个词联系起来。孩子继续前进,将叫声与狗关联起来。然后,孩子开始使用几种发音变体说出这个词,直到他们作对为止。
同样,计算机程序具有层次结构,并且每个级别的算法对输入应用一定级别的转换(这就是它学习的),并创建一个统计模型作为输出参考。将各种迭代(就像小孩学习识别狗一样)都考虑在内,直到达到所需的准确性水平。为了达到最终水平,数据需要经历的几个层或功能集是导致该技术被称为 “深度” 学习的原因。
对于孩子和受监督的机器学习,每个水平都必须受到监督,指令必须具体。对于孩子来说,它取决于父母,对于机器学习来说,它基于程序员或 数据科学家 的技能,他们定义了识别狗的数据集。在深度学习的情况下,该计划更快、准确地为自己构建功能集,无需监督。
孩子需要几个月才能与狗建立正确的联系。对于基于深度学习算法的计算机程序,这可以在几分钟内实现,因为它可以准确扫描许多图像并挑选出其中的狗。为了达到并持续保持这样的准确性水平,深度学习计划不仅需要处理能力,还大量的数据来进行培训。在云计算和大数据到来之前,这两者都无法轻松地被程序员使用。
由于现在可用的数据足够多,深度学习程序已经获得了使用自己的迭代驱动输出创建复杂分层模型的能力。他们能够利用大量的非结构化原始数据创建非常精确的预测模型。展望未来,这将在支持 物联网 (IoT) 方面发挥重要作用,因为人类和机器生成的大多数数据都是非结构化的,因此最好由深度学习而不是人类处理。
创建强大的深度学习方法
有几种方法可供创建强大的深度学习模型。
学习率衰减
这是一个超级参数,可能是深度学习最重要的参数。它决定了每次因素变化时模型对估计误差量的响应而改变自身的程度。当学习率很高时,系统对于培训过程来说变得太不稳定。如果他们太低,培训所需时间的可能性很高。准确配置学习速率衰减意味着学习速率可以调整,以便在减少训练时间的同时保持提高性能能力。
转移学习
此过程在于让模型对已知的相关任务执行分析。现有网络将提供未分类的新数据。调整到位后,将以更好的分类能力执行任何新的任务。使用这种方法,所需的数据量可以减少,从而缩短计算时间。
自下而上的训练
在这种方法中,开发人员将汇总大量标签数据。然后,对网络体系结构进行配置,以便它能够了解功能和模型。这种方法非常适合创建新应用程序以及可能需要多个输出的应用程序。但是,由于需要大量数据,它增加了培训所需的时间,因此这仍然是较少使用的一种方法。
中途退出方法
考虑到大量参数,这种方法解决了网络中过度拟合的问题。过度拟合是在训练数据上开发的算法,不适合真实数据。就监督学习而言,中途退出方法在提高神经网络的表现方面,尤其是在语音识别和文档分类以及计算生物学领域,具有可靠的业绩记录。
深度学习为人工智能和机器学习领域提供了巨大的推动力。深度学习能够以更轻松的方式来分析任务,从而更轻松地协助任何机器并使之前仅限人工的任务成为可能,这是其优点。人工智能是未来,在深度学习的帮助下,您在电影中看到的东西可能会在这一生中成为现实。