¿Qué es Deep Learning?

Deep Learning (DL) es un subcampo de Machine Learning (ML) que utiliza algoritmos de forma similar a la forma en que se utilizan las neuronas en el cerebro humano. Deep Learning crea redes y capas neuronales artificiales basadas en cómo funciona el cerebro humano. Deep Learning es una técnica de Machine Learning que enseña a los ordenadores lo que los humanos hacemos de manera fácil y natural: aprendemos de los ejemplos con los que nos encontramos.

Diagrama de Deep Learning

Puede ver la tecnología de Deep Learning en los automóviles sin conductor, que pueden distinguir una luz roja de una verde, un ser humano desde un lado de la acera e incluso medir la distancia entre dos automóviles. Es la tecnología que permite la activación por voz de su teléfono móvil, el reconocimiento facial en su televisor y las operaciones de gestos en sus dispositivos personales. Deep Learning ha recibido una gran atención en los últimos años y con muy buenas razones.

La historia de Deep Learning

Volviendo a sus orígenes, Deep Learning apareció por primera vez en 1943 cuando Warren McCulloch y Walter Pitts utilizaron matemáticas y algoritmos para crear un sistema informático que replicaba las redes neuronales. Se hicieron pequeños avances durante las décadas de 1950, 1960, 1970 y 1980. La mayor evolución de Deep Learning tuvo lugar en 1999, cuando se desarrollaron la velocidad de procesamiento informático y las unidades de procesamiento gráfico. Durante los siguientes diez años, los sistemas toscos e ineficientes se volvieron 1000 veces más rápidos.

Fue solo a mediados de la década de 2000 que Deep Learning como término comenzó a surgir regularmente en las conversaciones sobre tecnología. El término se hizo popular cuando Geoffrey Hinton y Ruslan Salakhutdinov publicaron un artículo que explicaba cómo se podía entrenar una red neuronal que comprende múltiples capas con una capa a la vez. Google llevó las cosas al siguiente nivel en 2012 con un algoritmo que podía reconocer gatos. Conocido como The Cat Experiment, utilizó el aprendizaje sin supervisión para mostrar 10.000.000 de imágenes de gatos a un sistema y entrenarlo para reconocer gatos. Fue un éxito parcial, lo hizo mejor que sus antepasados, pero reconoció menos del 16 por ciento de los gatos que se mostraron.

Luego, Google invirtió en DeepMind, una empresa de inteligencia artificial con sede en el Reino Unido, dos años después, y en 2016, el algoritmo AlphaGo de Google DeepMind creó historia al aprender el complejo juego de mesa Go, y luego venció a un jugador humano profesional en una competencia en Seúl.

Deep Learning, un subcampo del aprendizaje automático, es un campo que está aprendiendo y mejorando constantemente al observar sus propios algoritmos. Deep Learning basa su trabajo en redes neuronales artificiales que se crean para imitar el pensamiento humano. Hasta hace poco, estas redes neuronales tenían una potencia informática limitada, lo que resultaba en una complejidad también limitada.

Con el avance de la analítica Big Data a pasos agigantados, las redes neuronales se han vuelto más complejas y sofisticadas, lo cual dio lugar a que los ordenadores aceleren el ritmo de la observación, el aprendizaje y la reacción a situaciones complejas, a veces más rápido de lo que lo haría una mente humana. Los modelos continúan entrenándose con grandes conjuntos de datos etiquetados y redes neuronales que tienen una multitud de capas. Con la ayuda de la clasificación de imágenes, las capacidades de traducción y la tecnología de reconocimiento de voz, Deep Learning incluso decodifica el reconocimiento de patrones sin ninguna ayuda humana.

Deep Learning con Data Science
Pruebe TIBCO Data Science - Prueba gratuita
Democratice, colabore y ponga en funcionamiento a Machine Learning en toda su organización con TIBCO Data Science.

¿Qué puede lograr Deep Learning?

Deep Learning es parte de nuestra vida diaria. Por ejemplo, cuando sube fotografías a Facebook, Deep Learning le ayuda a etiquetar a sus amigos automáticamente. Si utiliza asistentes digitales como Siri, Cortana o Alexa, el procesamiento del lenguaje natural y el reconocimiento de voz es lo que les ayuda a ser útiles. Cuando se reúne con sus clientes internacionales en Skype, escucha las traducciones en tiempo real. Su proveedor de servicios de correo electrónico reconoce el correo no deseado sin necesidad de que lo haga usted mismo. La lista sigue y sigue.

Un gigante como Google ha estado aprovechando Deep Learning durante años y ahora está trabajando para ofrecer soluciones de nivel superior. Pudieron generar un lenguaje que imita la voz y los sonidos humanos de la forma más natural posible con sus sistemas de habla. Google Translate emplea Deep Learning y el reconocimiento de imágenes para trabajar en la traducción de voz y el reconocimiento de lenguajes escritos. PlaNet de Google puede decirle dónde se tomó una foto y su TensorFlow ha producido una variedad de aplicaciones de inteligencia artificial (AI).

Existe una variedad de industrias que ahora tienen Deep Learning en el centro de su funcionamiento:

Sector aeroespacial y de defensa

Deep Learning se utiliza ampliamente para ayudar a los satélites a identificar objetos o áreas de interés específicos y clasificarlos como seguros o inseguros para los soldados.

Investigación médica

El campo de la investigación médica utiliza ampliamente Deep Learning. Por ejemplo, en la investigación sobre el cáncer en curso, se utiliza Deep Learning para detectar automáticamente la presencia de células cancerosas. Las mentes de UCLA crearon un microscopio avanzado que utiliza datos de alta gama para enseñar a una aplicación de Deep Learning cómo identificar células cancerosas con precisión. El alcance de Deep Learning eventualmente permitirá que la investigación médica desarrolle medicamentos personalizados que se adapten a la estructura del genoma de una persona.

Automatización industrial

El sector de la maquinaria pesada es uno que requiere una gran cantidad de medidas de seguridad. Deep Learning ayuda a mejorar la seguridad de los trabajadores en dichos entornos al detectar cualquier persona u objeto que se encuentre dentro del radio inseguro de una máquina pesada.

Chatbots y Service Bots

Deep Learning impulsa todos los chatbots y Service Bots que interactúan con los clientes y les permite brindar respuestas inteligentes a consultas cada vez más complejas basadas en voz y texto, lo cual está en constante evolución.

Colorización de imágenes

Lo que antes era una tarea que se hacía manualmente y durante un largo período de tiempo, ahora se puede confiar a los ordenadores. Las imágenes en blanco y negro se pueden colorear utilizando algoritmos de Deep Learning que pueden colocar el contenido de la imagen en contexto y recrearlo con precisión con los colores adecuados.

Reconocimiento facial

Esta función que utiliza Deep Learning se está utilizando no solo para una variedad de propósitos de seguridad, sino que pronto permitirá las compras en las tiendas. El reconocimiento facial ya se está utilizando ampliamente en los aeropuertos para permitir la facturación sin papeles y sin problemas. Deep Learning llevará las cosas un paso más allá, permitiendo que el reconocimiento facial sea un medio para realizar pagos incluso en situaciones en las que la persona tuvo un cambio de peinado o donde la iluminación no fue la óptima.

¿Cómo funciona Deep Learning?

Para comprender cómo los ordenadores usan Deep Learning, utilizan un proceso similar al de un niño pequeño que intenta aprender a identificar a un perro. Un niño pequeño primero aprende a asociar una imagen con la palabra perro como la dice un adulto. El niño pasa a asociar el sonido de los ladridos a un perro. Luego, el niño comienza a decir la palabra con variaciones de pronunciación hasta que lo hace bien.

De la misma manera, los programas de computación tienen una jerarquía y el algoritmo en cada nivel aplica un nivel de transformación a la entrada (que es el aprendizaje que realiza) y crea un modelo estadístico como referencia para la salida. Varias iteraciones (al igual que el niño que aprende a reconocer al perro) se tienen en cuenta hasta que se alcanza el nivel de precisión necesario. Las diversas capas o conjuntos de características por las que los datos deben atravesar para poder alcanzar el nivel final es lo que llevó a que la tecnología se denominara aprendizaje 'profundo'.

En el caso de un niño y Machine Learning supervisado, todos los niveles deben ser supervisados y las instrucciones deben ser específicas. Para un niño, depende del padre, para ML, se basa en las habilidades del programador o científico de datos que define el conjunto de datos que identifica a un perro. En el caso de Deep Learning, el programa crea conjuntos de funciones para sí mismo sin supervisión, de forma más rápida y precisa.

Un niño tardará meses en poder hacer la asociación correcta con un perro. Para un programa de un ordenador que se basa en algoritmos de Deep Learning, esto se puede lograr en cuestión de minutos, ya que escanea con precisión decenas de imágenes y selecciona los perros en ellas. Para lograr estos niveles de precisión y mantenerlos constantemente, los programas de Deep Learning necesitan enormes cantidades de datos para el entrenamiento y la potencia de procesamiento. Ninguno de los dos era de fácil acceso para los programadores hasta que llegaron la computación en la nube y Big Data.

Con suficientes datos ahora disponibles, los programas de Deep Learning ganaron la capacidad de crear modelos jerárquicos complejos con su propia salida potenciada por iteraciones. Pueden crear modelos predictivos extremadamente precisos a partir de grandes cantidades de datos brutos no estructurados. En el futuro, esto jugará un papel importante en la habilitación de Internet de las cosas (IoT), ya que la mayoría de los datos producidos por seres humanos y por máquinas no están estructurados y, por lo tanto, se manejan mejor mediante Deep Learning en lugar de los seres humanos.

Creación de métodos sólidos de Deep Learning

Existen varios enfoques para crear modelos sólidos de DL.

Caída de la tasa de aprendizaje

Este es un hiperparámetro que podría ser el parámetro más importante para Deep Learning. Determina cuánto se modifica el modelo como respuesta a la cantidad estimada de error, cada vez que hay un cambio en los factores. Cuando la tasa de aprendizaje es alta, el sistema se vuelve demasiado inestable para los procesos de capacitación. Si son demasiado bajos, las posibilidades de que el entrenamiento tarde más de lo necesario son altas. Configurar con precisión la caída de la tasa de aprendizaje significa que la tasa de aprendizaje se adaptará para seguir aumentando las capacidades de rendimiento mientras se reduzca el tiempo de capacitación necesario.

Transferencia de aprendizaje

Este proceso consiste en hacer que un modelo realice un análisis de una tarea relacionada con una que ya conoce. La red existente recibe nuevos datos que no están clasificados. Cuando se implementen los ajustes, cualquier nueva tarea emprendida se realizará con mejores capacidades de categorización. Con este enfoque, se reduce la cantidad de datos necesarios, lo que también reducirá el tiempo de computación.

Capacitación de abajo hacia arriba

En este enfoque, el desarrollador agregará grandes cantidades de datos etiquetados. A continuación, se configurará la arquitectura de red para que pueda conocer las características y el modelo. Este enfoque funciona muy bien para la creación de nuevas aplicaciones, así como para aquellas que pueden requerir varios resultados. Sin embargo, sigue siendo uno de los enfoques menos utilizados debido a la gran cantidad de datos necesarios, lo que aumenta el periodo de la capacitación.

Enfoque de abandono

Este método resuelve el problema de la sobrevaloración en redes considerando la gran cantidad de parámetros. La sobrevaloración es cuando los algoritmos desarrollados en los datos de entrenamiento no se ajustan a los datos reales. El enfoque de abandono tiene un historial probado en la mejora del rendimiento de las redes neuronales en lo que respecta al aprendizaje supervisado, particularmente en los sectores de reconocimiento de voz y la clasificación de documentos, así como en biología computacional.

Deep Learning ha dado un gran impulso al campo de la inteligencia artificial y ML. Su punto fuerte es la capacidad de Deep Learning para analizar las tareas de tal manera que sea más fácil ayudar a cualquier máquina y hacer posibles las tareas que antes eran solo humanas. La AI es el futuro y, con la ayuda de Deep Learning, las cosas que observa en las películas podrían ser una realidad.