¿Qué es el aprendizaje no supervisado?
El aprendizaje no supervisado es una de las formas en que Machine Learning (ML) "aprende" los datos. El aprendizaje no supervisado tiene datos sin etiquetar que el algoritmo tiene que intentar entender por sí mismo. El aprendizaje supervisado es en el que se etiquetan los conjuntos de datos para que haya una clave de respuestas con la que la máquina pueda medir su precisión. Si Machine Learning fuera un niño que aprendiera a andar en bicicleta, el aprendizaje supervisado es el padre que corre detrás de la bicicleta y la sostiene en posición vertical. El aprendizaje no supervisado consiste en entregar la bicicleta, darle palmaditas en la cabeza al niño y decirle "buena suerte".
El objetivo es simplemente dejar que la máquina aprenda sin ayuda o indicaciones de los los científicos de datos. En el camino, también deberá aprender a ajustar los resultados y agrupaciones cuando haya resultados más adecuados, permitiendo que la máquina comprenda los datos y los procese como mejor le parezca.
El aprendizaje no supervisado se utiliza para explorar datos desconocidos. Puede revelar patrones que podrían haberse pasado por alto o examinar grandes conjuntos de datos que serían demasiado para que los abordara una sola persona.
¿Cómo funciona el aprendizaje no supervisado?
Para comprender el aprendizaje no supervisado, antes, tendremos que comprender el aprendizaje supervisado. Si una computadora estuviera aprendiendo a identificar frutas en un entorno de aprendizaje supervisado, se le darían imágenes de ejemplo de frutas etiquetadas, a esto se le llama datos de entrada. Por ejemplo, las etiquetas dirían que los plátanos son largos, curvos y amarillos, que las manzanas son redondas y rojas, mientras que una naranja es esférica, de aspecto ceroso y anaranjada. Después de un tiempo conveniente, la máquina debería poder identificar con seguridad qué fruta es cuál, basándose en esos descriptores. Si se le presenta una manzana, por ejemplo, podría decir con seguridad que no es de color naranja, por lo tanto, no es una naranja, pero también que no es amarilla y larga, por lo tanto, no es un plátano. Entonces, será una manzana debido a que es redonda y roja.
Por el contrario, el aprendizaje no supervisado es cuando no existe ninguna categorización o etiquetado de los datos. La máquina no tendrá idea del concepto de fruta, por lo que no podrá etiquetar los objetos. Sin embargo, podrá agruparlos según sus colores, tamaños, formas y diferencias. La máquina agrupará las cosas de acuerdo con las similitudes, encontrando estructuras y patrones ocultos en datos sin etiquetar. No existe un camino correcto o incorrecto, ni tampoco un maestro. No existen resultados, solo un análisis puro de los datos.
El aprendizaje no supervisado utiliza una variedad de algoritmos para ajustar los datos en grupos amplios, clústeres y asociaciones.

Algoritmos de agrupación en clústeres en el aprendizaje no supervisado
La agrupación en clústeres se presenta cuando los objetos se agrupan en subconjuntos llamados clústeres. Esta es una de las mejores formas de obtener una descripción general de la estructura de sus datos. Habrá algunas características similares en estos grupos. Este método está diseñado para tener grupos con las mismas características y luego asignarlos a los respectivos clústeres.
Agrupación en clústeres jerárquica
Esto ocurre cuando la máquina agrupa las cosas que van juntas en un árbol de clústeres. Todos los datos son un grupo, luego se dividen en grupos cada vez más pequeños. Los datos pertenecerán a un conjunto en cascada de clústeres, desde los más genéricos hasta los más específicos y estrechamente agrupados. Entonces, el resultado final será que usted verá cómo los diferentes subgrupos se relacionan entre sí o qué tan separados están.
Agrupación en clústeres k-medias
Este algoritmo separa los datos en distintos clústeres que no se etiquetaron en los datos. Según la precisión de la asociación los datos están más o menos cerca del centro. Los puntos de datos pueden pertenecer a un solo clúster. Una k más amplia significa que el grupo es más pequeño y con más granularidad. A cada clúster se le asigna una etiqueta de punto de datos.
Modelos de mezcla gaussiana
Sobre la base de una distribución de curva de campana normal, los clústeres de grupos se distribuyen a lo largo de las densidades normales previstas, mostrando subpoblaciones en los datos generales.
Agrupación en clústeres difusa
Estos clústeres pueden superponerse, por lo que cada punto de datos puede pertenecer a tantos clústeres como sea relevante en contraposición a los clústeres no difusos donde los puntos de datos solo pueden pertenecer a un clúster. Este es el diagrama de Venn del mundo del aprendizaje no supervisado.
La agrupación en clústeres asume relaciones entre grupos, por lo que no siempre es la mejor manera de segmentar los clientes. Este algoritmo no trata los puntos de datos como individuos. Usted necesitará aplicar más métodos estadísticos para analizar los datos en más detalle.
Asociación en el aprendizaje no supervisado
En Machine Learning, el algoritmo crea reglas que detectan asociaciones entre puntos de datos. Se detectan las relaciones entre variables y se identifican elementos que tienden a ocurrir juntos. Por ejemplo, si se analizan canastas en el supermercado se identifican los artículos que la gente tiende a comprar al mismo tiempo, por ejemplo: sopa y panecillos. O, cuando la gente compra una casa nueva, ¿qué otras cosas nuevas compra probablemente? Este algoritmo es excelente para identificar oportunidades de marketing.
Modelos de variables latentes en el aprendizaje no supervisado
Un modelo de variables latentes muestra la relación entre las variables observables (o variables manifiestas) y las que están ocultas o no se pueden observar (variables latentes). Los modelos de variables latentes se utilizan principalmente en el procesamiento previo o limpieza de datos, para reducir las características de un conjunto de datos o dividir el conjunto de datos en varios componentes.
¿Cuándo se prefiere el entrenamiento no supervisado para tendencias y patrones desconocidos?
Debido a que la máquina no sabe que existe una respuesta 'correcta', permitir que las decisiones se tomen sobre los datos basándose únicamente en la información (es decir, sin sesgos por parte del científico) les permite a los científicos de datos aprender más sobre estos. Los algoritmos pueden encontrar estructuras interesantes u ocultas en los datos que antes no eran visibles para los científicos de datos. Estas estructuras ocultas se denominan vectores de características.
Normalmente los datos están sin etiquetar, por lo que el aprendizaje no supervisado evita que un científico de datos tenga que etiquetar todo, lo que podría ser una tarea que requiere mucho tiempo y, frecuentemente, imposible de completar. Los algoritmos de aprendizaje no supervisados también permiten tareas de procesamiento más complejas. Una vez más, la ausencia de etiquetado significa que se pueden mapear relaciones complicadas y grupos de datos. La ausencia de etiquetado en los datos significa que no existen ideas preconcebidas ni sesgos.
El mejor momento para utilizar el aprendizaje no supervisado es cuando no existen datos preexistentes sobre los resultados preferidos. El aprendizaje no supervisado puede identificar características que pueden resultar útiles en la categorización de conjuntos de datos desconocidos. Por ejemplo, cuando una empresa necesita determinar el mercado objetivo de un producto nuevo.
El aprendizaje no supervisado utiliza una técnica llamada reducción de dimensionalidad, lo cual ocurre cuando la máquina asume que muchos datos son redundantes y elimina dimensiones o combina algunas partes de datos según corresponda. La compresión de datos da como resultado ahorro de tiempo y ahorro en potencia de procesamiento.
Los modelos generadores son otro punto fuerte del aprendizaje no supervisado. Los modelos generadores muestran la distribución en los datos. Aquí es cuando se revisan los datos y se pueden crear nuevas muestras a partir de ellos. Por ejemplo, a un modelo generador se le puede dar un conjunto de imágenes y crear un conjunto de imágenes fabricadas a partir de ellas.