Se entiende como aprendizaje maquinal o automático (Machine Learning) a todo aquel aprendizaje generado por una computadora, sin necesidad de ser programada explícitamente por los seres humanos, para tomar una decisión o realizar una tarea, es decir, que tenga la capacidad de entender o resolver problemas a partir de su experiencia.
El Machine Learning es una subárea de las ciencias de la computación, particularmente de la Inteligencia Artificial; que tiene como objetivo principal la generación de técnicas para resolver muchos problemas para los que no existe algún algoritmo o modelo matemático que proporcione la solución, es decir, problemas de tipo NP (polinomial no determinista) para los que no existe un algoritmo que se ejecute en un tiempo polinomial para resolver el problema.
En la actualidad con todos los avances tecnológicos se ha vuelto muy popular el uso de esta área, puesto que con el uso diario de la misma se recopilan grandes cantidades de datos de los cuales se pueden obtener múltiples beneficios al ser analizados y clasificados, para su posterior entendimiento del cual surgen patrones con los que se pueden predecir tendencias o comportamientos, que servirán para optimizar recursos y facilitar la vida de los seres humanos.
Como ya lo mencioné, el Machine Learning trabaja con un conjunto de datos, sin embargo, no se debe confundir con el área de Big Data pues esta se encarga de procesar grandes cantidades de información para organizarla y estructurarla, para su futura manipulación; además también se debe distinguir que tampoco se refiere a Data Mining (minería de datos) pues esta área tiene como objetivo diseñar estrategias para encontrar datos específicos en medio de un conjunto de información.
Descripción
Aunque no son lo mismo las tres áreas antes mencionadas, pueden ser utilizadas en conjunto para resolver muchos problemas de nuestra vida cotidiana, así que para poder hacer Machine Learning se siguen los siguientes pasos:
- Recolección de datos: es necesario contar con un conjunto de datos, en este paso se puede utilizar Big Data.
- Preparación de los datos: cuando se recolecta información, se trata de obtener la mayor cantidad posible por si a caso es necesaria, sin embargo, después esta se discrimina para solo quedarse con los datos que realmente sirven para el propósito del problema, esto puede ser realizado con la ayuda de Data Mining.
- Entender los datos: aquí es donde realmente reside el trabajo de Machine Learning, pues los datos ya está listos para ser analizados y clasificados para encontrar los patrones que servirán para realizar predicciones y tomar decisiones.
El Machine Learning como todas las áreas de las ciencias de la computación va de la mano con una gran cantidad de matemáticas, pues estas son las que permiten que los datos puedan ser manipulados, clasificados y entendidos, para poder hacer Machine Learning es necesario contar con algunas bases en diversas áreas de las matemáticas, estos campos se utilizan en conjunto para implementar las técnicas del aprendizaje maquinal. Algunas de las áreas en las que se debe de tener conocimientos por lo menos los esenciales son:
- Álgebra lineal
- Cálculo de varias variables
- Probabilidad
- Estadística
- Algoritmos y optimización
- Métodos numéricos
Tipos de problemas
Existen tres tipos de problemas que pueden ser resueltos con el aprendizaje maquinal.
Aprendizaje supervisado
Estos problemas son aquellos de los cuales se cuenta con algún conocimiento inicial, del cual se parte para la toma de decisiones; por ejemplo cuando se sabe las características que distinguen a los datos con las cuales pueden ser clasificados.
Aprendizaje no supervisado
Estos problemas son aquellos de los cuales no se cuenta con conocimientos previos, entonces el algoritmo tiene que empezar a buscar los patrones desde cero; por ejemplo las piezas de un rompecabezas en primera instancia todas las piezas parecen diferentes pero si se observan más de cerca se pueden distinguir algunos patrones en los cortes, algunas piezas tienen tres puntas, otras cuatro, las que forman el marco tienen un lado recto, etc. entonces el algoritmo aprende basado en la observación.
Aprendizaje reforzado
Estos problemas son aquellos que pueden ser resueltos a partir de reglas establecidas y dependiendo de los resultados que se vayan obteniendo se dan recompensas o penalizaciones, de las cuales el algoritmo aprende a distinguir que algunas cosas debe evitar y otras debe de repetir con más frecuencia. Por ejemplo en un juego de ajedrez, se parte de las reglas y estrategias básicas del juego, sin embargo, dependiendo del contrincante y de sus jugadas posteriores una decisión puede llevar al triunfo o al fracaso.
Aplicaciones
Algunas de las aplicaciones más comunes las podemos encontrar en la vida diaria, seguro alguna vez al día utilizas alguna aplicación o tecnología que funciona con Machine Learning.
- Seguridad de datos
- Seguridad personal
- Transacciones financieras
- Cuidado de la salud
- Marketing digital
- Recomendaciones
- Búsqueda online
- Procesamiento de lenguaje natural
- Dispositivos inteligentes
- Comprensión de textos
- Robots
- Reconocimiento facial
- Reconocimiento de huellas digitales
- Vehículos inteligentes
- Chatbots
Técnicas
Algunas de las técnicas más utilizadas para resolver problemas con Machine Learning son:
- Árboles de decisión
- Algoritmos genéticos
- Redes neuronales artificiales
- Redes bayesianas
- Análisis de componentes principales (PCA)
- Regresión lineal y logística
- Máquinas de vectores de soporte
- Modelos ocultos de Markov
- Clasificador K vecinos más cercanos (KNN)
- Clasificación de Naïve Bayes
- Algoritmos de Clustering
Espero esta información te haya sido útil, recuerda que si estás interesado en desarrollar tecnología basada en Machine Learning debes tomar en cuenta que es necesario contar con bases matemáticas para que el camino sea más sencillo de recorrer. ¡Hasta la próxima!
Muy buena informacion
Gracias por leernos.
Excelente artículo, perfecto para iniciar en el mundo del Machine Learning. Gracias.
Gracias por el comentario. Saludos.