Básicamente Machine Learning consta de 3 fases:
Figura 3 - Flujo de trabajo en Machine Learning
Las características (“features”) son el conjunto de datos que definen las instancias que utilizaremos como datos de entrenamiento. Posteriormente, a través del modelo definido con Machine Learning con las características de la instancia a predecir obtendremos la etiqueta que define la nueva instancia.
Ejemplos de Representación de características:
Figura 4 - Ejemplo de representación de características
Python es el lenguaje que se utiliza para implementar modelos de Machine Learning. Dentro de Python, las librerías que utiliza Machine Learning son las siguientes:
es una librería de código abierto que unifica bajo un único marco los principales algoritmos y funciones de Machine Learning. De esta forma, facilita en gran medida todas las etapas de creación, evaluación y optimización de los modelos predictivos. Enlaces a la documentación de la librería:
Proporciona una variedad de herramientas útiles de computación científica. Entre ellas, distribuciones estadísticas, optimización de funciones, álgebra lineal y una variedad de funciones matemáticas especializadas. Con scikit-learn, se proporciona soporte para matrices dispersas, una forma de almacenar tablas grandes que consisten principalmente en ceros. Enlaces a la documentación de la librería:
Proporciona estructuras de datos fundamentales utilizadas por scikit-learn, particularmente matrices multidimensionales. En general, los datos que se ingresan a scikit-learn estarán en forma de una matriz de la librería NumPy. Enlaces a la documentación de la librería:
Proporciona estructuras de datos clave como DataFrame. Además, admite importa y exporta la lectura y escritura de datos en diferentes formatos. Enlaces a la documentación de la librería:
Finalmente, las siguientes librerías de representación gráfica de datos:
![]()
Las características (“features”) son el conjunto de datos que definen las instancias que utilizaremos como datos de entrenamiento