Machine Learning Flujos de trabajo y Herramientas - II
  • Jordi Llobet
  • 05 mar. 2025

Machine Learning Flujos de trabajo y Herramientas - II

3.- Flujos de trabajo de Machine Learning

Básicamente Machine Learning consta de 3 fases:

  • Definición del Clasificador: Implementar la representación de características de los datos de entrenamiento. Seleccionar el tipo de clasificador más adecuado según el problema que queremos resolver.
  • Evaluación: Elegir los criterios que definen si el clasificador es óptimo. Por ejemplo, porcentaje de predicciones correctas en fase de testeo.
  • Optimización: Definir los parámetros que proporcionan un mejor clasificador según los criterios de evaluación escogidos en la fase anterior
Machine Learning - Ejemplo de clasificación

Figura 3 - Flujo de trabajo en Machine Learning

4.- Representación de características en Machine Learning

Las características (“features”) son el conjunto de datos que definen las instancias que utilizaremos como datos de entrenamiento. Posteriormente, a través del modelo definido con Machine Learning con las características de la instancia a predecir obtendremos la etiqueta que define la nueva instancia.

Ejemplos de Representación de características:

  • Si queremos clasificar qué correos electrónicos pueden ser spam. Una Representación de Características podría ser una lista de palabras con un atributo que indica la frecuenta con que esas palabras aparecen en el correo electrónico.
  • Para clasificar imágenes la Representación de Características podría ser una matriz con el color de cada píxel.
  • Si queremos clasificar tipos de peces (o tipos de fruta como en el esquema de la figura 4) una Representación de Características podría ser un conjunto de atributos con sus valores.
Machine Learning - Ejemplo de clasificación

Figura 4 - Ejemplo de representación de características

5.- Herramientas Python para Machine Learning

Python es el lenguaje que se utiliza para implementar modelos de Machine Learning. Dentro de Python, las librerías que utiliza Machine Learning son las siguientes:

scikit-learn:

es una librería de código abierto que unifica bajo un único marco los principales algoritmos y funciones de Machine Learning. De esta forma, facilita en gran medida todas las etapas de creación, evaluación y optimización de los modelos predictivos. Enlaces a la documentación de la librería:

SciPy Library:

Proporciona una variedad de herramientas útiles de computación científica. Entre ellas, distribuciones estadísticas, optimización de funciones, álgebra lineal y una variedad de funciones matemáticas especializadas. Con scikit-learn, se proporciona soporte para matrices dispersas, una forma de almacenar tablas grandes que consisten principalmente en ceros. Enlaces a la documentación de la librería:

NumPy Library:

Proporciona estructuras de datos fundamentales utilizadas por scikit-learn, particularmente matrices multidimensionales. En general, los datos que se ingresan a scikit-learn estarán en forma de una matriz de la librería NumPy. Enlaces a la documentación de la librería:

Pandas Library:

Proporciona estructuras de datos clave como DataFrame. Además, admite importa y exporta la lectura y escritura de datos en diferentes formatos. Enlaces a la documentación de la librería:

Finalmente, las siguientes librerías de representación gráfica de datos:

comillas

Las características (“features”) son el conjunto de datos que definen las instancias que utilizaremos como datos de entrenamiento

No hay comentarias aún.
Deja un comentario
Tu mensaje es requerido.