Bàsicament Machine Learning consta de 3 fases:
Figura 3 - Flux de treball a Machine Learning
Les característiques ("features") són el conjunt de dades que defineixen les instàncies que utilitzarem com a dades d'entrenament. Posteriorment, mitjançant el model definit amb Machine Learning amb les característiques de la instància a predir obtindrem l'etiqueta que defineix la nova instància.
Exemples de Representació de Característiques:
Figura 4 - Exemple de representació de característiques
Python és el llenguatge que s'utilitza per implementar models de Machine Learning. Dins de Python, les llibreries que utilitza Machine Learning són les següents:
és una llibreria de codi obert que unifica sota un únic marc els principals algorismes i funcions de Machine Learning. D'aquesta manera facilita en gran mesura totes les etapes de creació, avaluació i optimització dels models predictius. Enllaços a la documentació de la llibreria:
Proporciona una varietat de ferramentes útils de computació científica. Entre aquestes, distribucions estadístiques, optimització de funcions, àlgebra lineal i una varietat de funcions matemàtiques especialitzades. Amb scikit-learn, es proporciona suport per matrius disperses, una forma demmagatzemar taules grans que consisteixen principalment en zeros. Enllaços a la documentació de la llibreria:
Proporciona estructures de dades fonamentals utilitzades per scikit-learn, particularment matrius multidimensionals. En general, les dades que s'ingressen a scikit-learn estaran en forma d'una matriu de la llibreria NumPy. Enllaços a la documentació de la llibreria:
Proporciona estructures de dades clau com ara DataFrame. A més, admet importa i exporta la lectura i escriptura de dades en diferents formats. Enllaços a la documentació de la llibreria:
Finalment, les següents llibreries de representació gràfica de dades:
![]()
Les característiques (features) són el conjunt de dades que defineixen les instàncies que utilitzarem com a dades d'entrenament