Principal Component Analysis (PCA) : Mathematical Derivation

Evolutionary Intelligence

2 Apr 202120:46

Summary

TLDRDans cette vidéo, nous explorons l'analyse en composantes principales (PCA), une méthode populaire pour la réduction de la dimensionnalité en apprentissage automatique. Le processus repose sur les valeurs propres et les vecteurs propres, utilisés pour maximiser la variance des points de données projetés dans un espace de dimension réduite. Nous expliquons le processus mathématique derrière la PCA, y compris la résolution des équations propres et la manière de minimiser les calculs pour des ensembles de données de grande dimension. Enfin, nous abordons les limitations de la PCA et les techniques de transformation non linéaire comme les astuces de noyau pour des problèmes plus complexes.

Takeaways

😀 PCA (Analyse en Composantes Principales) est une technique populaire de réduction de la dimensionnalité utilisée en apprentissage automatique.
😀 L'objectif de PCA est de réduire le nombre de dimensions tout en conservant l'information la plus importante des données.
😀 PCA repose sur les concepts de vecteurs propres et de valeurs propres pour projeter les données sur des dimensions inférieures.
😀 La projection des données est réalisée à l'aide de vecteurs de projection (par exemple, u1), réduisant ainsi les données à une seule dimension.
😀 La variance des données projetées est utilisée pour mesurer la dispersion des données le long d'une direction donnée.
😀 L'objectif principal est de maximiser la variance des points projetés tout en maintenant la norme du vecteur de projection fixée à 1.
😀 L'utilisation des multiplicateurs de Lagrange permet de formuler un problème d'optimisation pour maximiser la variance sous contrainte.
😀 L'équation résultante de l'optimisation est une équation d'autovecteurs et d'autovalues, ce qui permet de résoudre le problème en utilisant les vecteurs propres de la matrice de covariance.
😀 Le calcul des vecteurs propres et des valeurs propres peut être coûteux lorsque le nombre de caractéristiques est beaucoup plus grand que le nombre de points de données.
😀 Une méthode d'optimisation permet de réduire le coût de calcul en utilisant une matrice de covariance de taille n × n, plutôt qu'une matrice de covariance d × d.
😀 Bien que PCA fonctionne bien pour des combinaisons linéaires des caractéristiques, des techniques comme les méthodes de noyau peuvent être utilisées pour traiter des transformations non linéaires des données.