L'analyse multivariée est une famille de méthodes statistiques qui regroupe deux catégories : des méthodes descriptives et des méthodes explicatives. Quelle que soit la méthode choisie, les analyses multivariées se caractérisent par la multiplicité des variables à traiter : plusieurs variables explicatives influent sur une variable dépendante à expliquer. 

>> Téléchargez ces modèles d'expériences marketing

Exemple : l'entreprise souhaite dresser le profil type du client sensible aux recommandations de produits ; elle collecte, pour les clients qui achètent en ligne les produits recommandés sur le site, les données de genre, d'âge et de catégorie socio-professionnelle ; elle utilise une méthode descriptive pour modéliser les données de manière graphique, puis une méthode explicative pour dresser le profil type de manière probable ; l'entreprise a effectué une analyse multivariée. 

 

Pourquoi faire une analyse multivariée ?

Faire une analyse multivariée est utile lorsque plusieurs facteurs influent potentiellement sur un résultat. Dans ce cas, elle permet de prendre simultanément en compte l'ensemble de ces facteurs, pour décrire et expliquer les liaisons. L'analyse multivariée est ainsi effectuée à des fins exploratoires d'une part, prévisionnelles d'autre part.

En pratique :

  1. Des données sont recueillies sur un échantillon d'individus, au sein duquel des ressemblances et des différences émergent.
  2. Pour composer des groupes homogènes, il faut modéliser les données : les méthodes descriptives de l'analyse multivariée offrent une vision globale multidimensionnelle sur les individus et les variables.
  3. Les méthodes explicatives permettent de comprendre comment chaque groupe est homogénéisé, et de prévoir l'appartenance d'un individu à un groupe.

 

Exemple d'application de l'analyse multivariée en marketing

Une entreprise collecte massivement des données, qu'elle doit traiter et interpréter en vue de les valoriser. Sur ses réseaux sociaux, notamment, elle dispose pour chaque abonné d'informations sur son genre, son âge et sa localisation géographique. Elle souhaite exploiter ces données pour améliorer la performance de sa stratégie d'e-mailing.

Or l'équipe marketing constate qu'une part des abonnés est également abonnée à des comptes sociaux de marques de sport, et qu'une autre part est abonnée à des marques de cosmétiques : elle prépare deux newsletters distinctes, pour adapter le contenu à chaque centre d'intérêt. Plutôt que d'envoyer manuellement les newsletters à chaque abonné de manière individuelle, au risque d'envoyer deux newsletters aux abonnés qui aiment le sport et les cosmétiques, et aucune newsletter aux abonnés qui n'aiment ni l'un ni l'autre, l'équipe privilégie une approche statistique.

L'analyse multivariée lui permet de faire émerger deux segments d'abonnés, sur la base des variables de genre, d'âge et de ville : le premier aime potentiellement le sport et le deuxième aime potentiellement les cosmétiques. Les newsletters peuvent alors être envoyées automatiquement, et l'entreprise s'assure que statistiquement, le destinataire est intéressé par le contenu. Dès que le réseau social compte un nouvel abonné, l'entreprise prévoit son centre d'intérêt en fonction de ses données de genre, d'âge et de ville, pour lui communiquer des contenus pertinents.

Modèles d'expériences marketing pour augmenter la croissance d'entreprise

Téléchargez ces modèles gratuits pour augmenter la croissance annuelle de votre entreprise grâce aux résultats concluants d'expériences marketing

Comment faire une analyse multivariée ?

Pour faire une analyse multivariée, il faut déterminer la variable à expliquer en fonction de l'objectif poursuivi, choisir la méthode, puis identifier les variables explicatives.

Le choix de la méthode est lié à l'objectif de l'analyse multivariée :

  • Les méthodes descriptives, ou exploratoires, permettent d'organiser les données de manière visuelle, sous forme de tableaux et de graphiques, pour avoir une vision structurée et faciliter la compréhension. La méthode descriptive est souvent une étape préalable à la mise en œuvre d'une méthode explicative.
  • Les méthodes explicatives sont utilisées à des fins prédictives. En identifiant comment des paramètres influent sur un résultat, il est possible d'en déduire que le même résultat, statistiquement, se produit chaque fois que les paramètres sont réunis.

 

Les méthodes descriptives de l'analyse multivariée

Parmi les principales méthodes descriptives en analyse multivariée :

  • L'analyse en composantes principales (ACP).
  • L'analyse factorielle des correspondances (AFC).
  • L'analyse des correspondances multiples (ACM).
  • Le partitionnement de données, ou clustering.
  • Le positionnement multidimensionnel (MDS).

Exemples pratiques :

  • L'ACP, utilisée pour les variables quantitatives, permet de regrouper les individus de l'échantillon par association de caractéristiques. L'ACP est représentée sous forme de mapping, où les regroupements sont positionnés sur un plan en deux dimensions. Les variables sont de fait réduites, pour résumer l'information tout en optimisant sa fiabilité.
  • L'AFC analyse les correspondances entre des variables qualitatives. L'analyste transforme un grand tableau de données complexe en un nuage de points, dont les coordonnées correspondent aux valeurs enregistrées dans le tableau. La répartition ainsi représentée permet de hiérarchiser les correspondances, pour retenir les variables majeures.
  • L'ACM est particulièrement utile pour traiter les enquêtes d'opinion et les questionnaires à choix multiples, qui classent les individus interrogés dans un tableau de variables qualitatives. Exemple : le questionnaire propose plusieurs choix de catégories socio-professionnelles, et interroge sur les comportements d'achat en proposant de cocher « en ligne », « en boutique » ou « les deux » ; la représentation graphique du tableau de données, résultat des calculs mathématiques dictés par l'ACM, fait apparaître des groupes d'individus, qui partagent ou qui ne partagent pas un comportement d'achat similaire.

 

Les méthodes explicatives de l'analyse multivariée

Parmi les méthodes explicatives en analyse multivariée :

  • L'analyse de la variance (ANOVA).
  • L'analyse de régression.
  • Les réseaux de neurones.
  • Les arbres de décision.
  • L'analyse factorielle discriminante (AFD).
  • L'analyse conjointe.
  • L'analyse canonique des corrélations.
  • Les équations structurelles.

Exemples pratiques :

  • La régression, par exemple, consiste à positionner chaque individu sur un plan en deux dimensions, puis à dessiner une droite à partir du nuage de points pour expliquer une variable par d'autres variables numériques.
  • L'analyse de la variance teste deux hypothèses : soit la variable qualitative n'influe pas sur la variable quantitative, soit un lien de dépendance existe. L'ANOVA est utile pour identifier et comprendre des facteurs de variance dans le cadre d'études statistiques dans de nombreux domaines. Exemple en marketing : l'équipe marketing collecte les données d'âge et de genre des contacts de son fichier client, pour analyser les comportements d'achat ; elle teste d'abord le facteur du genre, pour lequel le test ANOVA ne met pas en évidence d'écart significatif ; sur le facteur de l'âge en revanche, un lien de dépendance avec le comportement d'achat apparaît ; l'entreprise en déduit que le genre est indifférent, mais que les moins de 25 ans préfèrent acheter en ligne.
  • Les arbres de décision sont particulièrement utiles pour prédire, de manière probable, un comportement de consommation. L'entreprise part de la racine de l'arbre, qui représente son client type ; elle dessine plusieurs branches à partir de la racine, chaque branche décrivant un secteur de clientèle caractérisé par l'âge, le genre, la catégorie socio-professionnelle ou encore le secteur géographique ; les secteurs auront été préalablement définis grâce à une autre méthode d'analyse multivariée ; pour chaque branche, l'entreprise dessine de nouvelles branches, qui décrivent le comportement de consommation probable ; in fine, l'arbre de décision permet d'obtenir une représentation graphique des ventes probablement réalisées par l'entreprise, par canal de vente et par montant du panier moyen.

Le choix de la méthode est déterminant au moment de faire une analyse multivariée. Il faut prendre en compte la nature et le volume des données disponibles, ainsi que l'objectif de l'exercice. Une fois la méthode choisie, l'analyse multivariée est généralement menée à l'aide d'un logiciel d'automatisation ad hoc, qui effectue les calculs et génère la représentation graphique à exploiter.

 

Pour aller plus loin, téléchargez ces modèles d'expériences marketing pour augmenter la croissance d'entreprise et inspirez-vous en pour augmenter la croissance annuelle de votre entreprise grâce aux résultats concluants d'expériences marketing.New Call-to-action

Publication originale le 13 juillet 2022, mise à jour le 13 juillet 2022

Sujet(s):

a/b testing