Quelles statistiques pour Data Analysts?
#29 Ou pourquoi vous n’avez pas besoin d’une licence en maths pour cartonner dans la Data
Hello à tous !
Bienvenue dans la 29e édition de cette newsletter !
On est désormais 2400 personnes à se retrouver toutes les deux semaines pour parler d’une passion commune, c’est la Data. Merci pour votre fidélité ❤️.
A part de lire du contenu dans cette édition, vous pouvez:
Rejoindre l’Accélérateur Projet Portfolio pour être accompagné par moi. Ce programme est conçu pour aider les Data Analysts à construire des projets béton afin de décrocher des entretiens… et un job.
Télécharger ma cheat sheet gratuite SQL (+1300 téléchargements) qui recense 90 % des commandes essentielles pour travailler dans la Data, chacune illustrée par un exemple concret.
Lire les éditions précédentes.
Me suivre sur Linkedin.
En ce moment, je travaille sur un accompagnement pour aider les Data Analysts à créer des projets portfolio vraiment impactants.
Si ça vous intéresse et que vous voulez être tenus au courant du lancement, laissez-moi votre email via ce lien.
Quand j’ai débuté dans la Data, je me souviens avoir passé une soirée entière à relire trois fois la loi de distribution de Poisson.
Spoiler : je n’avais rien compris.
Et je pensais que le problème venait de moi. Que je n’étais pas "assez forte en stats".
Mais avec du recul, je réalise que le vrai souci venait surtout… des roadmaps ultra génériques qu’on trouve sur Internet, qui vous demandent d’apprendre pleine de choses en stats si vous voulez travailler dans la Data.
Vous les connaissez sûrement : celles qui mélangent Data Analyst, Data Scientist, Data Engineer… comme si tout ça était interchangeable.
Alors aujourd’hui, j’ai envie de vous aider à y voir plus clair.
Quelles statistiques un Data Analyst doit-il réellement connaître ?
Est-ce indispensable dans tous les rôles ?
Qu’est-ce qui est vraiment utile sur le terrain… et qu’est-ce qui est superflu ?
C’est ce que nous allons explorer ensemble dans cette édition.
“Est-ce qu’il faut absolument être bon en stats pour devenir Data Analyst ?”
La réponse est simple : ça dépend.
Tous les rôles de Data Analyst ne nécessitent pas le même niveau.
Dans ma propre carrière, j’ai été :
Analyste reporting dans le digital
Analyste qualité des données
Analyste marketing
Analyste produit
Et à chaque rôle… les besoins en statistiques étaient très différents.
Les rôles avec peu de statistiques
Si vous êtes du côté intégration des données, qualité ou data engineering, alors le niveau requis est assez simple :
Moyenne
Médiane
Écart-type
Et c’est suffisant.
Ce sont des rôles plus orientés techniques (gestion de pipelines, traitement de données, contrôle qualité), où les statistiques ne sont pas le cœur de métier.
Les rôles où il faut interpréter et expliquer
Quand on parle d’analyse de performance, de reporting, voire de BI, il faut aller un peu plus loin.
Vous devez notamment :
savoir quand utiliser la moyenne ou la médiane
détecter des valeurs aberrantes (outliers)
expliquer des tendances chiffrées à des équipes non-tech
L’enjeu ici, c’est moins de faire des calculs complexes… que d’être capable de vulgariser les chiffres pour appuyer une décision.
Exemple : expliquer pourquoi les ventes moyennes d’une catégorie explosent, alors qu’en réalité un seul produit très cher fausse les résultats.
Les rôles où les stats deviennent centrales
Dès que vous touchez à l’analyse produit, au Growth ou aux A/B tests, vous devez monter en compétences.
Voici les notions clés :
Tests d’hypothèse
Intervalles de confiance
P-valeur
Loi normale
Traitement des données biaisées (skewness)
Parfois : inférence causale ou modèles quasi-expérimentaux
Ce sont des rôles où vous collaborez avec les PMs, Designers, Développeurs. Vos analyses doivent guider les décisions — et donc être solides sur le plan statistique.
Et dans les secteurs spécifiques ?
Certains métiers exigent des connaissances ciblées :
Assurance : comprendre des lois de distribution comme Poisson, utilisées pour modéliser des événements rares
Finance : savoir mesurer le ROI, faire des prévisions de chiffre d’affaires
Banque : effectuer des tests statistiques
Support Data Science : aider à préparer les données pour le machine learning, donc comprendre les bases des modèles
Mais ces cas restent spécifiques à un secteur ou à une mission.
Récap
Les statistiques à maîtriser varient énormément selon votre rôle de Data Analyst.
(Pour en savoir plus sur les différents rôles de Data Analyst, jetez un coup d’oeil à l’édition #2)
Intégration / Qualité des données: 🟢 Très basique
Reporting / Performance: 🟢 Simple + savoir vulgariser
Web / Marketing Analyst: 🟡 A/B testing léger
Product / Growth Analyst: 🔴 Statistiques avancées
Assurance / Fraude / Finance: 🔴 Spécifiques au secteur
Et dans 80 % des postes, ce qu’on vous demandera se limite à :
Comprendre et interpréter une moyenne, une médiane, un écart-type
Lire une distribution
Expliquer pourquoi une tendance monte ou descend
Pas besoin de refaire vos années de licence de maths. Pas besoin de connaître tous les modèles bayésiens.
Un message pour les débutants
Ne laissez pas les statistiques vous faire douter de votre place dans ce métier.
Commencez par le concret :
Comprenez ce que vous lisez dans un histogramme
Apprenez à interpréter une moyenne
Appropriez-vous les grands principes des tests d’hypothèse
Et surtout… entraînez-vous sur des cas réels.
La théorie devient plus simple quand on la relie à un besoin métier.
Mes deux ressources préférées
Voici deux formations gratuites qui m’ont vraiment aidée à mes débuts :
Intro to Statistics — Parfait pour comprendre les bases (moyenne, médiane, dispersion…)
Intro to Inferential Statistics — Idéal pour aborder les tests d’hypothèse et la logique statistique sans prise de tête, avec une bonne dose de pratique.
J’espère que cette édition vous a permis de démystifier un peu cette fameuse "compétence en stats" qu’on brandit souvent comme une montagne infranchissable.
Si cet article vous a plu, laissez un ❤️ ou un commentaire, ça m’aide énormément à continuer à écrire.
Et si vous avez encore des doutes ou des questions sur les compétences clés à développer en Data, je suis à votre écoute.