La roadmap pour Data Analyst en 2024
#4 Comment distinguer les compétences essentielles des distractions attrayantes mais moins prioritaires
Hello à tous !
Bienvenue à la 4e édition de cette newsletter. Nous sommes désormais plus de 450 personnes à partager ce rendez-vous. Un grand merci pour votre soutien continu 🧡.
Le résultat du sondage précédent est (presque) unanime : 93% des participants se sont montrés favorables à l'idée d’avoir une cheat sheet en SQL. Je vais donc commencer à travailler dessus !
Le sujet d’aujourd’hui est: Quelle est la bonne roadmap pour devenir Data Analyst?
Pourquoi ce sujet?
Aujourd’hui trouver un poste en tant que Data Analyst nécessite une spécialisation de plus en plus précise de votre profil.
En recherchant sur Internet, vous verrez beaucoup de personnes vous conseiller d'apprendre SQL et Python, ce qui soulève encore plus de questions :
Quel SQL devrais-je apprendre ?
Ai-je besoin d'apprendre scikit-learn pour devenir analyste de données ?
Et la place d’Excel dans tout ça ?
Les ressources en anglais ne sont parfois pas pertinentes car un poste Data Analyst aux États-Unis peut différer d'un poste similaire en France.
Savoir par où commencer et comment prendre en main ces outils nécessite quelques orientations.
J'ai réussi la transition vers l'analyse de données et je souhaite partager aux autres mes retours d’expérience.
Utilisez ce framework, et vous serez sur la voie du succès !
La roadmap vers l'analyse de données ressemble beaucoup à la planification d'un voyage.
Dans notre voyage, il y a 3 parties principales :
1/ Apprentissage :
Statistiques
Excel
SQL
Power BI / Tableau
Python
2/ Démonstration de ces compétences via un projet
3/ Un profil LinkedIn solide
Statistiques
Quand j'ai commencé, on m'a dit que la Data débutait par les maths, et que parmi ces maths, l'algèbre linéaire était essentielle.
La réalité est tout autre. On a besoin d’un peu de stats. Et tous les rôles de Data Analyst n'en ont pas besoin. (voir édition #2 où j’ai détaillé les compétences requises pour les différents profils de Data Analyst).
Mais c'est une partie fondamentale de l'apprentissage. Cela sous-tend beaucoup de ce que nous faisons dans le domaine.
Apprenez juste les bases :
Statistiques descriptives :
Types de variables (qualitatives, quantitatives, ordinales, etc.)
Mesures de tendance centrale (moyenne, médiane, mode)
Mesures de dispersion (écart-type, variance)
Distributions statistiques (normale, uniforme, binomiale)
Tests d'hypothèses
Loi des grands nombres
Théorème central limite
Intervalle de confiance.
L'objectif est d'acquérir des connaissances de base pour pouvoir remettre en question, par exemple, une estimation donnée sans intervalle de confiance. Ou bien, quand quelqu'un vous parle de la moyenne du montant des achats des clients, vous saurez que la médiane pourrait être une mesure de tendance centrale plus appropriée.
Cours gratuits:
Excel / Google Sheets
Beaucoup de gens disent que Excel est dépassé, que les outils plus récents ont surpassé ses capacités.
La réalité est tout autre. Excel reste encore l'outil le plus utilisé dans beaucoup d’entreprises.
Sa polyvalence, sa facilité d'utilisation et son intégration avec d'autres applications en font un outil indispensable pour beaucoup de rôles de Data Analyst.
Vous utiliserez probablement Excel si l'entreprise dispose de la suite Microsoft, ou Google Sheets si elle utilise Google.
Les fonctionnalités sont assez similaires :
Opérations de base : saisie de données, mise en forme, formules de base (SOMME, MOYENNE, NB, MIN, MAX)
Fonctions logiques : SI, ET, OU
Fonctions de recherche : RECHERCHEV, RECHERCHEH, INDEX, EQUIV
Fonctions de texte : GAUCHE, DROITE, STXT, CONCATENER, TEXTE
Fonctions de date
Mise en forme conditionnelle pour l'analyse de données
Tableaux croisés dynamiques
Visualisation de données
Avancées : Macros, VBA, Power Query.
Ressources:
Chaîne Youtube de Simon Sez IT
Chaîne Youtube de Teacher's Tech
Excel Skills for Data Analytics and Visualization Specialization (Coursera)
SQL
Sur le site https://datanerd.tech/, construit par le Youtuber Luke Barousse, des dizaines de milliers d'offres d'emploi mondiales ont été analysées.
Il apparaît que le SQL est requis pour près de 50% des postes de Data Analyst en France, ce qui le rend la compétence la plus demandée.
J'ai écrit une édition complète sur le SQL nécessaire pour les Data Analysts, il vous suffit de cliquer ici pour la consulter.
PowerBI / Tableau
Les postes de Data Analysts demandent très souvent que vous maîtrisiez un outil de Business Intelligence (BI).
Les deux plus couramment utilisés sont Tableau & PowerBI.
Selon les statistiques de datanerd ci-dessus, Power BI est un peu plus populaire que Tableau en France.
Mais tous les deux sont excellents pour l’apprentissage.
Les points communs que vous devez maîtriser dans les deux outils sont :
Visualisation de données : Comprendre comment créer et utiliser différents types de graphiques.
Dashboard et rapports : Capacité à concevoir des dashboard interactifs : mise en page, choix des éléments visuels appropriés.
Importation et intégration de données : Maîtrise de l'importation de données provenant de différentes sources (comme Excel, les bases de données SQL, etc.) et compréhension de l'intégration des données. Cela inclut également la préparation des données.
Filtres : Savoir comment créer et appliquer des filtres.
Champs calculés et calculs personnalisés : Les deux outils prennent en charge diverses expressions DAX (Data Analysis Expressions) dans Power BI et les champs calculés dans Tableau.
Contrôles de paramètres : Utilisation de paramètres (les dates, les valeurs et autres critères) pour rendre des parties des rapports et des visualisations interactives et dynamiques.
Modélisation des données : Les deux outils nécessitent une compréhension des concepts de base de la modélisation des données, tels que les relations, la cardinalité et la création de schémas.
Agrégations : Maîtrise des agrégations: somme, moyenne, count…
Fonctionnalités interactives : les info-bulles, le filtrage dynamique.
Partage et collaboration : publier, partager et collaborer des rapports et des dashboards au sein et à l'extérieur de l'organisation.
Cours gratuits:
Datacoach.ca (Benjamin Ejzenberg)
Python
Beaucoup de postes de Data Analysts n'exigent pas de Python. Mais si vous l'avez, cela ouvrira une tonne d'opportunités.
Notez que le Python pour Data Analysts est très différent du Python pour la Data Science.
Les Data Scientists doivent connaître le Machine Learning et mettre ses modèles en production, donc doit maîtriser scikit-learn et streamlit, ce qui n'est pas le cas pour les Data Analysts.
Pour Python, vous devrez d'abord maîtriser les bases :
Syntaxe et indentation
Variables et types de données : integer, float, string, boolean.
Opérateurs : opérations mathématiques (addition, soustraction, multiplication, division), opérations logiques (and, or, not) et comparaisons (>, <, ==).
Contrôle de flux – If, else, et elif
Boucles: for et while
Fonctions
Listes et dictionnaires
Gestion des erreurs
Après les bases, vous apprendrez à utiliser les bibliothèques Python.
Commencez avec celles-ci :
Numpy : Il offre une manipulation efficace des matrices et des tableaux multidimensionnels, ainsi que des opérations mathématiques de haut niveau.
Pandas : Il permet de manipuler des données à travers des structures comme DataFrame et Series, avec des fonctions pour lire et écrire des données dans différents formats.
Duckdb : Cette base de données intégrée permet d'exécuter des requêtes SQL directement sur des DataFrame pandas.
Matplotlib : Librairie de visualisation de données la plus populaire et la plus largement utilisée.
Seaborn : Très utilisé dans l'analyse exploratoire de données pour rendre les insights plus accessibles et visuellement engageants.
Statsmodels : Pour faire des tests d’hypothèse et des visualisations statistiques.
Ressources :
Projets
Une chose qui vous distinguera des autres candidats est un excellent projet de portfolio.
Quand j'ai commencé à passer des entretiens pour trouver mon premier emploi d'analyste de données, je n'avais aucune expérience. Mais j'ai réalisé un projet lié au domaine de l'entreprise. Cela a été absolument crucial pour obtenir le poste.
Alors, comment construire une pièce de portfolio qui vous permet réellement de décrocher des emplois ?
Vous devriez choisir un projet qui est hyper ciblé, aligné sur les enjeux spécifiques des secteurs visés par votre recherche d'emploi.
Voici des exemples concrets de projets qui pourraient booster votre visibilité auprès des recruteurs :
Marketing Digital : Analyse du trafic d'un site web avec un jeu de données de Google Analytics.
E-commerce : Analyse des commandes d'un marketplace.
Retail : Exploration des habitudes d'achat des clients.
Banque : Identification des profils de fraudeurs.
Énergie : Analyse de la saisonnalité de la consommation énergétique.
Santé : Étude du profil des patients hospitalisés.
Gaming : Analyse des ventes de jeux vidéo.
Ensuite, que mettre dans un projet ?
Beaucoup pensent qu’il faut résoudre des problèmes complexes pour se démarquer avec un portfolio.
Mais en réalité, les entreprises cherchent des réponses à des questions bien plus simples.
Prenons un exemple. Imaginez que vous disposiez d'un jeu de données de ventes au détail incluant des informations sur les clients et les produits.
Au lieu de tenter de résoudre des problématiques complexes telles que la prédiction du churn ou la prévision des ventes, les entreprises cherchent à répondre à des questions directement liées au business, comme :
Comment évoluent les ventes mois après mois ?
Quels sont les produits les plus vendus ?
Combien de produits les clients achètent-ils en moyenne par transaction ?
Quels sont les segments de clients les plus rentables ?
À partir de vos analyses, quelle stratégie recommanderiez-vous à l'entreprise pour augmenter ses profits ?
Que faire après avoir terminé l’analyse ?
Écrivez un article sur Medium ou publiez votre dashboard sur Tableau/ Power BI. Cela permettra de démontrer ce que vous avez fait lors d’un entretien !
Les jeux de données pour travailler votre projet:
LinkedIn
Que pouvez-vous faire sur LinkedIn ?
Contacter des professionnels dans votre domaine.
Comprendre leur quotidien, demander des conseils sur les compétences requises, les formations recommandées
Dénicher des opportunités d’emploi.
Voici quelques conseils pour optimiser votre profil Linkedin.
Optimisation de votre profil LinkedIn:
Photo professionnelle
Titre accrocheur
Résumé détaillé : Votre résumé doit mettre en avant vos compétences, vos réalisations et ce qui vous distingue. Utilisez des mots-clés pertinents pour l'analyse de données afin d'améliorer votre visibilité dans les recherches.
Personnalisez votre URL
Ce qu'il faut inclure dans votre profil LinkedIn
Expérience pertinente : Listez tous les emplois pertinents que vous avez eus, en vous concentrant sur ce que vous avez accompli dans ces rôles et comment vous avez ajouté de la valeur, notamment avec des résultats quantitatifs.
Section compétences : Mettez en avant des compétences techniques telles que SQL, Python, R, Excel, et des outils comme Tableau ou Power BI. Incluez également des compétences interpersonnelles telles que la résolution de problèmes et la communication.
Formations et certifications : Incluez vos diplômes et toute certification pertinente comme le certificat de Data Analytics de Google ou un cours spécialisé en analyse des données.
Projets : Présentez des projets spécifiques ou des études de cas où vous avez appliqué vos compétences en analyse de données. Incluez des liens vers ces travaux ou des portfolios si possible.
Recommandations : Demandez à des collègues, des professeurs ou des clients de fournir des recommandations qui témoignent de vos compétences.
Établir des relations sur LinkedIn
Connectez-vous avec des pairs et des recruteurs dans le domaine de l'analyse de données et avec des employés dans des entreprises qui vous intéressent.
Commentez, aimez et partagez du contenu pertinent dans votre domaine.
Participez à des groupes LinkedIn liés à l'analyse de données
Suivez des influenceurs et des entreprises dans le domaine.
Envoyez des messages aux personnes pour demander des conseils ou discuter des opportunités d'emploi.
Cours gratuit: Strengthen Your LinkedIn Profile (Udacity)
Suivez Ruben Taieb pour un conseil de Linkedin par jour.
Autres ressources:
IBM Data Analyst Professional Certificate (gratuit sur Coursera)
Conclusion
De la maîtrise des statistiques et d'Excel à la compétence en SQL, Python et outils de BI comme Power BI ou Tableau, chaque élément renforcera votre compétence et votre valeur sur le marché.
Se lancer dans la Data Analyse en 2024 pourrait être intimidant. Mais avec ce framework, vous devriez vous sentir moins seul dans un réseau avec beaucoup de personnes comme vous.
J'espère que suivre cette roadmap vous rapprochera beaucoup plus du rôle de Data Analyst !