Le SQL académique est mort
#46 Ou comment les pros l'utilisent en entreprise
Hello à tous !
Bienvenue à la 46e édition de cette newsletter. Nous sommes désormais plus de 2825 personnes à partager ce rendez-vous toutes les deux semaines. Un grand merci pour votre soutien continu 🧡.
A part de lire du contenu dans cette édition, vous pouvez:
Rejoindre l’Accélérateur Projet Portfolio pour être accompagné par moi. Ce programme est conçu pour aider les Data Analysts à construire des projets béton afin de décrocher des entretiens… et un job.
Télécharger ma cheat sheet gratuite SQL (+1500 téléchargements) qui recense 90 % des commandes essentielles pour travailler dans la Data, chacune illustrée par un exemple concret.
Lire les éditions précédentes.
Me suivre sur Linkedin.
Ca y est, l’Accélérateur SQL a démarré !
Le programme pour vous aider à monter en compétences en SQL dans des contextes réels d’entreprise a démarré cette semaine.
Les premières vidéos et exercices ont été mis en ligne.
Si vous voulez nous rejoindre, j’offre encore quelques places au tarif early-bird (197€ au lieu de 397€, soit une remise de -50%). Attention: cette offre ne reviendra pas. Détail par ici.
Le SQL que vous apprenez à l’école n’existe pas en entreprise
Ça fait 7 ans que je suis dans la Data, et je vois la même chose à chaque recrutement : les entreprises cherchent des gens qui savent faire du SQL.
Le SQL est dans 80-90% des offres en Data. Certains l’exigent à un niveau “expert”.
Si le Python est assez peu utilisé par les Data Analysts, le SQL est vraiment utilisé quotidiennement pour tous les rôles dans la Data (data scientist, data engineer et data analyst).
Si vous voulez avoir un poste dans la data, vous allez certainement passer un test technique qui inclut du SQL. Moi même pour les entretiens de mission, on teste systématiquement mon niveau en SQL.
Dans cette édition, je vous montre comment les pros de la Data utilisent SQL dans la vraie vie. Les outils, les cas d’usage, et comment vous positionner pour décrocher votre prochaine opportunité.
Les fondamentaux ne changeront jamais. Les outils, si.
Quand je dis “faire du SQL”, c’est où exactement? Vous allez voir qu’en entreprise, les bases de données sont soit en local, soit dans le Cloud, comme Google BigQuery, Snowflake ou encore AWS Redshift.
Vous faites du SQL via des outils comme DBBeaver, base de données MySQL, ou encore db
Aujourd’hui, pourquoi beaucoup plus de cloud et peu de SQL local ? Parce que les données sont massives. Un data warehouse local, c’est 2010. En 2026, c’est cloud.
Une question que j’entends souvent: “Mais c’est quoi la différence de syntaxe entre BigQuery et Snowflake, entre MySQL et PostgreSQL?”
Honnêtement, ces différences mineures ne devraient pas vous gêner si vous maîtrisez les fondamentaux. Les 80-90% du code (SELECT, WHERE, JOIN, GROUP BY, WITH…) sont identiques partout.
Les 10-20% qui change (date functions, window syntax): vous les trouverez en 2min sur Google + ChatGPT.
Donc ma recommandation : arrêtez de vous laisser intimider par les dialectes. Concentrez-vous sur les fondamentaux ET travaillez sur des cas réels pour arriver à une excellente maîtrise.
Voici deux exemples d’offres d’emploi de Data Analyst qui demandent 5 ans d’expérience. Vous remarquerez qu’elles ne demandent pas du Python, mais du SQL ! Et surtout SQL dans le Cloud (BigQuery, Snowflake).
Le SQL académique est mort. Bienvenue à l’ère du SQL business.
Maintenant, la vraie question : qu’est-ce qu’on fait avec SQL en entreprise ? Ça dépend de votre rôle. Et c’est là que beaucoup de débutants se trompent : ils pensent que tous les Data Analysts font la même chose. C’est faux.
Ça dépend votre rôle. Regardons les cas d’usage fréquents des métiers principales de la data:
Data Analyst
Vous transformez les données brutes en insights qui aident le métier à prendre des décisions. Concrètement :
Vous préparez les données pour les tableaux de bord (Power BI, Tableau, Looker Studio).
Vous répondez aux analyses ad-hoc : “Combien de clients ont acheté plus de 3 fois ce mois-ci ?” Mais la vraie question que personne ne pose : “Pourquoi cette question ? Qu’allez-vous faire avec la réponse ?”
Vous vérifiez la qualité des données. Les chiffres ne matchent pas ? Vous creusez. Doublons, mauvais formats. Vous trouvez le bug, vous l’escaladez à l’équipe data engineering.
Data Engineer
Eux, c’est différent. Ils ont un usage bien plus technique du SQL.
Ils construisent l’infrastructure data que tout le monde utilise. Ils créent les tables brutes avec des données qui viennent d’une API, d’un fichier, d’une base legacy. Ils gèrent les mises à jour, les duplicates, les partitions, le clustering, le star schema.
Analytics Engineer
Ce sont ceux qui construisent la couche de transformation qui alimente les analystes et les dashboards. Au lieu de laisser les analystes faire du SQL répétitif, ils créent des tables prêtes à utiliser. Ils utilisent dbt pour versionner le code, ajouter des tests, documenter, gérer le lineage, concevoir des alertes.
Et puis il y a les Data Scientists qui utilisent SQL pour préparer des données avant de toucher au machine learning. Les BI Engineers qui préparent les données pour les tableaux de bord. Tout le monde utilise SQL. Et tout le monde fait du code review. Parce que SQL n’est pas un outil solitaire : c’est collaboratif.
Connaître SQL vs utiliser SQL, c’est l’abîme
Un débutant connaît la syntaxe :
SELECT * FROM customers WHERE age > 25
Un pro part d’un problème métier, le décompose, et trouve la solution pertinente. Voici un exemple concret. Un stakeholder arrive et vous dit :
“Je voudrais savoir combien de clients achètent régulièrement.”
Si vous lancez ça :
SELECT COUNT(DISTINCT customer_id) FROM orders
Vous obtenez une liste de 100K clients, mais est-ce utile? Aucune idée.
Ce que fait un pro: il clarifie la question: qu’entends-tu par “régulièrement”? 2 fois par mois?
Combien de commandes par client en moyenne? la fréquence des achats?…
Et surtout “que comptes-tu faire avec ces données”?
Et après il écrit du code :
WITH customer_frequency AS (
SELECT
customer_id,
COUNT(*) as total_orders,
DATEDIFF(day, MIN(order_date), MAX(order_date)) as days_between_first_last,
COUNT(*) / NULLIF(DATEDIFF(day, MIN(order_date), MAX(order_date)), 0) as orders_per_day
FROM orders
WHERE order_date >= DATE_SUB(CURRENT_DATE(), INTERVAL 12 MONTH)
GROUP BY customer_id
)
SELECT
CASE
WHEN orders_per_day >= 0.1 THEN 'Très régulier (1+ par 10 jours)'
WHEN orders_per_day >= 0.05 THEN 'Régulier (1+ par 20 jours)'
ELSE 'Occasionnel'
END as customer_segment,
COUNT(*) as nb_customers,
AVG(total_orders) as avg_orders
FROM customer_frequency
GROUP BY customer_segment
Et présente les insights: “40% des clients sont très réguliers. C’est une opportunité d’upselling. 35% sont occasionnels. C’est un segment qu’il faut travailler la rétention.”
La différence est qu’un pro utilise les données pour aider à prendre une meilleure décision.
Par où commencer si vous êtes sérieux
Après les bases (SELECT, FROM, WHERE, GROUP BY, HAVING), travaillez les CTEs.
Sans CTEs, vous êtes académique.
Puis les JOINs : comprendre quand utiliser INNER JOIN et quand LEFT JOIN change tout.
Puis CASE pour créer des colonnes conditionnelles, les agrégats dans CASE.
Les opérations ensemblistes pour manipuler plusieurs tables.
Et enfin les WINDOW FUNCTIONS. C’est là que vous atteignez le niveau que les entreprises attendent.
Mais attention : pas sur des toy datasets, sur des cas réels métier.
Et vous devez finaliser tout ça avec un projet qui relie le tout.
Conclusion
Le SQL n’est pas juste de la technique - c’est votre outil pour créer de la valeur en transformant des données brutes en décisions métier.
Les entreprises ne cherchent pas des gens qui connaissent la syntaxe SQL.
Elles cherchent des gens qui comprennent comment utiliser SQL pour résoudre leurs vrais problèmes.
Si vous voulez apprendre le SQL pour gagner de la confiance en poste ou en mission, rejoignez l’Accélérateur SQL, où vous allez apprendre du SQL dans des cas réels, comme ceux qu’on voit en entreprise.
Le programme a doucement démarré cette semaine, mais j’offre encore quelques places au tarif early-bird (197€ au lieu de 397€, soit une remise de -50%). Cette offre ne reviendra pas. Si vous voulez voir les détails, c’est par ici: Accélérateur SQL



