Intelligence Artificielle

Claude IA pour analyser des données et générer des synthèses

11 min de lecture

Ce que vous saurez faire à la fin

  1. Importer un fichier Excel ou CSV dans Claude pour analyse.
  2. Demander des analyses statistiques pertinentes (moyennes, distributions, corrélations).
  3. Générer des synthèses exécutives en 1 page à partir de données brutes.
  4. Préparer des dataviz textuelles ou des spécifications de graphiques.
  5. Intégrer Claude dans un workflow data-to-report mensuel.

Durée : 3h pour devenir efficace. Pré-requis : Claude Pro (avec uploads de fichiers, 20 USD/mois), fichiers de données Excel ou CSV propres, Excel ou Sheets pour vérifier les calculs, capacité à formuler des questions claires.

Étape 1 — Préparer le fichier de données

Avant d’importer dans Claude, nettoyez :

  • 1 ligne d’en-tête seulement (pas de cellules fusionnées)
  • 1 valeur par cellule (pas de « 12 (validé) » mais 2 colonnes)
  • Format date uniforme (AAAA-MM-JJ recommandé)
  • Pas de cellules vides en milieu de tableau (mettez « N/A » ou « 0 »)
  • Encodage UTF-8 si CSV
  • Supprimez les données ultra-confidentielles (anonymisez)

Étape 2 — Choisir entre upload Excel/CSV ou copier-coller

Sur Claude.ai :

  • Upload (préférable) : bouton trombone, choisissez fichier Excel ou CSV. Claude lit la structure et les données complètes (jusqu’à plusieurs Mo).
  • Copier-coller : bon pour < 100 lignes. Format markdown table préservé.
  • Capture d’écran : Claude OCR la table, mais erreurs possibles sur les chiffres. À éviter pour analyses précises.

Étape 3 — Premier prompt : décrire et explorer

[Upload de ventes_2025.xlsx]

Examine ce fichier de ventes 2025. Réponds-moi :
1. Combien de lignes et de colonnes ?
2. Quelles sont les colonnes et leurs types (texte, nombre, date) ?
3. Y a-t-il des valeurs manquantes ? Combien et où ?
4. Y a-t-il des doublons évidents ?
5. Quelle est la période couverte (1ère et dernière date) ?
6. Trois premières et trois dernières lignes pour exemple.
N'invente rien : si tu n'es pas sûr, dis-le.

Étape 4 — Analyses statistiques de base

À partir du fichier importé, calcule et présente sous forme de tableau :
1. Statistiques descriptives par colonne numérique :
   - moyenne, médiane, écart-type, min, max, Q1, Q3
2. Distribution par catégorie (top 10) pour chaque colonne texte
3. Top 10 et bottom 10 par chiffre d'affaires
4. Évolution mensuelle (tableau Mois / Total)
5. Saisonnalité : mois le plus fort et le plus faible
Vérifie tes calculs en explicitant les formules utilisées.

Étape 5 — Détecter les anomalies (outliers)

Identifie dans le fichier les anomalies potentielles :
1. Valeurs aberrantes : > 3 écarts-types de la moyenne
2. Doublons partiels (mêmes client + date + montant)
3. Dates incohérentes (futur, antérieures à 2020)
4. Montants négatifs s'ils ne devraient pas l'être
5. Catégories rares (apparaissant moins de 3 fois)

Pour chaque anomalie, explique pourquoi tu l'as identifiée et propose
une action : corriger, vérifier en source, ignorer.

Étape 6 — Calculer des corrélations

Analyse les corrélations entre :
- Volume de commandes et chiffre d'affaires (attendu : forte)
- Région et panier moyen (différence significative ?)
- Source d'acquisition (Organic / Ads / Social) et taux de conversion
- Jour de la semaine et performance

Pour chaque paire, indique :
- Corrélation forte (> 0,7) / moyenne (0,3-0,7) / faible (< 0,3)
- Direction (positive / négative)
- Insight actionnable

Étape 7 — Générer une synthèse exécutive

À partir de toutes les analyses précédentes, rédige une synthèse exécutive
de 1 page maximum, à destination du CEO :

1. SYNTHÈSE EN 3 PHRASES
2. 3 CHIFFRES CLÉS (avec variation YoY si possible)
3. 5 INSIGHTS MAJEURS (1 phrase chacun, hiérarchisés par impact)
4. 3 RECOMMANDATIONS D'ACTION (chacune chiffrée et avec ROI estimé)
5. 2 RISQUES IDENTIFIÉS À SURVEILLER

Ton : factuel, sans superlatif, sans jargon technique inutile.
Format : markdown, 400 mots max.

Étape 8 — Préparer les spécifications de graphiques

Propose 5 graphiques à construire pour un dashboard exécutif sur ces données.
Pour chaque graphique :
- Type recommandé (ligne / barres / heatmap / nuage / donut)
- Axes X et Y avec colonnes source
- Filtres conseillés
- Insight que le graphique doit révéler en 5 secondes
- Pièges à éviter (mauvaise échelle, biais visuel)

Format markdown table.

Vous pouvez ensuite construire ces graphiques dans Excel, Power BI ou Looker Studio.

Étape 9 — Comparer 2 datasets (avant / après)

[Upload ventes_2024.xlsx + ventes_2025.xlsx]

Compare ces 2 années en répondant à :
1. Évolution du CA total et par catégorie
2. Croissance des nouveaux clients vs récurrents
3. Changement du panier moyen
4. Nouvelles régions actives en 2025
5. Catégories qui s'effondrent
6. Conclusions : ce qui marche, ce qui casse

Présente sous forme de tableau de bord textuel.

Étape 10 — Construire des cohortes

À partir des données clients (tables clients + commandes), construis une
analyse de cohortes :
- Cohorte = mois de première commande
- Pour chaque cohorte, taux de réachat à M+1, M+3, M+6, M+12
- Identifie la meilleure et la pire cohorte
- Hypothèse : qu'est-ce qui explique l'écart ?

Présente sous forme de tableau triangulaire (cohortes en lignes, mois en colonnes).

Étape 11 — Demander un script Python pour répliquer l’analyse

Génère un script Python (pandas + matplotlib) qui reproduit toutes les analyses
ci-dessus à partir d'un fichier ventes_2025.xlsx.

Spécifications :
- Code commenté et lisible
- Utilise pandas pour les manipulations
- matplotlib ou seaborn pour les graphiques
- Sauvegarde des graphiques en PNG dans /output
- Génère un rapport HTML final
- Code testé en local possible (sans dépendance ésotérique)

Vous pouvez ensuite l’exécuter en local avec Anaconda ou Google Colab pour répéter chaque mois.

Étape 12 — Intégrer Claude dans un workflow mensuel

Workflow type pour un reporting mensuel :

  1. Export depuis CRM ou ERP en Excel le 1er du mois
  2. Nettoyage rapide (5 min)
  3. Upload dans Claude avec prompt template enregistré
  4. Génération synthèse + spécifications graphiques (10 min)
  5. Construction graphiques dans Looker Studio ou PowerPoint (30 min)
  6. Validation par DAF (10 min)
  7. Présentation au comité de direction le 7 du mois

Temps total : 1h vs 1 journée auparavant.

Étape 13 — Vérifier les chiffres de Claude

Claude peut se tromper sur des calculs. Vérifications systématiques :

  • Recalculer manuellement 2-3 chiffres clés (somme, moyenne) dans Excel
  • Comparer un total avec une source officielle (CRM, ERP)
  • Demander à Claude d’expliciter sa formule pour chaque calcul
  • Faire un sanity check (les % somment à 100, les totaux concordent)
  • Sur les anomalies détectées, vérifier 2 ou 3 lignes à la main

Étape 14 — Sécuriser et conformer l’usage

Règles RGPD-équivalent :

  • Ne jamais uploader des données nominatives non anonymisées
  • Pseudonymiser : remplacez « Awa Diop » par « Client_001 »
  • Supprimer numéros de téléphone, emails, RIB
  • Pour les données financières : tronquez les chiffres très détaillés
  • Vérifiez les CGU Anthropic : pas de retraining sur vos données pour Claude (Pro / Team / Enterprise)
  • Supprimez la conversation après usage si données sensibles

Erreurs courantes en analyse de données avec Claude

  • Demander tout en 1 prompt : dispersé, peu fiable. Décomposez.
  • Ne pas vérifier les chiffres : 1 erreur sur 50 calculs = crédibilité détruite.
  • Données nominatives : risque conformité majeur.
  • Pas de versionning des prompts : impossible de répliquer le rapport mois suivant.
  • Dépendance complète à Claude : sans script Python répliquant, vous êtes prisonnier de l’IA.

Checklist analyse de données avec Claude

✓ Fichier de données nettoyé et anonymisé
✓ Format Excel ou CSV correctement structuré
✓ Premier prompt d'exploration testé
✓ Statistiques descriptives validées
✓ Anomalies détectées et traitées
✓ Corrélations calculées et interprétées
✓ Synthèse exécutive 1 page rédigée
✓ Spécifications de 5 graphiques formalisées
✓ Comparaison année N-1 réalisée
✓ Cohortes construites
✓ Script Python répliquant disponible
✓ Workflow mensuel documenté
✓ Vérification croisée des chiffres clés
✓ Conformité RGPD-équivalent respectée

Le cas d usage qui transforme l analyse de donnees

Claude excelle dans une famille de taches que ses concurrents traitent moins bien : la synthese qualitative de donnees quantitatives. Charger un fichier Excel ou CSV de 5 000 a 50 000 lignes, demander une analyse, et recevoir en quelques minutes un commentaire structure qui identifie les tendances, les anomalies, et les implications. C est un usage que les tableurs traditionnels ne couvrent pas — Excel calcule, Claude raconte.

La force vient de trois capacites complementaires. La fenetre de contexte de 200 000 tokens accepte un dataset substantiel dans le prompt. L outil Code Interpreter (disponible dans la version Pro) permet a Claude d ecrire et d executer du Python pour calculer ce qu un LLM ne sait pas faire seul. La capacite de generer des visualisations exportables (Mermaid pour les diagrammes, HTML/JS pour les graphiques, code matplotlib pour les figures).

Cinq patterns d analyse qui fonctionnent

1. L analyse des ventes par segment. Charger un export CRM (clients, produits, dates, montants). Prompt : Identifie les 5 segments clients les plus rentables sur les 12 derniers mois, en croisant secteur d activite, taille, et anciennete. Propose 3 actions commerciales pour chacun. Le retour est utilisable directement en comite de direction.

2. La synthese de retours clients. Charger un export d enquete satisfaction ou de tickets support. Prompt : Categorise ces 1 200 retours en 8-12 themes principaux, donne la frequence de chacun, et identifie les 3 themes qui meritent une action immediate. Le travail manuel equivalent prend une semaine ; Claude le fait en 3 minutes.

3. L analyse concurrentielle. Charger les pages produits de 5 concurrents en HTML ou texte brut. Prompt : Compare ces offres sur prix, fonctionnalites, positionnement, et identifie 5 angles ou notre offre peut se differencier. Equivalent d une mission de cabinet a 5 000 EUR realisee en quelques minutes.

4. La detection d anomalies dans des logs. Charger un export de logs serveur, de transactions bancaires ou de tickets support. Prompt : Repere les patterns inhabituels, les pics de volume, les utilisateurs aux comportements atypiques. Suggere des hypotheses d explication.

5. La generation de tableaux de bord narratifs. A partir de KPI bruts, produire le commentaire de gestion mensuel. Prompt : Voici les chiffres de novembre vs octobre vs N-1. Redige le commentaire de gestion en 300 mots, ton factuel, structure par dimension (CA, marge, tresorerie, opex), avec 3 alertes et 3 succes.

La discipline qui rend ces analyses fiables

Le piege de l analyse par LLM est l hallucination chiffree : Claude peut citer un total ou un pourcentage qui sonne plausible mais est faux. Trois disciplines reduisent ce risque a un niveau acceptable.

Ne jamais demander a Claude de faire un calcul. Les LLM sont mauvais en arithmetique. Faire les calculs dans Excel ou SQL, charger les chiffres deja calcules, et demander a Claude de les interpreter et de les mettre en mots. Utiliser Code Interpreter quand un calcul est strictement necessaire — il execute du Python deterministe.

Croiser les chiffres avec l audit interne. Pour tout chiffre que Claude restitue dans une synthese, le verifier dans le source. Un total fausse une narration entiere. Verifier prend 2-3 minutes par tableau et evite les surprises en reunion.

Demander a Claude de pointer ses incertitudes. Ajouter dans le prompt : A la fin de l analyse, liste 3 elements ou tu as fait une hypothese ou tu manques d information. Cette instruction donne une vue claire sur les zones a recreuser.

Les limites a ne pas franchir

Claude ne remplace pas une analyse statistique rigoureuse pour des decisions a fort enjeu (etude de marche reglementaire, etude clinique, audit financier). Pour ces usages, un statisticien et un outil dedie (R, Stata, Python avec scikit-learn) restent indispensables. Claude est outil de pre-analyse et de mise en narration ; il ne certifie pas la validite des conclusions.

Pour les donnees personnelles ou sensibles, utiliser exclusivement Claude Team ou Enterprise (DPA RGPD, non-retention, hebergement UE). La version gratuite est utilisable pour des donnees anonymisees ou publiques.

FAQ

Quelle taille de fichier Claude peut-il vraiment traiter ?
Le plan Pro accepte jusqu a 200 000 tokens (environ 500 pages texte ou 30 000 lignes CSV). En pratique, au-dessus de 100 000 tokens, la qualite de l analyse baisse sur les details. Pour des datasets plus grands, decouper en sous-ensembles et faire faire la synthese finale par Claude sur les sous-syntheses.

Faut-il preferer Claude ou ChatGPT pour l analyse de donnees ?
Subjectivement, Claude excelle sur les analyses qualitatives, ChatGPT sur les analyses qui necessitent du code Python (Code Interpreter natif plus mature). Tester les deux sur un dataset de reference et choisir celui qui produit le rendu prefere par l equipe est la bonne demarche.

Comment integrer Claude dans un workflow de reporting recurrent ?
L API Anthropic permet d automatiser : un cron mensuel qui extrait les donnees du CRM, les envoie a Claude avec un prompt-template stocke en config, et publie le rapport sur un drive partage. La logique tient en 50-100 lignes de Python ou Node.js. Couts d API typiques : 0,50 a 5 USD par rapport mensuel.

Peut-on faire des graphiques avec Claude ?
Oui via Code Interpreter (PNG/SVG generes par matplotlib) ou via la generation de specs Mermaid pour des diagrammes simples. Pour des visualisations complexes, exporter les donnees vers Tableau, Power BI ou Plotly Studio reste superieur.

References

Articles connexes Claude

Partager