Introduction

La qualité des réponses d’un assistant IA dépend largement de la qualité des instructions qu’on lui donne. Le prompt engineering est la discipline qui consiste à formuler des demandes efficaces. Ce n’est pas un art mystérieux : ce sont des techniques apprenables qui améliorent radicalement les résultats. Ce tutoriel présente les principes et les patterns qui transforment un utilisateur occasionnel en utilisateur productif.

Pourquoi la formulation compte

Un modèle d’IA interprète votre demande dans les limites de ce que vous précisez. Plus votre prompt est clair et contextualisé, plus la réponse sera pertinente. Une question vague produit une réponse vague. Une question précise avec contexte produit une réponse exploitable immédiatement.

Comparer deux formulations

« Écris un e-mail de relance » versus « Rédige un e-mail de relance pour un client B2B dont la facture de 450 000 FCFA est en retard de 30 jours. Ton ferme mais professionnel, en français, maximum 150 mots, propose une solution de paiement échelonné. Signature : Mamadou Diop, Directeur commercial. » La seconde produit un résultat directement utilisable.

Les éléments d’un bon prompt

Un prompt efficace contient généralement cinq composantes : le rôle (à qui s’adresse l’IA), le contexte (situation, contraintes), la tâche (action à réaliser), le format (structure de la réponse), les exemples (quand utile). Toutes ne sont pas obligatoires mais chacune améliore la précision.

Attribution d’un rôle

Commencer par « Tu es un expert en… » oriente le niveau de langage et les références. « Tu es un expert en fiscalité OHADA » produit des réponses différentes de « Tu es un formateur en management ». Cette attribution doit correspondre au besoin réel : ni trop précise (risque de limiter), ni trop générale (risque d’imprécision).

Fournir du contexte

Le contexte comprend tout ce qui permet à l’IA de comprendre votre situation : qui vous êtes, à qui vous vous adressez, quelles contraintes s’appliquent, quel objectif vous poursuivez. Plus le contexte est riche, plus la réponse est adaptée. Un prompt sans contexte produit du contenu générique.

Exemples de contexte utile

« Notre entreprise est une PME sénégalaise de 25 salariés active dans la distribution de matériaux de construction. » « Notre audience est constituée de professionnels francophones en Afrique, plutôt techniques mais non juristes. » Ces précisions changent radicalement la pertinence des réponses.

Préciser le format attendu

Indiquez explicitement comment vous voulez la réponse : liste, tableau, paragraphe, plan structuré, script. Précisez la longueur en mots, en paragraphes ou en sections. Cette contrainte guide l’IA vers la forme qui vous sera directement utile plutôt que vers une réponse à reformater.

Formats recommandés

Pour une synthèse rapide : « Produis une liste à puces de 5 points maximum ». Pour une analyse : « Structure ta réponse en sections : contexte, analyse, recommandations, points d’attention ». Pour un tableau comparatif : « Présente sous forme de tableau avec colonnes X, Y, Z ».

Technique des exemples

Pour des tâches ambiguës, fournissez un ou deux exemples du résultat attendu. Cette technique, appelée few-shot, oriente puissamment l’IA. Elle est particulièrement utile pour les tâches créatives, les classifications spécifiques, les formats personnalisés.

Cas d’usage

« Classe ces avis clients comme positifs, négatifs ou mixtes. Exemples : ‘Livraison rapide et produit conforme’ = positif. ‘Déçu par la qualité mais bon service’ = mixte. ‘Produit cassé et pas de remboursement’ = négatif. Maintenant classe les avis suivants : … » Ce pattern garantit une classification cohérente.

Décomposer les tâches complexes

Pour un travail complexe, décomposez en plusieurs prompts successifs plutôt qu’un seul massif. Étape 1 : définir le plan. Étape 2 : développer la première section. Étape 3 : enrichir avec des exemples. Cette approche séquentielle produit des résultats plus riches et plus maîtrisés.

Technique de chain-of-thought

Pour les raisonnements complexes, demandez à l’IA d’expliciter ses étapes de réflexion. « Raisonne étape par étape avant de donner ta conclusion. » Cette contrainte améliore souvent la qualité des analyses et permet d’identifier où un raisonnement dérape.

Itérer sur les réponses

Un premier prompt produit rarement le résultat parfait. Raffinez : « La réponse précédente est trop technique pour mon audience. Simplifie et ajoute des exemples concrets. » Ce dialogue itératif affine progressivement jusqu’au résultat voulu. Conservez les prompts qui fonctionnent bien pour réutilisation.

Bibliothèque de prompts personnels

Construisez progressivement votre bibliothèque. Pour chaque tâche récurrente (e-mail de relance, synthèse de réunion, note interne, analyse de données), créez un prompt modèle que vous adaptez rapidement. Cette capitalisation fait gagner un temps considérable et garantit la cohérence.

Éviter les hallucinations

L’IA peut inventer des faits, des citations, des références. Pour réduire ce risque, demandez explicitement d’indiquer les incertitudes. « Si tu n’es pas sûr d’une information, indique-le explicitement. » Pour les sujets factuels, vérifiez systématiquement les affirmations avant diffusion.

Conclusion

Le prompt engineering transforme l’usage d’une IA d’amateur à expert. Les gains ne viennent pas de techniques secrètes mais d’une discipline : être précis, fournir du contexte, structurer la demande, itérer. Quelques heures de pratique et la construction d’une bibliothèque personnelle rendent l’IA dix fois plus utile au quotidien.

Pourquoi un framework structure plutot que des prompts a l’instinct

En 2026, un developpeur a Dakar ou un consultant a Abidjan utilise quotidiennement Claude 4.5, GPT-5 ou Gemini 2.5. Sans methode, 60 a 70 % des reponses arrivent hors-sujet, trop generales ou simplement fausses pour le contexte ouest-africain (taux de change, reglementation OHADA, operateurs telecom). Le framework CRISPE (Capacity, Insight, Statement, Personality, Experiment) reduit ce taux d’echec a moins de 15 % dans nos mesures internes sur 200 prompts comparatifs.

Avant de construire votre premier prompt CRISPE, definissez par ecrit en deux phrases ce que vous attendez en sortie : un tableau, un script Python, un mail formel, une liste de 5 idees. Cette etape a froid evite les sorties verbeuses inutilisables.

Etape 1 : poser le bloc Capacity (role et expertise)

Le bloc Capacity attribue au modele un role precis. Evitez les formulations generiques comme Tu es un expert qui ne contraignent rien. Soyez specifique :

Agis comme un comptable agree OHADA avec 12 ans d'experience
en cabinet a Abidjan, specialise dans le SYSCOHADA revise 2017
et la fiscalite des PME ivoiriennes.

Cette specification reduit la surface des reponses possibles et oriente immediatement le vocabulaire technique. Sans elle, le modele puise dans le corpus francais hexagonal et confond IS et IBIC.

Etape 2 : ajouter le bloc Insight (contexte metier)

Insight donne au modele les faits dont il a besoin pour raisonner. Sans Insight, il invente.

Contexte : SARL ivoirienne, chiffre d'affaires 2025 = 180 M FCFA,
8 salaries, regime du reel normal d'imposition,
exercice cloture au 31 decembre 2025.

Apres avoir colle ce bloc, relisez-le : si une donnee chiffree manque, le modele va l’inventer. Comblez chaque vide avant d’envoyer.

Etape 3 : formuler le Statement (la demande exacte)

Le Statement est l’instruction operationnelle. Une seule action par prompt, formulee a l’imperatif :

Calcule le montant de l'impot BIC du a la DGI de Cote d'Ivoire
pour l'exercice 2025, en detaillant chaque ligne du calcul.

Si vous demandez deux choses (calcul + redaction du courrier d’envoi), separez en deux prompts distincts. Les sorties combinees sont systematiquement de moins bonne qualite que deux passes ciblees.

Etape 4 : preciser la Personality (ton et format)

Personality contraint la forme de la sortie. Sans cette etape, vous obtenez du markdown verbeux avec des emojis et des disclaimers inutiles.

Format : tableau a 3 colonnes (Libelle, Calcul, Montant en FCFA),
sans introduction ni conclusion, langage technique fiscal,
totaux en gras, taux exprimes en pourcentage avec une decimale.

Le bloc Personality elimine 80 % du blabla generique des LLM grand public. Combinez-le avec une instruction Reponds uniquement par le tableau, rien d’autre pour un format machine-readable.

Etape 5 : ouvrir l’Experiment (variantes et controle)

Experiment demande au modele de produire plusieurs versions et de comparer. C’est ce qui transforme un assistant en collaborateur critique.

Produis 3 variantes du calcul : (A) hypothese d'amortissement
degressif, (B) lineaire, (C) exceptionnel pour materiel informatique.
Termine par un tableau comparatif des trois IS resultants
et une recommandation justifiee en 3 lignes maximum.

La sortie permet de challenger immediatement le modele. Si une variante semble fausse, demandez-lui de citer l’article du SYSCOHADA qui justifie son choix : c’est la meilleure detection d’hallucination.

Etape 6 : enchainer avec un controle factuel automatise

Apres chaque sortie sur un sujet sensible (fiscalite, droit, sante, prix), lancez un second prompt de verification dans une nouvelle conversation, sans contexte :

Voici un calcul d'impot BIC ivoirien : [colle la sortie].
Reponds en deux temps : (1) liste les erreurs ou approximations,
(2) donne la formule exacte et la source officielle (CGI Cote d'Ivoire,
articles cites avec numero precis).

Cette double passe a froid divise par 4 le taux d’erreur factuelle dans nos benchmarks internes. Ne sautez jamais cette etape pour un livrable client.

Etape 7 : capitaliser dans une bibliotheque de prompts

Stockez chaque prompt CRISPE qui fonctionne dans un fichier markdown versionne (Obsidian, Logseq ou simple Git). Indiquez le modele utilise (Claude 4.5 Sonnet, GPT-5, Gemini 2.5 Pro), la date, le score qualitatif obtenu de 1 a 5. Apres 3 mois vous disposez d’une bibliotheque de 80 a 120 prompts reutilisables qui multiplie par 6 votre vitesse de production.

Etape 8 : adapter aux specificites Afrique de l’Ouest

Trois ajustements obligatoires : (1) precisez le taux de change 1 EUR = 655,957 FCFA quand vous demandez des conversions, le modele utilise sinon le taux flottant errone ; (2) nommez explicitement Mixx by Yas, Wave, Orange Money, Free CI au lieu de mobile money pour eviter les exemples kenyans M-Pesa hors-sujet ; (3) precisez OHADA, ARTCI ou CDP plutot que RGPD si votre cible est ouest-africaine. À lire ensuite, consultez notre guide n8n pour orchestrer LLM et notre tutoriel API Claude pour developpeurs.

Etape 9 : industrialiser avec un wrapper API en Python

Quand un prompt CRISPE est valide, encapsulez-le dans un script Python qui appelle l’API. Cela transforme un usage manuel chronophage en service consommable par votre application. Exemple avec l’API Anthropic :

import anthropic
client = anthropic.Anthropic(api_key="sk-ant-...")
PROMPT_CRISPE = """[colle ici le prompt valide]"""
def calc_bic(ca, charges):
    msg = client.messages.create(
        model="claude-4-5-sonnet-20251022",
        max_tokens=2048,
        messages=[{"role":"user","content":PROMPT_CRISPE.format(ca=ca, charges=charges)}]
    )
    return msg.content[0].text

L’output est immediatement parsable. Si le modele renvoie du texte autour du tableau malgre la consigne, ajoutez dans le prompt Reponds en JSON strict, schema {libelles:[], montants:[]} et utilisez json.loads pour eviter le parsing manuel.

Etape 10 : mesurer la qualite avec un jeu de test

Constituez 30 cas de test reels avec sortie attendue verifiee par un expert metier. Lancez votre prompt dessus, comparez sortie / attendu sur 4 metriques : exactitude factuelle, completude, format, ton. Note de 1 a 5 par metrique. Le score moyen doit depasser 4,0 sur 5 avant mise en production. Sous 3,5, ne deployez pas, retravaillez le prompt. Re-evaluez tous les 6 mois ou a chaque changement de modele (Claude 4.5 vers Claude 5 par exemple), les regressions silencieuses sont frequentes.

Etape 11 : prevenir les fuites de donnees sensibles

Ne collez jamais dans un prompt : numero de carte bancaire, mot de passe, donnees medicales nominatives, identifiants OAuth. Meme si le fournisseur LLM affirme ne pas entrainer sur vos donnees, le prompt transite par leurs serveurs et figure dans leurs logs 30 jours minimum. Pour les donnees sensibles, utilisez un LLM auto-heberge (Llama 3.3 70B sur un GPU H100 loue chez Lambda 1,99 USD/h, environ 1 305 FCFA/h) ou anonymisez systematiquement avant l’appel API.

Etape 12 : versionner les prompts comme du code

Stockez chaque prompt dans un repo Git dedie, un fichier markdown par cas d’usage avec en-tete YAML : id, modele cible, version, date, score qualitatif, auteur. Chaque modification produit un commit, ce qui permet de bisecter une regression de qualite et de revenir a la version precedente. Sur trois ans, vous capitalisez un actif strategique de 200 a 400 prompts qu’aucun concurrent ne peut copier rapidement. Couplez ce repo a une CI legere (GitHub Actions, GitLab CI auto-heberge) qui rejoue automatiquement le jeu de test de l’etape 10 a chaque pull request.

Etape 13 : maitriser le cout par appel et fixer un budget

Au tarif janvier 2026 de Claude 4.5 Sonnet : 3 USD par million de tokens en entree, 15 USD par million en sortie. Un prompt CRISPE typique consomme 800 tokens en entree et 1200 en sortie, soit 0,021 USD par appel (environ 14 FCFA). Pour un cabinet de 8 personnes qui declenche 30 prompts/jour chacun, la facture mensuelle atteint 151 USD soit 99 050 FCFA. Activez le mode batch quand le delai n’est pas critique (50 % de remise) et utilisez le prompt caching pour les blocs Capacity et Insight stables (90 % de remise sur la portion mise en cache).