Créer un podcast sans micro ni studio
Lancer un podcast nécessitait traditionnellement un bon microphone (50 000 à 200 000 FCFA), un logiciel de montage audio, une pièce calme et des heures d’enregistrement. Avec les outils de voix synthétique IA, vous pouvez produire des épisodes de podcast de qualité professionnelle à partir d’un simple script texte. Ce tutoriel vous guide dans la création complète d’un podcast, du script à la publication, en utilisant uniquement des outils IA.
Étape 1 : Planifier et scripter les épisodes avec ChatGPT
Prompt pour planifier une saison complète :
"Je veux créer un podcast hebdomadaire appelé 'Tech Teranga' sur
la technologie et le digital en Afrique de l'Ouest. Public ciblé :
jeunes professionnels sénégalais intéressés par la tech.
Durée par épisode : 10-15 minutes.
Crée un plan de 12 épisodes (1 saison) avec :
- Le titre de chaque épisode
- Un résumé en 3 lignes
- Les points clés à aborder
- Un invité fictif pertinent (type de profil)"
Résultat type :
Épisode 1 : "L'écosystème startup au Sénégal en 2025"
Épisode 2 : "Mobile Money : comment Wave a changé la donne"
Épisode 3 : "Devenir développeur web à Dakar : parcours et salaires"
...
Prompt pour scripter un épisode complet :
"Écris le script complet de l'épisode 1 de 'Tech Teranga' :
'L'écosystème startup au Sénégal en 2025'.
Format du script :
[INTRO] : accroche (30 secondes)
[SEGMENT 1] : présentation du sujet (3 minutes)
[SEGMENT 2] : les chiffres clés (3 minutes)
[SEGMENT 3] : les success stories sénégalaises (4 minutes)
[SEGMENT 4] : les défis et opportunités (3 minutes)
[OUTRO] : résumé + appel à l'action (1 minute)
Ton : accessible, énergique, fier de l'Afrique.
Inclure des données chiffrées et des noms réels de startups sénégalaises."
Étape 2 : Générer la voix avec ElevenLabs
ElevenLabs (elevenlabs.io) est le leader de la synthèse vocale IA. Ses voix sont quasi indistinguables de vraies voix humaines, avec des intonations naturelles, des pauses et des émotions.
Configuration ElevenLabs :
1. Créez un compte sur elevenlabs.io
2. Plan gratuit : 10 000 caractères/mois (~10 minutes d'audio)
Plan Starter : 5$/mois (30 000 caractères/mois)
Plan Creator : 22$/mois (100 000 caractères/mois) — recommandé pour un podcast
Plan Pro : 99$/mois (500 000 caractères/mois)
3. Choisir une voix :
- Bibliothèque de voix : des centaines de voix pré-entraînées
- Filtrez par : langue (French), genre, âge, ton
- Voix recommandées pour un podcast en français :
→ "Antoine" : voix masculine posée, idéale pour narration
→ "Charlotte" : voix féminine chaleureuse et professionnelle
→ "Serena" : voix féminine dynamique et engageante
OU clonez votre propre voix (plan Creator+) :
- Uploadez 1-3 minutes d'enregistrement de votre voix
- ElevenLabs crée un clone vocal qui parle comme vous
- Idéal si vous voulez "votre" voix sans enregistrer chaque épisode
4. Paramètrès de génération :
Stability : 50% (équilibre entre cohérence et expressivité)
Clarity : 75% (netteté de la voix)
Style exaggeration : 30% (pour un ton podcast dynamique)
5. Générer l'audio :
- Collez votre script segment par segment
- Chaque segment génère un fichier MP3
- Téléchargez tous les segments
Utilisation via l’API Python
pip install elevenlabs
from elevenlabs import ElevenLabs
client = ElevenLabs(api_key="votre-clé-elevenlabs")
# Générer l'audio d'un segment
def generer_segment(texte, nom_fichier, voice_id="pNInz6obpgDQGcFmaJgB"):
"""Génère un fichier audio à partir de texte"""
audio = client.text_to_speech.convert(
text=texte,
voice_id=voice_id, # ID de la voix choisie
model_id="eleven_multilingual_v2", # Modèle multilingue (français)
voice_settings={
"stability": 0.5,
"similarity_boost": 0.75,
"style": 0.3,
"use_speaker_boost": True
}
)
with open(nom_fichier, "wb") as f:
for chunk in audio:
f.write(chunk)
print(f"✓ Segment généré : {nom_fichier}")
# Générer tous les segments de l'épisode
segments = {
"01_intro.mp3": """Bienvenue dans Tech Teranga, le podcast qui explore
la révolution numérique en Afrique de l'Ouest. Je suis votre hôte,
et aujourd'hui on plonge dans l'écosystème startup au Sénégal en 2025.
C'est parti !""",
"02_segment1.mp3": """L'année 2025 marque un tournant pour les startups
sénégalaises. Avec plus de 200 startups tech activés à Dakar, un
écosystème de financement en pleine structuration, et une population
jeune ultra-connectée, le Sénégal s'affirme comme le hub tech numéro
un de l'Afrique francophone...""",
"03_segment2.mp3": """Parlons chiffres. En 2024, les startups sénégalaises
ont levé plus de 50 millions de dollars de financements...""",
# ... autres segments
}
for fichier, texte in segments.items():
generer_segment(texte, fichier)
Étape 3 : Alternatives à ElevenLabs
OpenAI TTS
from openai import OpenAI
client = OpenAI(api_key="votre-clé-openai")
# 6 voix disponibles : alloy, echo, fable, onyx, nova, shimmer
response = client.audio.speech.create(
model="tts-1-hd", # "tts-1" (rapide) ou "tts-1-hd" (haute qualité)
voice="onyx", # Voix grave et posée — bonne pour podcast
input="Bienvenue dans Tech Teranga, votre podcast tech en Afrique de l'Ouest.",
speed=1.0 # 0.25 à 4.0 (1.0 = normal)
)
response.stream_to_file("intro_openai.mp3")
# Tarif : ~15$ / 1M caractères
# ~100 000 caractères = 1 épisode de 15 min ≈ 1.5$
# Qualité : bonne mais moins naturelle qu'ElevenLabs
Google Cloud Text-to-Speech
# Installation
pip install google-cloud-texttospeech
from google.cloud import texttospeech
client = texttospeech.TextToSpeechClient()
# Voix Neural2 (haute qualité)
input_text = texttospeech.SynthesisInput(
text="Le Sénégal est en train de devenir le hub technologique de l'Afrique de l'Ouest."
)
voice = texttospeech.VoiceSelectionParams(
language_code="fr-FR",
name="fr-FR-Neural2-A", # Voix féminine française haute qualité
# Autres options : fr-FR-Neural2-B (masculine), fr-FR-Neural2-C, D, E
)
audio_config = texttospeech.AudioConfig(
audio_encoding=texttospeech.AudioEncoding.MP3,
speaking_rate=1.0, # Vitesse (0.25 à 4.0)
pitch=0.0, # Hauteur (-20 à +20)
effects_profile_id=["headphone-class-device"] # Optimisation casque
)
response = client.synthesize_speech(
input=input_text, voice=voice, audio_config=audio_config
)
with open("segment_google.mp3", "wb") as f:
f.write(response.audio_content)
# Tarif : 16$ / 1M caractères (voix Neural2)
# 1M caractères gratuits/mois pour les nouveaux comptes
Étape 4 : Monter le podcast avec Audacity ou Descript
Montage avec Descript (méthode IA)
Descript (descript.com) — Montage audio/vidéo par texte
Principe : vous éditez l'audio comme un document texte.
Supprimez un mot dans le texte → il est supprimé de l'audio.
Workflow :
1. Importez tous vos segments audio (intro, segments 1-4, outro)
2. Descript les transcrit automatiquement
3. Éditez le texte pour couper les passages indésirables
4. Ajoutez des transitions entre segments (fondu enchaîné)
6. Utilisez "Studio Sound" pour améliorer la qualité audio
7. Exportez en MP3
Fonctionnalités IA de Descript :
- "Filler word removal" : supprime automatiquement les "euh", "hum"
- "Studio Sound" : améliore la qualité comme un studio professionnel
- "Eye contact correction" : pour les vidéo-podcasts
- "Green screen" : changement de fond automatique
Tarif : gratuit (1h de transcription/mois)
ou 24$/mois (10h/mois — suffisant pour 4 épisodes)
Montage avec Audacity (gratuit)
Audacity — Logiciel open source gratuit (audacity.org)
Workflow de montage :
1. Fichier → Importer → Audio → sélectionnez tous vos segments
Chaque segment apparaît sur une piste séparée
2. Arrangez les segments dans l'ordre :
Piste 2 : Segment 1 (voix IA)
Piste 4 : Segment 2 (voix IA)
...
3. Ajoutez des fondus enchaînés :
- Sélectionnez la fin d'un segment (2-3 secondes)
- Effet → Fondu en fermeture
- Sélectionnez le début du suivant
- Effet → Fondu en ouverture
5. Normalisez le volume :
- Sélectionnez tout (Ctrl+A)
- Effet → Normaliser → -1.0 dB
6. Exportez :
- Fichier → Exporter → Exporter en MP3
- Qualité : 192 kbps (standard podcast)
- YouTube Audio Library (studio.youtube.com) — gratuit avec attribution
Étape 5 : Créer la couverture et les visuels
Couverture du podcast avec Canva :
1. Canva → Créer → "Podcast Cover" (3000×3000 pixels)
2. Template recommandé : style moderne, couleurs vives
3. Éléments à inclure :
- Nom du podcast : "TECH TERANGA"
- Tagline : "La tech en Afrique de l'Ouest"
- Votre nom ou logo
- Couleurs cohérentes avec votre marque
Prompt Midjourney pour illustration :
/imagine podcast cover art for "Tech Teranga", African technology podcast,
modern geometric patterns inspired by Senegalese textiles, digital éléments,
orange and teal color scheme, bold typography space, professional podcast
cover design, 3000x3000 --ar 1:1 --v 6
Miniatures d'épisodes avec Canva :
- Créez un template de miniature
- Pour chaque épisode : changez le titre et le numéro
- Gardez le même style visuel pour la cohérence
- Exportez en 1400×1400 (format Apple Podcasts)
Étape 6 : Publier et distribuer
Plateformes d'hébergement de podcast :
1. SPOTIFY FOR PODCASTERS (ex-Anchor) — GRATUIT
- podcasters.spotify.com
- Hébergement illimité gratuit
- Distribution automatique sur Spotify, Apple Podcasts, Google Podcasts
- Statistiques d'écoute
- Monétisation possible (publicités)
Procédure :
a. Créez un compte sur podcasters.spotify.com
b. Renseignez les informations du podcast (nom, description, catégorie)
c. Uploadez votre couverture (3000×3000)
d. Uploadez votre premier épisode (MP3)
e. Soumettez pour distribution
f. En 24-48h, votre podcast est sur Spotify et Apple Podcasts
2. BUZZSPROUT — Plan gratuit (2h d'upload/mois)
- buzzsprout.com
- Interface très simple
- Transcription IA incluse
- Site web du podcast généré automatiquement
- Plan payant : 12$/mois (3h/mois)
3. ACAST — Gratuit avec publicités
- Bon pour la monétisation
- Insertion dynamique de publicités
- Statistiques avancées
FLUX RSS — Le cœur de la distribution :
Chaque hébergeur génère un flux RSS unique.
Ce flux est soumis aux annuaires :
- Apple Podcasts : podcastsconnect.apple.com
- Google Podcasts : podcastsmanager.google.com
- Deezer : podcasters.deezer.com
Une fois soumis, chaque nouvel épisode uploadé est automatiquement
distribué sur toutes les plateformes.
Coût total d’un podcast IA
Version gratuite : ChatGPT gratuit (script) + OpenAI TTS (~1.5$/épisode) + Audacity (montage) + Canva gratuit (visuels) + Spotify for Podcasters (hébergement) = environ 1 000 FCFA par épisode. Qualité : correcte, voix un peu robotique.
Version recommandée : ChatGPT Plus 20$/mois + ElevenLabs Creator 22$/mois + Descript 24$/mois + Canva Pro 12$/mois = environ 78$/mois (≈ 47 000 FCFA). Pour 4 épisodes/mois, cela revient à environ 12 000 FCFA par épisode. Qualité : professionnelle, voix quasi indistinguable d’un humain.
Comparaison : un podcast traditionnel avec un prestataire (enregistrement studio + montage) coûte entre 50 000 et 200 000 FCFA par épisode à Dakar. La version IA divise le coût par 5 à 15 tout en permettant une production plus rapide et régulière.
Considérations éthiques
Transparence. Informez vos auditeurs que la voix est synthétique. Ajoutez une mention dans la description du podcast : « Voix générée par IA » ou « Narré par une voix IA ». La transparence renforce la confiance, et de plus en plus d’auditeurs acceptent les voix IA pour du contenu informatif.
Droits d’utilisation. Les voix générées par ElevenLabs ou OpenAI TTS sont libres d’utilisation commerciale selon leurs conditions d’utilisation (vérifiez les CGU de votre plan). Attention au clonage vocal : ne clonez jamais la voix d’une personne sans son consentement explicite.
Contenu original. L’IA génère le script, mais votre valeur ajoutée est votre expertise, votre point de vue et votre connaissance du contexte local. Personnalisez toujours les scripts générés avec vos insights, vos anecdotes et votre perspective africaine unique.