ITSkillsCenter
Développement Web

Installer et configurer Airbyte OSS sur VPS Hetzner — tutoriel 2026

11 دقائق للقراءة

Méta-description : Airbyte OSS est l’alternative gratuite et self-hostée à Fivetran. Ce tutoriel installe Airbyte sur Hetzner CX32, configure les connecteurs PostgreSQL, Stripe, Google Sheets, et orchestre des synchronisations vers ton entrepôt de données — adapté aux PME ouest-africaines à budget contraint.

Pourquoi Airbyte OSS en 2026 ?

L’intégration de données est le talon d’Achille de toute PME qui grandit. Tu accumules un système de caisse cloud, un PostgreSQL pour ton ERP interne, un Stripe pour les paiements internationaux, un compte Wave Money pour les paiements locaux, des Google Sheets remplies par les commerciaux, un MailChimp pour les campagnes… et personne ne sait combien tu vends réellement par jour, par produit, par canal. Les solutions commerciales existent (Fivetran, Stitch, Hevo) mais leur tarif est rédhibitoire pour une PME africaine : Fivetran démarre à 1 500 USD par mois pour des volumes modestes.

Airbyte Open Source est l’alternative qui change la donne. C’est un outil d’ELT (Extract-Load-Transform) self-hostable, avec un catalogue de plus de 300 connecteurs maintenus par la communauté et l’équipe Airbyte. Il fonctionne sur un simple VPS, expose une UI web claire, et coûte uniquement le prix de ton infrastructure. Pour une PME basée à Dakar, Abidjan, Bamako, Ouagadougou ou Conakry, c’est la brique manquante pour construire un véritable entrepôt de données sans externaliser ses données vers les USA.

Ce tutoriel s’inscrit dans le guide général Data engineering self-hosted 2026. Tu vas y apprendre à installer Airbyte sur Hetzner CX32, configurer une source PostgreSQL et une source Stripe, créer une destination vers ton entrepôt, et planifier des synchronisations incrémentales fiables.

Prérequis

  • VPS Hetzner Cloud CX32 minimum (8 Go RAM, 80 Go SSD, ~5 200 F CFA/mois). Airbyte est gourmand : un CX22 ne suffit pas en production.
  • Ubuntu 22.04 LTS ou 24.04 LTS.
  • Docker et Docker Compose installés. Si pas encore fait : curl -fsSL https://get.docker.com | sh.
  • Compétences SQL et notion de bases de données (PostgreSQL, MySQL).
  • Au moins une source de données accessible : un PostgreSQL, un compte Stripe en mode lecture, un Google Sheet partagé, ou un fichier CSV en S3.
  • Une destination : PostgreSQL, BigQuery, Snowflake, ou un simple bucket S3 / Hetzner Object Storage.

Architecture cible

Airbyte tourne entièrement en conteneurs Docker. Le déploiement minimal comporte 6 services principaux : Airbyte Server (API), Airbyte Webapp (UI Next.js), Worker (exécute les jobs de sync), Scheduler (planifie), Temporal (orchestrateur de workflows distribués), et une base PostgreSQL interne pour l’état d’Airbyte. L’ensemble consomme environ 4 Go de RAM au repos et peut grimper à 6-7 Go pendant les synchronisations actives.

Pour une PME ouest-africaine typique, le pattern de déploiement recommandé est : Airbyte sur un CX32 dédié, sources externes (Stripe, Google Sheets) accédées via internet, sources internes (PostgreSQL ERP) accédées via réseau privé Hetzner ou tunnel SSH, destination dans un PostgreSQL séparé ou un bucket Hetzner Object Storage. Cette séparation isole les pannes et facilite la sauvegarde indépendante de chaque composant.

Installation pas-à-pas

Étape 1 — Préparer le VPS

# Connecte-toi au CX32
ssh ubuntu@ton-vps-airbyte

# Mise à jour et outils de base
sudo apt update && sudo apt upgrade -y
sudo apt install -y curl wget git ufw fail2ban

# Firewall
sudo ufw allow OpenSSH
sudo ufw allow 8000/tcp comment 'Airbyte UI - via reverse proxy plus tard'
sudo ufw enable

# Docker (si pas déjà installé)
curl -fsSL https://get.docker.com | sh
sudo usermod -aG docker $USER
newgrp docker

Étape 2 — Installation Airbyte via abctl

Depuis 2024, Airbyte recommande son outil officiel abctl qui simplifie radicalement le déploiement par rapport à Docker Compose manuel. Il gère Kubernetes en local via kind et déploie tous les composants automatiquement :

curl -LsfS https://get.airbyte.com | bash -

# Lance l'installation
abctl local install

# Récupère le mot de passe admin généré
abctl local credentials

L’installation prend 8 à 15 minutes selon la connexion. Sur fibre Hetzner Falkenstein, c’est rapide. À la fin, tu obtiens un mot de passe admin et l’UI est accessible sur http://ton-vps:8000.

Étape 3 — Mettre Airbyte derrière un reverse proxy HTTPS

Ne laisse jamais l’UI Airbyte exposée en HTTP brut sur internet. Utilise Caddy pour terminer TLS automatiquement avec Let’s Encrypt :

sudo apt install -y caddy

sudo tee /etc/caddy/Caddyfile <<EOF
airbyte.tondomaine.com {
    reverse_proxy localhost:8000
    basicauth * {
        admin $(caddy hash-password)
    }
}
EOF

sudo systemctl reload caddy

Avec ça, l’UI est accessible en HTTPS uniquement, derrière une auth basique en complément de l’auth Airbyte native.

Configurer ses premiers connecteurs

Source PostgreSQL (ton ERP interne)

Dans l’UI Airbyte, va sur « Sources → New Source → PostgreSQL ». Renseigne :

  • Host : adresse IP privée de ton serveur PostgreSQL (via réseau privé Hetzner) ou IP publique avec restriction firewall.
  • Port : 5432.
  • Database : nom de ta base ERP.
  • Username/Password : crée un utilisateur PostgreSQL en lecture seule dédié à Airbyte (CREATE USER airbyte_reader ...).
  • SSL Mode : require en production.
  • Replication Method : CDC (Change Data Capture) si ta version PostgreSQL le permet (10+), sinon Standard.

Le mode CDC est la meilleure option : il utilise la réplication logique PostgreSQL pour capturer uniquement les changements (inserts, updates, deletes) au lieu de re-scanner la table à chaque sync. C’est radicalement plus performant et économe en bande passante.

Source Stripe (paiements internationaux)

Stripe est l’un des connecteurs les mieux maintenus. Tu n’as besoin que d’un Stripe Restricted API Key en lecture seule. Dans l’UI Airbyte « Sources → New Source → Stripe ». Indique ta clé, ta date de début (ex: 2024-01-01), et Airbyte récupère 30+ types d’objets : Charges, Customers, Invoices, Subscriptions, Refunds, Disputes…

Source Google Sheets (données commerciales)

Beaucoup de PME africaines utilisent Google Sheets comme système de saisie pour les commerciaux. Le connecteur Airbyte Google Sheets permet de les ingérer comme une vraie source de données :

  • Crée un Service Account sur Google Cloud Console.
  • Donne-lui accès en lecture aux Sheets concernées.
  • Renseigne le JSON du Service Account dans Airbyte.
  • Sélectionne les onglets à synchroniser.

Configurer la destination

La destination la plus pragmatique pour une PME francophone est PostgreSQL dédié à l’entrepôt de données. Sur le même CX32, crée une seconde base warehouse isolée :

sudo -u postgres psql -c "CREATE DATABASE warehouse;"
sudo -u postgres psql -c "CREATE USER airbyte_writer WITH PASSWORD 'mot-de-passe';"
sudo -u postgres psql -c "GRANT ALL ON DATABASE warehouse TO airbyte_writer;"

Dans Airbyte, configure la destination PostgreSQL avec ces credentials. Tu peux aussi pointer vers un PostgreSQL externe (autre VPS) ou vers Hetzner Object Storage si tu préfères un data lake en CSV/Parquet.

Créer ta première Connection

Une « Connection » dans Airbyte associe une source, une destination, des streams (tables) à synchroniser, et un planning. Va sur « Connections → New connection », sélectionne ta source PostgreSQL et ta destination warehouse, choisis les tables (clients, factures, paiements), définis le mode de réplication par stream :

  • Full Refresh / Overwrite : remplace toute la table à chaque sync. Pour des tables de référence stables.
  • Incremental / Append : ajoute uniquement les nouvelles lignes basées sur un curseur (timestamp, ID auto-increment).
  • Incremental / Deduped + History : équivalent SCD Type 2, garde l’historique des modifications.

Pour des tables de transactions (commandes, paiements), Incremental / Deduped + History est l’option recommandée : elle te permet de reconstruire l’état historique de n’importe quelle entité à n’importe quel moment.

Définis le planning : toutes les heures pour des données opérationnelles, une fois par jour pour des dashboards, en temps réel via webhook pour des cas critiques.

Adaptation au contexte ouest-africain

Airbyte self-hosted répond particulièrement bien aux contraintes des PME francophones d’Afrique de l’Ouest. Premièrement, le coût d’infrastructure dérisoire : 5 200 F CFA par mois pour un CX32 qui orchestre des dizaines de syncs quotidiennes, contre 1 500 USD/mois minimum pour Fivetran soit 900 000 F CFA. L’économie annuelle dépasse 10 millions F CFA pour des fonctionnalités équivalentes.

Deuxièmement, la souveraineté des données financières : tes données Wave Money, Orange Money, MTN Mobile Money, Stripe, Paystack ne transitent jamais par les serveurs d’un fournisseur tiers. Elles partent de la source vers ton VPS Hetzner directement. Pour des entreprises soumises au secret des affaires ou à des obligations réglementaires sectorielles (microfinance régulée par la BCEAO, fintech sous PSP licence), c’est un atout majeur.

Troisièmement, la résilience face aux coupures. Airbyte gère élégamment les déconnexions réseau intermittentes typiques de Bamako ou Conakry : si une sync échoue, elle reprend là où elle s’était arrêtée à la prochaine tentative, sans dupliquer ni perdre de données. Le mode CDC PostgreSQL garantit l’exactitude même sur des liaisons instables.

Erreurs fréquentes à éviter

  • Lancer Airbyte sur un CX22 — la RAM est insuffisante. Tu vas vivre des OOM à chaque sync moyenne. CX32 minimum.
  • Utiliser le compte PostgreSQL admin pour Airbyte — crée toujours un utilisateur dédié read-only sur les sources et write-only sur la destination.
  • Synchroniser toutes les tables sans réfléchir — beaucoup de tables système n’ont aucune valeur analytique et alourdissent inutilement les syncs. Sélectionne précisément ce qui sera utilisé.
  • Ne pas monitorer Airbyte — configure les notifications Slack/Mattermost pour les sync échouées. Les pannes silencieuses créent des dashboards faux qui passent inaperçus.
  • Backup oublié — la base PostgreSQL d’Airbyte contient toute la config. Backup quotidien obligatoire.
  • Mettre à jour aveuglément — Airbyte évolue vite (release toutes les 2 semaines). Teste les upgrades majeurs sur un environnement de staging avant production.

Trois cas d’usage concrets

  1. E-commerce de mode à Dakar — synchronise WooCommerce (commandes), Stripe (paiements internationaux), Wave Money (paiements locaux), Google Sheets (stocks magasin physique) vers un PostgreSQL warehouse. Dashboard Metabase consolidé. ROI : visibilité unifiée du CA réelle pour la première fois.
  2. Microfinance à Abidjan — synchronise core banking T24 (Oracle), portefeuille mobile money (PostgreSQL), CRM HubSpot vers Snowflake. 3 millions de lignes synchronisées chaque nuit. Investissement : 2 semaines de mise en place + 5 200 F CFA/mois.
  3. SaaS B2B à Ouagadougou — synchronise Postgres applicatif, Mixpanel (analytics produit), Stripe vers BigQuery. Pipeline ELT puis dbt-core pour modélisation. Budget data : 8 000 F CFA/mois total.

Checklist post-déploiement

  • ✅ Airbyte installé via abctl, UI accessible en HTTPS
  • ✅ Au moins 1 source et 1 destination configurées
  • ✅ Au moins 1 connection active avec sync réussie
  • ✅ Notifications Slack/Mattermost configurées sur échec
  • ✅ Backup quotidien de la base PostgreSQL Airbyte
  • ✅ Auth basique Caddy en complément de l’auth Airbyte
  • ✅ Utilisateurs PostgreSQL dédiés (read-only sources, write-only destination)
  • ✅ Documentation interne : qui peut créer/modifier les connections
  • ✅ Plan de mise à jour mensuel d’Airbyte

FAQ

Airbyte vs Fivetran : que choisir en 2026 ?

Pour une PME africaine, Airbyte OSS est imbattable sur le coût. Fivetran reste pertinent uniquement si tu as zéro équipe ops et un budget > 1 500 USD/mois.

Combien de connecteurs sont disponibles ?

300+ connecteurs officiels au catalogue. Tu peux aussi écrire les tiens en Python via le Connector Builder.

Airbyte OSS et Airbyte Cloud : quelle différence ?

OSS est le moteur open-source que tu héberges. Cloud est l’offre managée d’Airbyte (USA). Pour la souveraineté, OSS uniquement.

Combien de syncs en parallèle un CX32 peut-il gérer ?

Réalistement, 3 à 5 syncs en simultané. Pour plus, passe sur CX42 (16 Go RAM) ou répartis sur plusieurs nœuds Airbyte.

Pour aller plus loin

Besoin d’aide pour structurer ton ELT ?

Tu accumules les sources de données et tu veux enfin un entrepôt unifié sans passer par Fivetran ? ITSkillsCenter propose un audit gratuit de 30 minutes pour cartographier tes flux et estimer la mise en place. Contacte-nous via WhatsApp +221 78 226 83 77 ou demande directement ton audit gratuit en ligne.


[ITS] ITSkillsCenter — formations IT et conseil pour PME d’Afrique de l’Ouest. Dakar · Abidjan · Ouagadougou · Bamako · Conakry. Tous nos contenus sont audités selon notre charte éditoriale Ahl-Sunna.

Besoin d'un site web ?

Confiez-nous la Création de Votre Site Web

Site vitrine, e-commerce ou application web — nous transformons votre vision en réalité digitale. Accompagnement personnalisé de A à Z.

À partir de 250.000 FCFA
Parlons de Votre Projet
Publicité