Digitis
Digitis ·

Uptime 99,9% : pourquoi ce chiffré ne protégé pas votre entreprise

Un uptime de 99,9% represente 8h45 de panne par an. Monitoring actif, dashboard public, SmartInfra : ce que signifie vraiment la disponibilité pour une PME.

Infrastructure 10 min de lecture
Dashboard de monitoring affichant la disponibilité des services en temps reel

Votre hébergeur affiche 99,9% de disponibilité. Vous avez signé le contrat en vous disant que c’etait plutôt bien. Et puis un mercredi matin, votre site web ne repond plus. Le central téléphonique est muet. Les emails ne partent pas. Vous appelez le support. File d’attente. Rappel dans 24 a 48 heures.

Le problème n’est pas que votre hébergeur ment. 99,9%, c’est probablement vrai. Le problème, c’est que 99,9% represente 8 heures et 45 minutes de panne par an. Presque une journee de travail complète. Et ces 8 heures tombent rarement un dimanche a 4h du matin.

Cet article explique ce que signifient reellement les pourcentages de disponibilité, pourquoi le monitoring passif ne vous protégé pas, et comment une surveillance active change la donne pour une PME.

TL;DR : Un uptime de 99,9% autorise pres de 9 heures de panne par an. Le monitoring passif détecté les pannes apres coup sans y remedier. Le monitoring actif anticipe, alerte et corrige. Digitis publie un dashboard de status public et surveille ses 7 serveurs en continu avec SmartInfra, un agent IA autonome.

Que signifient reellement les pourcentages de disponibilité ?

Les hébergeurs et opérateurs telecom adorent les pourcentages. Ils sont rassurants. Mais derrière le chiffré, il y à un calcul que personne ne fait.

Voici ce que chaque niveau de disponibilité represente en temps de panne annuel :

DisponibilitéPanne autorisee par anPanne autorisee par mois
99%3 jours et 15 heures7 heures 18 minutes
99,5%1 jour et 19 heures3 heures 39 minutes
99,9%8 heures 45 minutes43 minutes
99,95%4 heures 22 minutes21 minutes
99,99%52 minutes4 minutes

Un contrat a 99,9%, c’est donc un hébergeur qui peut être indisponible pendant 43 minutes chaque mois sans violer ses engagements. Pour un cabinet médical qui recoit ses rendez-vous par téléphone, 43 minutes d’indisponibilite un lundi matin, c’est une journee de planning sabotee.

Et le chiffré ne dit rien sur la manière dont la panne est gérée. Ni sur le délai avant que quelqu’un s’en apercoive.

Le SLA ne couvre pas ce que vous croyez

La plupart des SLA (Service Level Agreements) definissent la disponibilité comme le temps ou le serveur physique est accessible. Pas le temps ou votre application fonctionne. Votre machine virtuelle peut tourner pendant que votre basé de données est plantee, que votre certificat SSL a expire, ou que votre disque est plein a 100%.

Le serveur est “up”. Votre service est down. Le SLA est respecte. Vous perdez des clients.

Monitoring passif contre monitoring actif : deux philosophies

Il existe deux approches fondamentalement differentes pour surveiller une infrastructure. Les confondre est une erreur courante.

Le monitoring passif : savoir apres coup

Le monitoring passif enregistre des métriques et envoie des alertes quand un seuil est dépassé. CPU au-dessus de 90% ? Email. Disque plein a 85% ? Email. Service qui ne repond plus ? Email.

Les outils ne manquent pas : UptimeRobot, Datadog, Zabbix, Netdata. Ils font bien leur travail. Ils detectent. Et c’est tout.

Le problème se situe dans ce qui se passe apres la notification. L’alerte arrive dans une boite mail déjà saturee. Le responsable technique la voit trois heures plus tard. Il se connecté, cherche la cause, applique un correctif. Si c’est un prestataire externe, ajoutez le temps de réponse contractuel.

Résultat : la panne dure aussi longtemps qu’il faut pour qu’un humain reagisse. La nuit, le week-end, pendant les vacances, personne ne reagit.

Le monitoring actif : détecter, comprendre et agir

Le monitoring actif ne s’arrete pas à l’alerte. Il analyse la situation, identifié la cause probable, et applique un correctif quand c’est dans son perimetre.

Concretement, la différence ressemble a ceci :

Scénario monitoring passif : le disque du serveur atteint 90% a 2h du matin. L’outil envoie un email. A 8h, le responsable le voit. A 9h30, apres diagnostic, il lance un nettoyage. Le service a ete degrade pendant 7 heures.

Scénario monitoring actif : le disque atteint 82%. L’agent détecté la tendance, identifié la cause (logs surdimensionnes, images Docker orphelines), lance un nettoyage automatique, et libéré l’espace nécessaire. Le disque redescend a 64%. Le matin, l’équipe trouve l’événement dans le journal, déjà résolu.

Personne ne s’est reveille. Aucun client n’a ete impacte.

Pourquoi un dashboard public de status est un signé de maturite

Beaucoup d’opérateurs et d’hébergeurs parlent de fiabilité dans leurs pages commerciales. Peu publient leurs vrais chiffres de disponibilité en temps reel.

Un dashboard de status public, c’est un engagement. Ça dit : “Voici l’état reel de nos services, minute par minute, accessible a tout le monde sans mot de passe.”

Ce qu’un bon status page doit montrer

  • L’état actuel de chaque service (opérationnel, degrade, hors ligne)
  • L’historique de disponibilité sur les 30, 60 ou 90 derniers jours
  • Les incidents passes avec leur durée et leur resolution
  • Les maintenances planifiees a venir

Quand un prestataire refuse de publier ces données, posez-vous la question : pourquoi ?

Chez Digitis, notre page de status est publique depuis le premier jour. Elle tourne sur Uptime Kuma, un outil open-source. Ce ne sont pas des chiffres marketing retouches. Ce sont les données brutes de notre infrastructure, mises à jour en temps reel.

Vous pouvez aussi y accéder directement depuis notre site vià la page Status des services.

Uptime Kuma : simple, fiable, transparent

Nous avons choisi Uptime Kuma pour plusieurs raisons. C’est un projet open-source, auto-hébergé, sans dépendance à un service tiers. Pas d’abonnement SaaS. Pas de données qui transitent chez un intermédiaire américain.

L’outil surveille chaque service par des pings reguliers (HTTP, TCP, DNS, ou ping ICMP selon le cas). Si un service ne repond pas, l’incident est enregistre et visible immédiatement sur le dashboard public.

Pour une PME qui veut prouver sa fiabilité à ses clients, c’est un outil que nous recommandons. Pour celles qui preferent ne pas le gérer elles-mêmes, c’est inclus dans notre offre d’infrastructure.

Comment Digitis garantit la disponibilité en pratique

La disponibilité ne se garantit pas avec un pourcentage dans un contrat. Elle se construit avec trois piliers : une infrastructure solide, une surveillance continue, et une capacité de reaction rapide.

Pilier 1 : infrastructure européenne chez Hetzner

Nos 7 serveurs tournent chez Hetzner Cloud, en datacenters certifies ISO 27001 en Allemagne et en Finlande. Réseau prive isole entre les machines. Connexion SSH uniquement, sur port non-standard, avec clés de chiffrement asymetriques.

Triple couche de protection : firewall cloud Hetzner, UFW système, et CrowdSec pour la détection d’intrusion automatique.

Pilier 2 : SmartInfra, agent IA de surveillance

SmartInfra est notre agent de monitoring actif. Il tourne 24 heures sur 24 sur un serveur dédié et surveille l’ensemble de notre parc.

Ce qu’il fait en continu :

  • Vérification de l’espace disque, de la mémoire, du CPU et du swap
  • Contrôle de l’état des conteneurs Docker et des services systemd
  • Analyse des logs par intelligence artificielle (pas juste des seuils numeriques)
  • Vérification quotidienne des sauvegardes : existence, taille, fraicheur

Ce qu’il fait chaque semaine :

  • Mises à jour de sécurité en dehors des heures de bureau
  • Nettoyage des images Docker orphelines et des fichiers temporaires
  • Creation de snapshots avant chaque intervention (retour en arriere possible)
  • Redemarrage propre avec vérification post-reboot

Ce qu’il fait quand un problème survient :

  • Alerte instantanee (Discord, Telegram ou SMS selon la criticite)
  • Diagnostic automatique par analyse IA des logs
  • Correctif autonome si l’action est sans risque
  • Demande d’approbation humaine pour toute action a impact (reboot, suppression, mise à jour majeure)

Pilier 3 : transparence totale

Le dashboard Uptime Kuma, la page de status publique, les rapports d’incidents documentes automatiquement par l’agent. Pas de zone d’ombre. Si quelque chose tombe, vous le voyez en même temps que nous.

Ce que vous devriez exiger de votre prestataire

Que vous travailliez avec Digitis ou un autre opérateur, voici les questions a poser avant de signer :

Quel est votre uptime reel mesure, pas contractuel ? Un SLA de 99,9% ne veut rien dire si personne ne le mesure. Demandez les chiffres des 12 derniers mois.

Avez-vous un status page public ? Si la réponse est non, demandez pourquoi. Un prestataire qui n’ose pas montrer ses chiffres a probablement une raison.

Quel est votre temps moyen de détection d’une panne ? La détection, pas la resolution. Si la détection prend 30 minutes, la resolution prendra forcement plus longtemps.

Que se passe-t-il la nuit et le week-end ? La majorité des pannes critiques surviennent en dehors des heures de bureau. Si personne ne surveille à ce moment-la, votre disponibilité reelle est bien inferieure à ce que le contrat annonce.

Ou sont hébergées mes données ? En Europe, aux États-Unis, dans un cloud qui peut changer de juridiction sans prévenir ? Pour une PME belge soumise au RGPD, c’est un critère non negociable.

Questions frequentes

99,9% de disponibilité, c’est suffisant pour une PME ?

Ça dépend de votre activité. Pour un site vitrine consulte quelques fois par jour, probablement. Pour un central téléphonique qui recoit des appels en continu, ou une application métier utilisée par vos employes, 8h45 de panne par an peuvent couter bien plus que le prix d’une meilleure infrastructure.

Quelle est la différence entre haute disponibilité et monitoring ?

La haute disponibilité (HA) est une architecture : serveurs redondants, basculement automatique, pas de point de defaillance unique. Le monitoring est la surveillance de cette architecture. L’un sans l’autre ne sert a rien. Des serveurs redondants sans monitoring, c’est une sécurité qui ne se déclenché pas quand il faut.

Uptime Kuma est-il fiable pour un usage professionnel ?

Uptime Kuma est utilisé par des milliers d’entreprises et de projets open-source. Il est simple, leger, et fait exactement ce qu’on lui demande. Nous l’utilisons en production depuis le lancement de notre infrastructure, sans problème de fiabilité. L’avantage : il est auto-hébergé, donc aucune dépendance à un service tiers.

Combien coute une surveillance active avec SmartInfra ?

Les tarifs dependent du nombre de serveurs et du niveau d’intervention souhaite (surveillance seule, maintenance automatique, ou pilotage complet). Pas de frais caches, sans engagement. Contactez-nous pour un devis adapté à votre infrastructure.

Conclusion

Les pourcentages de disponibilité sont trompeurs. Ils donnent une illusion de fiabilité sans rien dire sur la réalité opérationnelle : qui surveille, qui détecté, qui corrige, et en combien de temps.

Le monitoring passif est mieux que rien. Mais il repose sur l’hypothese qu’un humain va reagir vite, à chaque fois, y compris a 3h du matin un dimanche. Cette hypothese ne tient pas.

Le monitoring actif, un dashboard de status public, et une infrastructure bien architecturee : c’est la combinaison qui transforme un chiffré contractuel en disponibilité reelle.

Chez Digitis, on ne se contente pas d’afficher 99,9% dans un PDF. On publie nos chiffres en temps reel, on surveille nos serveurs avec un agent IA autonome, et on vous donne accès aux mêmes outils.

Consultez notre status en direct ou decouvrez SmartInfra pour votre propre infrastructure.