Le Secret Caché dans les Premiers Chiffres
Si vous prenez au hasard les populations de toutes les villes de France, les montants de toutes les factures d’électricité d’un mois, ou les distances de toutes les étoiles cataloguées, vous attendez que le premier chiffre de chaque nombre soit uniformément distribué : 1, 2, 3… 9, chacun avec une probabilité de 1/9 (environ 11%).
Vous auriez tort. Dans la nature, le chiffre 1 apparaît comme premier chiffre environ 30% du temps, tandis que le 9 n’apparaît que 5% du temps. Ce phénomène contre-intuitif est la loi de Benford, et il est si fiable qu’il est utilisé pour détecter les fraudes.
Simon Newcomb, l’Homme qui a Remarqué les Tables de Logarithmes
L’histoire commence en 1881, lorsque l’astronome américain Simon Newcomb remarqua un décurieux dans les tables de logarithmes de la bibliothèque du Naval Observatory : les premières pages — celles couvrant les nombres commençant par 1 — étaient beaucoup plus usées que les dernières. Au lieu de l’ignorer, Newcomb publia un article noting que les premiers chiffres des nombres naturels suivent une distribution logarithmique.
L’observation resta dans l’oubli pendant 57 ans, jusqu’à ce que le physicien Frank Benford redécouvre indépendamment le phénomène en 1938, en collectant plus de 20 000 données de sources aussi diverses que les surfaces des rivières, les populations urbaines, les constantes physiques et les numéros apparaissant dans les journaux. Il confirma la loi empirique et lui donna son nom.
La Loi Mathématique
La loi de Benford stipule que la probabilité que le premier chiffre soit d est :
P(d) = log₁₀(1 + 1/d)
Ce qui donne :
- 1 : 30,1%
- 2 : 17,6%
- 3 : 12,5%
- 4 : 9,7%
- 5 : 7,9%
- 6 : 6,7%
- 7 : 5,8%
- 8 : 5,1%
- 9 : 4,6%
La distribution est remarquablement élégante : chaque chiffre successif est moins probable que le précédent, et l’écart entre le 1 et le 9 est de plus de 6 à 1.
Détection de Fraude : L’Arme Secrète des Auditeurs
La loi de Benford est devenue un outil puissant de détection de fraude financière. Le raisonnement est simple : si quelqu’un invente des chiffres, il tend à les distribuer uniformément — ce qui viole la loi de Benford. Les auditeurs forensiques utilisent cette propriété depuis les années 1990.
Cas célèbre : En 2009, les frères Madoff ont été exposés en partie grâce à l’analyse de Benford — les rendements déclarés de leurs fonds suivaient une distribution trop uniforme pour être naturelle. Le trader Enron a aussi été démasqué post-mortem par cette méthode.
Loterie et Benford
Les numéros tirés à la loterie eux-mêmes ne suivent pas la loi de Benford (puisque les boules sont numérotées de 1 à 50), mais les jackpots cumulés, les montants des gains et les fréquences cumulées de numéros sur de longues périodes peuvent s’y conformer. Les plateformes d’analyse prédictive utilisent la loi de Benford comme l’un des tests de validité de leurs modèles.
Pourquoi la Loi de Benford Fonctionne-T-elle ?
L’explication profonde réside dans l’invariance d’échelle. Si une distribution de nombres est valable quelle que soit l’unité de mesure — dollars, euros, mètres, pieds — alors elle doit suivre la loi de Benford. C’est un résultat mathématique rigoureux, pas une simple observation empirique.
Pensez-y ainsi : si vous prenez tous les nombres d’un ensemble naturel et les multipliez par 2, la distribution des premiers chiffres ne change pas. Seule la loi logarithmique de Benford possède cette propriété d’invariance.
Là où Benford Ne S’applique Pas
La loi de Benford ne fonctionne pas pour :
- Les nombres assignés arbitrairement (numéros de téléphone, codes postaux)
- Les données avec des minimums ou maximums artificiels (tailles humaines)
- Les distributions uniformes ou fortement contraintes
Comprendre quand appliquer la loi est aussi important que la loi elle-même. C’est cette rigueur dans l’application des méthodes statistiques avancées qui distingue l’analyse sérieuse de la pseudoscience.