Piccoli numeri, grandi frodi (forse)

La legge di Benford non può essere considerata propriamente matematica, visto che ha la sua origine in una indagine statistica e quindi non si tratta di una logica deduzione a partire dagli assiomi attraverso una dimostrazione. Per questo parliamo di legge e non di teorema. Ma racchiude in sé alcune caratteristiche particolarmente interessanti.

La legge di Benford riguarda la probabilità della prima cifra di un valore numerico scelto “a caso in un contesto reale” e tale probabilità è data dalla formula: $Log (1+1/c )$, dove c è la cifra considerata, che ci porta al fatto che 1 ha maggiori probabilità rispetto agli altri numeri.

Ma come sono questi valori numerici scelti “a caso in un contesto reale”? Possiamo avere delle statistiche, ma non delle distribuzioni gaussiane, visto che in questo caso la legge non vale.

Possiamo partire, ad esempio, dal numero di abitanti dei comuni del Nord Italia, oppure dalla lunghezza dei fiumi italiani: riordinando questi valori, possiamo accorgerci che le probabilità saranno così distribuite:

n 1 2
 P(n)  30,10 %  17,61 %  12,49 %  9,69 %   7,92 %   6,69 %  5,80 %  5,12 % 4,58 % 

In altre parole, la cifra 1 ha una probabilità del 30%, ovvero quasi doppia rispetto a quella della cifra 2 e tale da superare la probabilità di trovare 5, 6, 7, 8 e 9, messe insieme.

La legge è attribuita a Benford, ma il suo non è l’unico nome che possiamo associare alla storia che ha portato alla formula, anche perché non fu lui il vero autore.

Tre sono le persone che hanno avuto l’onore di realizzare questa legge:

il primo fu Simon Newcomb (1835-1909), astronomo e professore di matematica a Washington. Nel suo lavoro, doveva usare spesso le tavole dei logaritmi – non dimentichiamo che, in un’epoca senza calcolatori elettronici, le tavole dei logaritmi portavano ad una grande semplificazione dei calcoli – e osservando le proprie tavole, si rese conto un giorno che le prime pagine erano più sporche, proprio perché più consultate, rispetto alle ultime, a dimostrazione del fatto che i numeri di cui calcolava i logaritmi cominciavano più facilmente con le cifre più basse, 1 e 2, rispetto alle cifre più alte. Pare abbia scritto un articolo al riguardo, nel 1881, ma venne presto dimenticato.

Dopo di lui, Frank Benford (1887-1948) – che lavorò come fisico, presso i laboratori della General Electric – condusse uno studio più scientifico. Nel 1938 pubblicò il lavoro che diede poi il nome alla legge: recuperò i numeri dalle statistiche del baseball, dalla geografia e da altre fonti e, dopo aver raccolto più di 20 000 dati, fu pronto per la pubblicazione. La base 10 del logaritmo è legata al fatto che scriviamo i numeri in base decimale: se cambiamo la base della nostra numerazione, cambiamo anche la base del logaritmo.

Nel 1961 Roger Pinkham, matematico e statistico statunitense, professore presso la Rutgers University di New Brunswick, con l’articolo On the distribution of first significant digits, pubblicato sugli Annals of Mathematical Statistics, dimostrò l’invarianza di scala della legge di Benford, ovvero: quando usiamo come dati la misura dei fiumi, ad esempio, possiamo misurarne la lunghezza in chilometri o in miglia e questo potrebbe spingerci a pensare che, cambiando unità di misura, cambierebbe anche la legge di distribuzione. Non si tratta certamente di una dimostrazione, ma è l’aspetto più matematico del problema.

Alla legge di Benford ha legato il proprio nome anche Mark Nigrini, matematico statunitense che, dopo aver letto il testo di Benford nel 1989, nel 1992 ne ha proposto l’utilizzo per testare la credibilità delle dichiarazioni dei redditi, dopo averla verificata con successo su casi reali e con frode accertata, come mostrato dalla sua tesi di dottorato presso l’università di Cincinnati The detection of income evasion through an analysis of digital distributions.

In altre parole, se il vostro intento è quello di generare un migliaio di fatture fittizie con cifre casuali tra i 100 e i 100 000 euro, è meglio che prestiate attenzione alla legge di Benford, prima che Mark Nigrini sia in agguato. In ogni caso, evitate di usare i generatori di numeri casuali, perché la distribuzione delle prime cifre sarebbe troppo regolare…

Daniela Molinari


http://www.statistica.unimib.it/utenti/matematica/AM2/appunti/benf.pdf

http://umi.dm.unibo.it/wp-content/uploads/2013/10/benford.pdf

http://pmf.cilea.it/file.php/1/articoli/PMF2012_Benford.pdf

Commenti

commenti