_antoniobernardo
(90 punti)
5' di lettura

La legge di Benford non pu essere considerata propriamente matematica, visto che ha la sua origine in una indagine statistica e quindi non si tratta di una logica deduzione a partire dagli assiomi attraverso una dimostrazione. Per questo parliamo di legge e non di teorema. Ma racchiude in s alcune caratteristiche particolarmente interessanti.

La legge di Benford riguarda la probabilit della prima cifra di un valore numerico scelto "a caso in un contesto reale" e tale probabilit data dalla formula:

[math]\\Log (1+1/c )[/math]
, dove c la cifra considerata, che ci porta al fatto che 1 ha maggiori probabilit rispetto agli altri numeri.

Ma come sono questi valori numerici scelti a caso in un contesto reale? Possiamo avere delle statistiche, ma non delle distribuzioni gaussiane, visto che in questo caso la legge non vale.

Possiamo partire, ad esempio, dal numero di abitanti dei comuni del Nord Italia, oppure dalla lunghezza dei fiumi italiani: riordinando questi valori, possiamo accorgerci che le probabilit saranno cos distribuite:

n 1 2 3 4 5 6 7 8 9
P(n) 30,10 % 17,61 % 12,49 % 9,69 % 7,92 % 6,69 % 5,80 % 5,12 % 4,58 %

In altre parole, la cifra 1 ha una probabilit del 30%, ovvero quasi doppia rispetto a quella della cifra 2 e tale da superare la probabilit di trovare 5, 6, 7, 8 e 9, messe insieme.

La legge attribuita a Benford, ma il suo non lunico nome che possiamo associare alla storia che ha portato alla formula, anche perch non fu lui il vero autore.

Tre sono le persone che hanno avuto lonore di realizzare questa legge:

il primo fu Simon Newcomb (1835-1909), astronomo e professore di matematica a Washington. Nel suo lavoro, doveva usare spesso le tavole dei logaritmi non dimentichiamo che, in unepoca senza calcolatori elettronici, le tavole dei logaritmi portavano ad una grande semplificazione dei calcoli e osservando le proprie tavole, si rese conto un giorno che le prime pagine erano pi sporche, proprio perch pi consultate, rispetto alle ultime, a dimostrazione del fatto che i numeri di cui calcolava i logaritmi cominciavano pi facilmente con le cifre pi basse, 1 e 2, rispetto alle cifre pi alte. Pare abbia scritto un articolo al riguardo, nel 1881, ma venne presto dimenticato.

Dopo di lui, Frank Benford (1887-1948) che lavor come fisico, presso i laboratori della General Electric condusse uno studio pi scientifico. Nel 1938 pubblic il lavoro che diede poi il nome alla legge: recuper i numeri dalle statistiche del baseball, dalla geografia e da altre fonti e, dopo aver raccolto pi di 20 000 dati, fu pronto per la pubblicazione. La base 10 del logaritmo legata al fatto che scriviamo i numeri in base decimale: se cambiamo la base della nostra numerazione, cambiamo anche la base del logaritmo.

Nel 1961 Roger Pinkham, matematico e statistico statunitense, professore presso la Rutgers University di New Brunswick, con larticolo On the distribution of first significant digits, pubblicato sugli Annals of Mathematical Statistics, dimostr linvarianza di scala della legge di Benford, ovvero: quando usiamo come dati la misura dei fiumi, ad esempio, possiamo misurarne la lunghezza in chilometri o in miglia e questo potrebbe spingerci a pensare che, cambiando unit di misura, cambierebbe anche la legge di distribuzione. Non si tratta certamente di una dimostrazione, ma laspetto pi matematico del problema.

Alla legge di Benford ha legato il proprio nome anche Mark Nigrini, matematico statunitense che, dopo aver letto il testo di Benford nel 1989, nel 1992 ne ha proposto lutilizzo per testare la credibilit delle dichiarazioni dei redditi, dopo averla verificata con successo su casi reali e con frode accertata, come mostrato dalla sua tesi di dottorato presso luniversit di Cincinnati The detection of income evasion through an analysis of digital distributions.

In altre parole, se il vostro intento quello di generare un migliaio di fatture fittizie con cifre casuali tra i 100 e i 100 000 euro, meglio che prestiate attenzione alla legge di Benford, prima che Mark Nigrini sia in agguato. In ogni caso, evitate di usare i generatori di numeri casuali, perch la distribuzione delle prime cifre sarebbe troppo regolare

Daniela Molinari


http://www.statistica.unimib.it/utenti/matematica/AM2/appunti/benf.pdf