Intendo dimostrare che il numero di Nepero $e$ è trascendente. In verità, vorrei mostrare che il problema della trascendenza di $e$ non è così difficile da risolvere come può sembrare ad una prima occhiata. Al contrario, bastano pochi strumenti di Analisi I (sostanzialmente: limiti di successioni e il teorema del valor medio) per dimostrare questo fatto profondo.
Consiglio, inoltre, a chiunque sia interessato alla questione, le ottime pagine dal caro prof. Tilli che riportano, tra il resto, una dimostrazione dell'irrazionalità di $e$. Il materiale che segue è una mia libera rielaborazione di alcune pagine del "mitico" Herstein, Algebra (Editori Riuniti).
Articolerò la dimostrazione in alcuni lemmi. Lo strumento più profondo è, come già detto, il teorema del valor medio, che richiamiamo brevemente. Qui e nel seguito indicherò con \( \displaystyle f^{(i)}(x) \) la derivata $i$-esima della funzione $f: RR to RR$.
Teorema (di Lagrange o del valor medio). Sia $f: (a,b) \to RR$ una funzione continua e derivabile su tutto $(a,b)$. Allora esiste un $c \in (a,b)$ tale che
\[\begin{split} \frac{f(b)-f(a)}{b-a} = f'(c) \end{split} \]
o, equivalentemente, si ha
\[\begin{split} \frac{f(b)-f(a)}{b-a} = f'(a+\theta(b-a)) \end{split} \]
per un opportuno $\theta \in (0,1)$.
Dopo questo richiamo che dovrebbe essere comunque noto, procediamo con alcuni lemmi.
Lemma 1. Sia $f(x) \in \RR[x]$ di grado $r$. Detta \( \displaystyle F(x)=f(x)+f^{(1)}(x)+f^{(2)}(x) + \ldots + f^{(r)}(x) \) , allora vale
\[\begin{split} \frac{d}{dx} e^{-x}F(x) = -e^{-x}f(x) \end{split} \]
Testo nascosto, fai click qui per vederlo
Dimostrazione. Si tratta di fare i conti; si applichi la nota regola di Leibniz, tenendo presente che $f(x)$ ha grado $r$, dunque \( \displaystyle f^{(i)}(x) \equiv 0 \) , per ogni $i > r$. \( \displaystyle \square \)
Lemma 2 (Hermite). Sia $n \in NN$ e $p$ un primo, con $p>n$ e si consideri il seguente polinomio (detto anche di Hermite)
\[\begin{split} f_{n,p}(x) = f(x) = \frac{1}{(p-1)!} x^{p-1} (1-x)^p(2-x)^p \cdots (n-x)^p \end{split} \]
Allora, se $i \ge p$ il polinomio \( \displaystyle f^{(i)}(x) \) è a coefficienti interi e, in particolare, per ogni $j \in ZZ$ risulta \( \displaystyle p \vert f^{(i)}(j) \) .
Testo nascosto, fai click qui per vederlo
Dimostrazione.
Se sviluppiamo le potenze, otteniamo
\( \displaystyle f(x) = \frac{(n!)^{p}}{(p-1)!} x^{p-1} + \frac{a_{0}}{(p-1)!}x^{p} + \frac{a_{1}}{(p-1)!}x^{p+1} + \ldots + \frac{a_{s}}{(p-1)!}x^{p+s} \)
E' ora evidente che, se $i \ge p$, il polinomio \( \displaystyle f^{(i)}(x) \) è a coefficienti interi: tutti i denominatori vengono "neutralizzati", giacché il termine di grado minore ha grado $p-1$. E' altrettanto evidente anche la seconda parte della tesi: tutti i coefficienti di \( \displaystyle f^{(i)}(x) \) risultano multipli di $p$ e dunque, per ogni $j \in ZZ$ si ha \( \displaystyle p \vert f^{(i)}(j) \) . \( \displaystyle \square \)
Se sviluppiamo le potenze, otteniamo
\( \displaystyle f(x) = \frac{(n!)^{p}}{(p-1)!} x^{p-1} + \frac{a_{0}}{(p-1)!}x^{p} + \frac{a_{1}}{(p-1)!}x^{p+1} + \ldots + \frac{a_{s}}{(p-1)!}x^{p+s} \)
E' ora evidente che, se $i \ge p$, il polinomio \( \displaystyle f^{(i)}(x) \) è a coefficienti interi: tutti i denominatori vengono "neutralizzati", giacché il termine di grado minore ha grado $p-1$. E' altrettanto evidente anche la seconda parte della tesi: tutti i coefficienti di \( \displaystyle f^{(i)}(x) \) risultano multipli di $p$ e dunque, per ogni $j \in ZZ$ si ha \( \displaystyle p \vert f^{(i)}(j) \) . \( \displaystyle \square \)
Lemma 3 Sia $1 < h \in NN$ e
\[\begin{split} a_{n} = \frac{h^{n} (h!)^{n}}{(n-1)!} \end{split} \]
Allora $lim_{n \to + \infty} a_{n} = 0$. In particolare, detto $\mathbb{P}$ l'insieme dei numeri primi, la sottosuccessione estratta da $a_{n}$ con $n \in \mathbb{P}$ converge allo stesso valore e scriveremo \( \displaystyle \lim_{\mathbb{P} \ni p \to +\infty} \, a_{p}=0 \) .
Testo nascosto, fai click qui per vederlo
Dimostrazione.
Mostreremo ovviamente solo la prima parte, giacché è risaputo che se una successione di numeri reali converge a $l \in RR$ anche ogni sottosuccessione estratta converge necessariamente a $l$ (si ricordi una nota disuguaglianza tra $lim "inf"$ e $lim "sup"$).
La tesi è comunque una semplice conseguenza della gerarchia degli infiniti e, in particolare, del fatto che
\[\begin{split} \lim_{n \to +\infty} \frac{\alpha^{n}}{n!} = 0 \end{split} \]
per ogni $\alpha \ge 0$.
Detto $m: = n-1$ il limite proposto vale
\[\begin{split} \lim_{m \to + \infty} \frac{ (h \cdot h!)^{m+1}}{m!} = h \cdot h! \lim_{m \to + \infty} \frac{(h\cdot h!)^{m}}{m!} = 0 \end{split} \] \( \displaystyle \square \)
Mostreremo ovviamente solo la prima parte, giacché è risaputo che se una successione di numeri reali converge a $l \in RR$ anche ogni sottosuccessione estratta converge necessariamente a $l$ (si ricordi una nota disuguaglianza tra $lim "inf"$ e $lim "sup"$).
La tesi è comunque una semplice conseguenza della gerarchia degli infiniti e, in particolare, del fatto che
\[\begin{split} \lim_{n \to +\infty} \frac{\alpha^{n}}{n!} = 0 \end{split} \]
per ogni $\alpha \ge 0$.
Detto $m: = n-1$ il limite proposto vale
\[\begin{split} \lim_{m \to + \infty} \frac{ (h \cdot h!)^{m+1}}{m!} = h \cdot h! \lim_{m \to + \infty} \frac{(h\cdot h!)^{m}}{m!} = 0 \end{split} \] \( \displaystyle \square \)
Osservazione. E' certamente possibile dare una dimostrazione del Lemma 3 usando la famigerata approssimazione di Stirling.
Siamo finalmente pronti per dimostrare il main result.
Teorema (Hermite, 1873). $e$ è trascendente.
Testo nascosto, fai click qui per vederlo
Dimostrazione. Supponiamo, per assurdo, che il numero $e$ sia algebrico (su $QQ$), cioè supponiamo esistano un numero finito di coefficienti $c_{0}, c_{1}, \ldots , c_{n}$ (che, senza ledere generalità alcuna, possono essere assunti interi) tali che
\[\begin{split} c_{n}e^{n} + c_{n-1}e^{n-1} + \ldots c_1e+c_{0} = 0 \qquad \text{(*)} \end{split} \]
e supponiamo inoltre che sia $c_{0}>0$ (se così non fosse si possono moltiplicare ambo i membri dell'equazione per $-1$).
Ora, preso un polinomio $f(x) \in RR[x]$ di grado $r$ e definita $F(x)$ come nel Lemma 1, osserviamo che la funzione $g: RR to RR$ definita da $x \mapsto e^{-x}F(x)$ è certamente continua e derivabile sull'aperto $(0,k)$, con $k in NN$.
Dunque, alla luce dei conti del Lemma 1, per il teorema del valor medio si ha
\[\begin{split} \frac{e^{-k}F(k)-F(0)}{k} = -e^{-\theta_{k} k} f(\theta_{k}k) \end{split} \]
dove $\theta_{k} \in (0,k)$ (il pedice serve a ricordare che $\theta_k$ può eventualmente dipendere da $k$).
Mediante semplici passaggi algebrici si ricava
\[\begin{split} F(k)-F(0)e^{k} = -ke^{(1-\theta_{k})k} f(\theta_{k}k) \end{split} \]
Per brevità, poniamo $epsilon_{i} = -ie^{(1-\theta_{i})i} f(\theta_{i}i)$. Le uguaglianze precedenti diventano
\[\begin{split} F(1)-F(0)e = \epsilon_1 \end{split}\]
\[\begin{split} F(2)-F(0)e^2 = \epsilon_2 \end{split}\]
\[\begin{split} \cdots \end{split}\]
\[\begin{split} F(n)-F(0)e^n = \epsilon_n \end{split}\]
Moltiplicando la prima di queste per $c_1$, la seconda per $c_2$ etc e poi sommando membro a membro ricaviamo
\[\begin{split} c_1 F(1) + c_2 F(2) + \ldots c_n F(n) -F(0)(c_1 e + \ldots c_ne^n) = c_1 \epsilon_1 + \ldots c_n \epsilon_n \end{split} \]
che, usando (*), diventa
\[\begin{split} c_0F(0) + c_1 F(1) + c_2 F(2) + \ldots c_n F(n) = c_1 \epsilon_1 + \ldots c_n \epsilon_n \end{split} \]
Ora, preso un qualunque primo $p > \text{max} { c_0, n}$, consideriamo il polinomio di Hermite $f_{n,p}(x)$. Per il Lemma 2 abbiamo $p | f^{(i)}(j)$ per ogni intero $j$ e per ogni $i \ge p$.
D'altra parte, è immediato osservare che per sua stessa definizione, $f_{n,p}(x)$ ammette $j=1,2, \ldots n$ come radici, ciascuna di molteplicità $p$ il che è equivalente a dire che
\[\begin{split} f(j) = f^{(1)}(j) = \ldots = f^{(p-1)}(j) = 0 \end{split}\]
per ogni $j \in {1,2, \ldots , n}$.
Insomma, mettendo insieme tutti i pezzi otteniamo che
\[\begin{split} F(j) = f(j) + f^{(1)}(j) + \ldots + f^{(p-1)}(j) + f^{(p)}(j) + \ldots + f^{(r)}(j) = f^{(p)}(j) + \ldots + f^{(r)}(j) \in \mathbb{Z} \end{split}\]
e in particolare, proprio per il Lemma 2, \( \displaystyle p \vert F(j) \quad \forall \ j \in \left\{1,2\ \ldots , n\right\} \) .
Ci stiamo avvicinando alla conclusione. Osserviamo che $x=0$ è pure soluzione del polinomio di Hermite, ma ha molteplicità $p-1$, i.e
\[\begin{split} f(0) = f^{(1)}(0) = \ldots = f^{(p-2)}(0) = 0 \end{split}\]
e la conclusione del lemma 2 continua a valere, cioé \( \displaystyle f^{(i)}(0) \) , per $i \ge p$, è intero e multiplo di $p$.
I problemi riguardano $f^{(p-1)}(0)$: non è difficile convincersi che $f^{(p-1)}(0) = (n!)^{p}$: ma per costruzione $p>n$ e $p$ è primo, dunque \( \displaystyle p \nmid (n!)^{p} =f^{(p-1)}(0) \) . Di conseguenza, anche $F(0)$ non è multiplo di $p$ e quindi, a causa di questo unico addendo, \( \displaystyle p \nmid c_{0}F(0) + \ldots + c_{n}F(n) \) .
Concludiamo la dimostrazione: si era ottenuto
\[\begin{split} c_{0} F(0) + c_{1} F(1) + c_{2} F(2) + \ldots c_{n} F(n) = c_1 \epsilon_1 + \ldots c_n \epsilon_n \end{split} \]
con $epsilon_{i} = -ie^{(1-\theta_{i})i} f(\theta_{i}i)$. Un minimo di stima (dall'alto) su $|\epsilon_{i}|$ ci permette di affermare che
\[\begin{split} |\epsilon_{i}| \le \frac{e^{n}}{(p-1)!}n^{p}(n!)^{p} \end{split} \]
per ogni $i \le n$.
Per ottenere tale stima, si maggiorino dapprima tutti gli $i$ con $n$ e si ricordi la monotonia dell'esponenziale; infine, si osservi che il termine dominante del prodotto $(1-i\theta_{i})^p(2-i\theta_{i})^p \ldots (n-i\theta_{i})^p$ è proprio $(n!)^p$.
In definitiva, \( \displaystyle |\epsilon_{i}| \le \frac{e^{n}}{(p-1)!}n^{p}(n!)^{p} \to 0 \) quando $p \to + \infty$, in virtù del Lemma 3. Applichiamo la definizione di limite di successione: fissato $\delta_{i} : = \frac{1}{nc_{i}}$, si ha che esiste un $p_{i} >0$ (primo) tale che se $p >p_{i}$ allora $|\epsilon_{i}|<\delta$.
Ma allora, per \( \displaystyle p > \text{max} \left\{ p_{i} \right\}_{i=1}^{n} \) , si ha
\[\begin{split} |c_{1} \epsilon_{1} + \ldots + c_{n}\epsilon_{n}| \le |c_{1} \epsilon_{1}| + \ldots + |c_{n}\epsilon_{n}| < |c_{1} \delta_{1}| + \ldots + |c_{n}\delta_{n}| < 1 \end{split} \]
Ma
\[\begin{split} c_1 \epsilon_1 + \ldots c_n \epsilon_n =c_{0} F(0) + c_{1} F(1) + c_{2} F(2) + \ldots c_{n} F(n) \in \mathbb{Z}\end{split} \] e dunque necessariamente $c_1 \epsilon_1 + \ldots c_n \epsilon_n=0$.
In definitiva, \( \displaystyle p \nmid c_{0}F(0) + \ldots + c_{n}F(n) = c_1 \epsilon_1 + \ldots c_n \epsilon_n = 0 \) , il che è evidentemente assurdo, giacché $p|0$.
La contraddizione nasce dall'aver supposto $e$ algebrico. Dunque $e$ è trascendente. \( \displaystyle \square \)
\[\begin{split} c_{n}e^{n} + c_{n-1}e^{n-1} + \ldots c_1e+c_{0} = 0 \qquad \text{(*)} \end{split} \]
e supponiamo inoltre che sia $c_{0}>0$ (se così non fosse si possono moltiplicare ambo i membri dell'equazione per $-1$).
Ora, preso un polinomio $f(x) \in RR[x]$ di grado $r$ e definita $F(x)$ come nel Lemma 1, osserviamo che la funzione $g: RR to RR$ definita da $x \mapsto e^{-x}F(x)$ è certamente continua e derivabile sull'aperto $(0,k)$, con $k in NN$.
Dunque, alla luce dei conti del Lemma 1, per il teorema del valor medio si ha
\[\begin{split} \frac{e^{-k}F(k)-F(0)}{k} = -e^{-\theta_{k} k} f(\theta_{k}k) \end{split} \]
dove $\theta_{k} \in (0,k)$ (il pedice serve a ricordare che $\theta_k$ può eventualmente dipendere da $k$).
Mediante semplici passaggi algebrici si ricava
\[\begin{split} F(k)-F(0)e^{k} = -ke^{(1-\theta_{k})k} f(\theta_{k}k) \end{split} \]
Per brevità, poniamo $epsilon_{i} = -ie^{(1-\theta_{i})i} f(\theta_{i}i)$. Le uguaglianze precedenti diventano
\[\begin{split} F(1)-F(0)e = \epsilon_1 \end{split}\]
\[\begin{split} F(2)-F(0)e^2 = \epsilon_2 \end{split}\]
\[\begin{split} \cdots \end{split}\]
\[\begin{split} F(n)-F(0)e^n = \epsilon_n \end{split}\]
Moltiplicando la prima di queste per $c_1$, la seconda per $c_2$ etc e poi sommando membro a membro ricaviamo
\[\begin{split} c_1 F(1) + c_2 F(2) + \ldots c_n F(n) -F(0)(c_1 e + \ldots c_ne^n) = c_1 \epsilon_1 + \ldots c_n \epsilon_n \end{split} \]
che, usando (*), diventa
\[\begin{split} c_0F(0) + c_1 F(1) + c_2 F(2) + \ldots c_n F(n) = c_1 \epsilon_1 + \ldots c_n \epsilon_n \end{split} \]
Ora, preso un qualunque primo $p > \text{max} { c_0, n}$, consideriamo il polinomio di Hermite $f_{n,p}(x)$. Per il Lemma 2 abbiamo $p | f^{(i)}(j)$ per ogni intero $j$ e per ogni $i \ge p$.
D'altra parte, è immediato osservare che per sua stessa definizione, $f_{n,p}(x)$ ammette $j=1,2, \ldots n$ come radici, ciascuna di molteplicità $p$ il che è equivalente a dire che
\[\begin{split} f(j) = f^{(1)}(j) = \ldots = f^{(p-1)}(j) = 0 \end{split}\]
per ogni $j \in {1,2, \ldots , n}$.
Insomma, mettendo insieme tutti i pezzi otteniamo che
\[\begin{split} F(j) = f(j) + f^{(1)}(j) + \ldots + f^{(p-1)}(j) + f^{(p)}(j) + \ldots + f^{(r)}(j) = f^{(p)}(j) + \ldots + f^{(r)}(j) \in \mathbb{Z} \end{split}\]
e in particolare, proprio per il Lemma 2, \( \displaystyle p \vert F(j) \quad \forall \ j \in \left\{1,2\ \ldots , n\right\} \) .
Ci stiamo avvicinando alla conclusione. Osserviamo che $x=0$ è pure soluzione del polinomio di Hermite, ma ha molteplicità $p-1$, i.e
\[\begin{split} f(0) = f^{(1)}(0) = \ldots = f^{(p-2)}(0) = 0 \end{split}\]
e la conclusione del lemma 2 continua a valere, cioé \( \displaystyle f^{(i)}(0) \) , per $i \ge p$, è intero e multiplo di $p$.
I problemi riguardano $f^{(p-1)}(0)$: non è difficile convincersi che $f^{(p-1)}(0) = (n!)^{p}$: ma per costruzione $p>n$ e $p$ è primo, dunque \( \displaystyle p \nmid (n!)^{p} =f^{(p-1)}(0) \) . Di conseguenza, anche $F(0)$ non è multiplo di $p$ e quindi, a causa di questo unico addendo, \( \displaystyle p \nmid c_{0}F(0) + \ldots + c_{n}F(n) \) .
Concludiamo la dimostrazione: si era ottenuto
\[\begin{split} c_{0} F(0) + c_{1} F(1) + c_{2} F(2) + \ldots c_{n} F(n) = c_1 \epsilon_1 + \ldots c_n \epsilon_n \end{split} \]
con $epsilon_{i} = -ie^{(1-\theta_{i})i} f(\theta_{i}i)$. Un minimo di stima (dall'alto) su $|\epsilon_{i}|$ ci permette di affermare che
\[\begin{split} |\epsilon_{i}| \le \frac{e^{n}}{(p-1)!}n^{p}(n!)^{p} \end{split} \]
per ogni $i \le n$.
Per ottenere tale stima, si maggiorino dapprima tutti gli $i$ con $n$ e si ricordi la monotonia dell'esponenziale; infine, si osservi che il termine dominante del prodotto $(1-i\theta_{i})^p(2-i\theta_{i})^p \ldots (n-i\theta_{i})^p$ è proprio $(n!)^p$.
In definitiva, \( \displaystyle |\epsilon_{i}| \le \frac{e^{n}}{(p-1)!}n^{p}(n!)^{p} \to 0 \) quando $p \to + \infty$, in virtù del Lemma 3. Applichiamo la definizione di limite di successione: fissato $\delta_{i} : = \frac{1}{nc_{i}}$, si ha che esiste un $p_{i} >0$ (primo) tale che se $p >p_{i}$ allora $|\epsilon_{i}|<\delta$.
Ma allora, per \( \displaystyle p > \text{max} \left\{ p_{i} \right\}_{i=1}^{n} \) , si ha
\[\begin{split} |c_{1} \epsilon_{1} + \ldots + c_{n}\epsilon_{n}| \le |c_{1} \epsilon_{1}| + \ldots + |c_{n}\epsilon_{n}| < |c_{1} \delta_{1}| + \ldots + |c_{n}\delta_{n}| < 1 \end{split} \]
Ma
\[\begin{split} c_1 \epsilon_1 + \ldots c_n \epsilon_n =c_{0} F(0) + c_{1} F(1) + c_{2} F(2) + \ldots c_{n} F(n) \in \mathbb{Z}\end{split} \] e dunque necessariamente $c_1 \epsilon_1 + \ldots c_n \epsilon_n=0$.
In definitiva, \( \displaystyle p \nmid c_{0}F(0) + \ldots + c_{n}F(n) = c_1 \epsilon_1 + \ldots c_n \epsilon_n = 0 \) , il che è evidentemente assurdo, giacché $p|0$.
La contraddizione nasce dall'aver supposto $e$ algebrico. Dunque $e$ è trascendente. \( \displaystyle \square \)
Mi rendo conto che la dimostrazione non è per nulla banale, né immediata. Però - e la cosa mi ha sconvolto, inizialmente - non fa uso di nulla di particolare, nessuna tecnica sofisticata, nessun concetto avanzato.
A voi gli eventuali commenti. Sperando che la possa possa risultare gradita e utile a qualche utente,