La trascendenza di $e$

da **Paolo90** » 09/09/2011, 21:17

E' da tempo che stavo pensando di scrivere un post su questo argomento che, soprattutto nell'ultimo periodo, mi ha affascinato e interessato parecchio.

Intendo dimostrare che il numero di Nepero $e$ è trascendente. In verità, vorrei mostrare che il problema della trascendenza di $e$ non è così difficile da risolvere come può sembrare ad una prima occhiata. Al contrario, bastano pochi strumenti di Analisi I (sostanzialmente: limiti di successioni e il teorema del valor medio) per dimostrare questo fatto profondo.

Consiglio, inoltre, a chiunque sia interessato alla questione, le ottime pagine dal caro prof. Tilli che riportano, tra il resto, una dimostrazione dell'irrazionalità di $e$. Il materiale che segue è una mia libera rielaborazione di alcune pagine del "mitico" Herstein, Algebra (Editori Riuniti).

Articolerò la dimostrazione in alcuni lemmi. Lo strumento più profondo è, come già detto, il teorema del valor medio, che richiamiamo brevemente. Qui e nel seguito indicherò con $ \displaystyle f^{(i)}(x) $ la derivata $i$-esima della funzione $f: RR to RR$.

Teorema (di Lagrange o del valor medio). Sia $f: (a,b) \to RR$ una funzione continua e derivabile su tutto $(a,b)$. Allora esiste un $c \in (a,b)$ tale che
\[\begin{split} \frac{f(b)-f(a)}{b-a} = f'(c) \end{split} \]
o, equivalentemente, si ha
\[\begin{split} \frac{f(b)-f(a)}{b-a} = f'(a+\theta(b-a)) \end{split} \]
per un opportuno $\theta \in (0,1)$.

Dopo questo richiamo che dovrebbe essere comunque noto, procediamo con alcuni lemmi.

Lemma 1. Sia $f(x) \in \RR[x]$ di grado $r$. Detta $ \displaystyle F(x)=f(x)+f^{(1)}(x)+f^{(2)}(x) + \ldots + f^{(r)}(x) $ , allora vale
\[\begin{split} \frac{d}{dx} e^{-x}F(x) = -e^{-x}f(x) \end{split} \]

Testo nascosto, fai click qui per vederlo

Dimostrazione. Si tratta di fare i conti; si applichi la nota regola di Leibniz, tenendo presente che $f(x)$ ha grado $r$, dunque $ \displaystyle f^{(i)}(x) \equiv 0 $ , per ogni $i > r$. $ \displaystyle \square $

Lemma 2 (Hermite). Sia $n \in NN$ e $p$ un primo, con $p>n$ e si consideri il seguente polinomio (detto anche di Hermite)
\[\begin{split} f_{n,p}(x) = f(x) = \frac{1}{(p-1)!} x^{p-1} (1-x)^p(2-x)^p \cdots (n-x)^p \end{split} \]
Allora, se $i \ge p$ il polinomio $ \displaystyle f^{(i)}(x) $ è a coefficienti interi e, in particolare, per ogni $j \in ZZ$ risulta $ \displaystyle p \vert f^{(i)}(j) $ .

Testo nascosto, fai click qui per vederlo

Dimostrazione.
Se sviluppiamo le potenze, otteniamo
$ \displaystyle f(x) = \frac{(n!)^{p}}{(p-1)!} x^{p-1} + \frac{a_{0}}{(p-1)!}x^{p} + \frac{a_{1}}{(p-1)!}x^{p+1} + \ldots + \frac{a_{s}}{(p-1)!}x^{p+s} $

E' ora evidente che, se $i \ge p$, il polinomio $ \displaystyle f^{(i)}(x) $ è a coefficienti interi: tutti i denominatori vengono "neutralizzati", giacché il termine di grado minore ha grado $p-1$. E' altrettanto evidente anche la seconda parte della tesi: tutti i coefficienti di $ \displaystyle f^{(i)}(x) $ risultano multipli di $p$ e dunque, per ogni $j \in ZZ$ si ha $ \displaystyle p \vert f^{(i)}(j) $ . $ \displaystyle \square $

Lemma 3 Sia $1 < h \in NN$ e
\[\begin{split} a_{n} = \frac{h^{n} (h!)^{n}}{(n-1)!} \end{split} \]

Allora $lim_{n \to + \infty} a_{n} = 0$. In particolare, detto $\mathbb{P}$ l'insieme dei numeri primi, la sottosuccessione estratta da $a_{n}$ con $n \in \mathbb{P}$ converge allo stesso valore e scriveremo $ \displaystyle \lim_{\mathbb{P} \ni p \to +\infty} \, a_{p}=0 $ .

Testo nascosto, fai click qui per vederlo

Dimostrazione.
Mostreremo ovviamente solo la prima parte, giacché è risaputo che se una successione di numeri reali converge a $l \in RR$ anche ogni sottosuccessione estratta converge necessariamente a $l$ (si ricordi una nota disuguaglianza tra $lim "inf"$ e $lim "sup"$).
La tesi è comunque una semplice conseguenza della gerarchia degli infiniti e, in particolare, del fatto che
\[\begin{split} \lim_{n \to +\infty} \frac{\alpha^{n}}{n!} = 0 \end{split} \]
per ogni $\alpha \ge 0$.
Detto $m: = n-1$ il limite proposto vale
\[\begin{split} \lim_{m \to + \infty} \frac{ (h \cdot h!)^{m+1}}{m!} = h \cdot h! \lim_{m \to + \infty} \frac{(h\cdot h!)^{m}}{m!} = 0 \end{split} \] $ \displaystyle \square $

Osservazione. E' certamente possibile dare una dimostrazione del Lemma 3 usando la famigerata approssimazione di Stirling.

Siamo finalmente pronti per dimostrare il main result.

Teorema (Hermite, 1873). $e$ è trascendente.

Testo nascosto, fai click qui per vederlo

Dimostrazione. Supponiamo, per assurdo, che il numero $e$ sia algebrico (su $QQ$), cioè supponiamo esistano un numero finito di coefficienti $c_{0}, c_{1}, \ldots , c_{n}$ (che, senza ledere generalità alcuna, possono essere assunti interi) tali che
\[\begin{split} c_{n}e^{n} + c_{n-1}e^{n-1} + \ldots c_1e+c_{0} = 0 \qquad \text{(*)} \end{split} \]
e supponiamo inoltre che sia $c_{0}>0$ (se così non fosse si possono moltiplicare ambo i membri dell'equazione per $-1$).

Ora, preso un polinomio $f(x) \in RR[x]$ di grado $r$ e definita $F(x)$ come nel Lemma 1, osserviamo che la funzione $g: RR to RR$ definita da $x \mapsto e^{-x}F(x)$ è certamente continua e derivabile sull'aperto $(0,k)$, con $k in NN$.

Dunque, alla luce dei conti del Lemma 1, per il teorema del valor medio si ha
\[\begin{split} \frac{e^{-k}F(k)-F(0)}{k} = -e^{-\theta_{k} k} f(\theta_{k}k) \end{split} \]
dove $\theta_{k} \in (0,k)$ (il pedice serve a ricordare che $\theta_k$ può eventualmente dipendere da $k$).

Mediante semplici passaggi algebrici si ricava
\[\begin{split} F(k)-F(0)e^{k} = -ke^{(1-\theta_{k})k} f(\theta_{k}k) \end{split} \]

Per brevità, poniamo $epsilon_{i} = -ie^{(1-\theta_{i})i} f(\theta_{i}i)$. Le uguaglianze precedenti diventano
\[\begin{split} F(1)-F(0)e = \epsilon_1 \end{split}\]
\[\begin{split} F(2)-F(0)e^2 = \epsilon_2 \end{split}\]
\[\begin{split} \cdots \end{split}\]
\[\begin{split} F(n)-F(0)e^n = \epsilon_n \end{split}\]

Moltiplicando la prima di queste per $c_1$, la seconda per $c_2$ etc e poi sommando membro a membro ricaviamo
\[\begin{split} c_1 F(1) + c_2 F(2) + \ldots c_n F(n) -F(0)(c_1 e + \ldots c_ne^n) = c_1 \epsilon_1 + \ldots c_n \epsilon_n \end{split} \]
che, usando (*), diventa
\[\begin{split} c_0F(0) + c_1 F(1) + c_2 F(2) + \ldots c_n F(n) = c_1 \epsilon_1 + \ldots c_n \epsilon_n \end{split} \]

Ora, preso un qualunque primo $p > \text{max} { c_0, n}$, consideriamo il polinomio di Hermite $f_{n,p}(x)$. Per il Lemma 2 abbiamo $p | f^{(i)}(j)$ per ogni intero $j$ e per ogni $i \ge p$.
D'altra parte, è immediato osservare che per sua stessa definizione, $f_{n,p}(x)$ ammette $j=1,2, \ldots n$ come radici, ciascuna di molteplicità $p$ il che è equivalente a dire che
\[\begin{split} f(j) = f^{(1)}(j) = \ldots = f^{(p-1)}(j) = 0 \end{split}\]
per ogni $j \in {1,2, \ldots , n}$.

Insomma, mettendo insieme tutti i pezzi otteniamo che
\[\begin{split} F(j) = f(j) + f^{(1)}(j) + \ldots + f^{(p-1)}(j) + f^{(p)}(j) + \ldots + f^{(r)}(j) = f^{(p)}(j) + \ldots + f^{(r)}(j) \in \mathbb{Z} \end{split}\]
e in particolare, proprio per il Lemma 2, $ \displaystyle p \vert F(j) \quad \forall \ j \in \left\{1,2\ \ldots , n\right\} $ .

Ci stiamo avvicinando alla conclusione. Osserviamo che $x=0$ è pure soluzione del polinomio di Hermite, ma ha molteplicità $p-1$, i.e
\[\begin{split} f(0) = f^{(1)}(0) = \ldots = f^{(p-2)}(0) = 0 \end{split}\]
e la conclusione del lemma 2 continua a valere, cioé $ \displaystyle f^{(i)}(0) $ , per $i \ge p$, è intero e multiplo di $p$.

I problemi riguardano $f^{(p-1)}(0)$: non è difficile convincersi che $f^{(p-1)}(0) = (n!)^{p}$: ma per costruzione $p>n$ e $p$ è primo, dunque $ \displaystyle p \nmid (n!)^{p} =f^{(p-1)}(0) $ . Di conseguenza, anche $F(0)$ non è multiplo di $p$ e quindi, a causa di questo unico addendo, $ \displaystyle p \nmid c_{0}F(0) + \ldots + c_{n}F(n) $ .

Concludiamo la dimostrazione: si era ottenuto
\[\begin{split} c_{0} F(0) + c_{1} F(1) + c_{2} F(2) + \ldots c_{n} F(n) = c_1 \epsilon_1 + \ldots c_n \epsilon_n \end{split} \]
con $epsilon_{i} = -ie^{(1-\theta_{i})i} f(\theta_{i}i)$. Un minimo di stima (dall'alto) su $|\epsilon_{i}|$ ci permette di affermare che
\[\begin{split} |\epsilon_{i}| \le \frac{e^{n}}{(p-1)!}n^{p}(n!)^{p} \end{split} \]
per ogni $i \le n$.
Per ottenere tale stima, si maggiorino dapprima tutti gli $i$ con $n$ e si ricordi la monotonia dell'esponenziale; infine, si osservi che il termine dominante del prodotto $(1-i\theta_{i})^p(2-i\theta_{i})^p \ldots (n-i\theta_{i})^p$ è proprio $(n!)^p$.

In definitiva, $ \displaystyle |\epsilon_{i}| \le \frac{e^{n}}{(p-1)!}n^{p}(n!)^{p} \to 0 $ quando $p \to + \infty$, in virtù del Lemma 3. Applichiamo la definizione di limite di successione: fissato $\delta_{i} : = \frac{1}{nc_{i}}$, si ha che esiste un $p_{i} >0$ (primo) tale che se $p >p_{i}$ allora $|\epsilon_{i}|<\delta$.

Ma allora, per $ \displaystyle p > \text{max} \left\{ p_{i} \right\}_{i=1}^{n} $ , si ha
\[\begin{split} |c_{1} \epsilon_{1} + \ldots + c_{n}\epsilon_{n}| \le |c_{1} \epsilon_{1}| + \ldots + |c_{n}\epsilon_{n}| < |c_{1} \delta_{1}| + \ldots + |c_{n}\delta_{n}| < 1 \end{split} \]
Ma
\[\begin{split} c_1 \epsilon_1 + \ldots c_n \epsilon_n =c_{0} F(0) + c_{1} F(1) + c_{2} F(2) + \ldots c_{n} F(n) \in \mathbb{Z}\end{split} \] e dunque necessariamente $c_1 \epsilon_1 + \ldots c_n \epsilon_n=0$.
In definitiva, $ \displaystyle p \nmid c_{0}F(0) + \ldots + c_{n}F(n) = c_1 \epsilon_1 + \ldots c_n \epsilon_n = 0 $ , il che è evidentemente assurdo, giacché $p|0$.

La contraddizione nasce dall'aver supposto $e$ algebrico. Dunque $e$ è trascendente. $ \displaystyle \square $

Mi rendo conto che la dimostrazione non è per nulla banale, né immediata. Però - e la cosa mi ha sconvolto, inizialmente - non fa uso di nulla di particolare, nessuna tecnica sofisticata, nessun concetto avanzato.

A voi gli eventuali commenti. Sperando che la possa possa risultare gradita e utile a qualche utente, :wink:

da **Valerio Capraro** » 09/09/2011, 21:54

interessante! buona idea postare questa cosa e gli daro' senz'altro una letta approfondita.

Lasciami pero' dire che il teorema del valor medio e' in questo contesto un teorema profondo. Cosa voglio dire? semplicemente che se uno guarda il problema, non capisce a primo acchito cosa c'entra il valore medio. La prima difficolta' di questa dimostrazione e' dal fatto che proviene dall'utilizzo di strumenti "lontani". La seconda e' che, vabbe'..., non e' per niente banale.

da **Paolo90** » 09/09/2011, 22:41

Valerio Capraro ha scritto:interessante! buona idea postare questa cosa e gli daro' senz'altro una letta approfondita.

Ottimo, mi fa piacere ti sia piaciuta l'idea. Ascolterò volentieri un tuo parere e le tue correzioni.

Valerio Capraro ha scritto:Lasciami pero' dire che il teorema del valor medio e' in questo contesto un teorema profondo. Cosa voglio dire? semplicemente che se uno guarda il problema, non capisce a primo acchito cosa c'entra il valore medio. La prima difficolta' di questa dimostrazione e' dal fatto che proviene dall'utilizzo di strumenti "lontani". La seconda e' che, vabbe'..., non e' per niente banale.

Sì, hai assolutamente ragione. Quello che però mi piace è che è una dimostrazione abbastanza "conti"-free :-D

Insomma, servono delle idee ma nulla di troppo difficile (nel senso: uno studente alla fine del I anno ha tutti gli strumenti per capirla).
Francamente, se devo dirla tutta, trovo più "difficile" la dimostrazione dell'irrazionalità di $pi$ (dimostrazione che ho visto a lezione nel corso di Algebra II) che non questa. La dimostrazione dell'irrazionalità di $pi$ che ho studiato io è quasi esclusivamente tecnicismo, insomma devi calcolare un integrale strampalato e poi conti, conti, ancora conti per arrivare a trovare un numero intero tra $0$ e $1$. :lol:

Questa è più bella secondo me. Ed è anche per questo che ho deciso di postarla.

Tra l'altro, qualcuno conosce la dimostrazione della trascendenza di $pi$? Potremmo discuterne insieme, magari in un topic simile.
:wink:

da **dissonance** » 10/09/2011, 00:32

Un bellissimo lavoro, Paolo. Tra l'altro è un argomento che non conosco e appena ho un po' di tempo lo leggerò molto volentieri.

P.S.: Mi pare che la trascendenza di $\pi$ sia più difficile da dimostrare, nel senso che richiede strumenti più sofisticati. Ma sono cose di cui non capisco assolutamente nulla.

da **Paolo90** » 10/09/2011, 09:47

dissonance ha scritto:Un bellissimo lavoro, Paolo. Tra l'altro è un argomento che non conosco e appena ho un po' di tempo lo leggerò molto volentieri.

Ti ringrazio; sarò molto felice se qualcuno lo leggerà in maniera approfondita. Anche perché molte cose che ho scritto sono "farina del mio sacco": ho voluto giustificare con cura ogni passaggio (l'Herstein lascia qualcosa come esercizio al lettore) e quindi non è escluso (anzi...) che possano esserci errori qua e là.

dissonance ha scritto: P.S.: Mi pare che la trascendenza di $\pi$ sia più difficile da dimostrare, nel senso che richiede strumenti più sofisticati. Ma sono cose di cui non capisco assolutamente nulla.

Non lo so, non ho mai visto la dimostrazione della trascendenza di $pi$. So che è un risultato di von Lindemann del 1882 (nove anni dopo quello di Hermite), ma non ho mai visto né trovato da nessuna parte l'argomentazione.

Comunque, la trascendenza di $pi$ è oggi un semplice corollario del risultato di Hermite e di un altro teorema molto profondo (Lindemann-Weierstrass: cfr. wikipedia per maggiori dettagli): in pratica, basta ricordare l'identità che lega tra loro queste due costanti, l'identità di Eulero $e^{i \pi}+1=0$, e applicare nell'ordine i due teoremi di cui sopra. Qui si possono leggere maggiori dettagli su questa strada.

Vi ringrazio ancora per i vostri interventi.

La trascendenza di $e$

La trascendenza di $e$

Re: La trascendenza di \( \displaystyle {e} \)

Re: La trascendenza di \( \displaystyle {e} \)

Chi c’è in linea