Ciao!
intanto è $f:RR^n->RR$
comunque considera che, posto $e_k$ il $k-$esimo vettore della base canonica di $RR^n$, si ha;
$f(x+te_k)=(x+te_k)^TA(x+te_k)=x^TAx+2te_k^TAx+t^2e_k^TAe_k$
quindi $lim_(t->0)(f(x+te_k)-f(x))/t=lim_(t->0)[2e_k^TAx+te_k^TAe_k]=2e_k^TAx$
questo significa che $(partialf)/(partialx_k)(x)=2e_k^TAx$
denotata con $A_k$ la $k-$esima riga della matrice si ha $e_k^TA=A_k$ quindi il gradiente è
$nablaf(x)=2(A_1x,A_2x,...,A_nx)=2Ax$
ti basta considerare che
$Ax=[(A_1x),(A_2x),( : ),(A_mx)]equiv(A_1 x, A_2 x,...,A_n x)$
poichè $RR^n cong underbrace(RR^(1timesn))_(M_(1,n)(RR)) cong underbrace(RR^(ntimes1))_(M_(n,1)(RR))$
aggiungo: non ti fare confondere dalle particolari proprietà di $RR^n$ e dalla “forma” dei suoi vettori; se lo sostituisci con un qualsiasi altro spazio euclideo $(X,*)$ reale, posta una base ortonormale qualsiasi, puoi dimostrare lo stesso teorema nello stesso modo
Questo perché sostanzialmente il gradiente ha senso considerarlo solo quando hai a che fare con spazi euclidei e basi ortonormali, poi tutta la dimostrazione dipende soltanto da questo