Cos'è ElectroYou | Login Iscriviti

ElectroYou - la comunità dei professionisti del mondo elettrico

Ricerca personalizzata
6
voti

La diagonalizzazione

L'intento di questo articolo è di affrontare, si spera sempre nel modo più corretto e chiaro possibile, la trattazione di un argomento importante nell'ambito dell'algebra lineare quale quello della diagonalizzazione.
Cercherò di affrontare l'argomento in maniera graduale percorrendo le varie tappe necessarie alla comprensione dell'argomento nel suo insieme.
Data la lunghezza dell'articolo, per orientarsi nella sua consultazione, si consiglia di cliccare sul pulsante Mostra indice posto in alto. Buona lettura.


Indice

Polinomi di matrici

Consideriamo, su un campo K, il polinomio seguente:


f(t)=\ a_nt^n+\cdots+a_1t+a_0\ \ .


Data una matrice A quadrata, essa può essere definita come:


f(A)=a_nA^n+\ \cdots\ +\ a_1A\ +\  a_0I

dove I è la nota matrice identità.
In particolare, diremo che A è una radice, o uno zero, del polinomio f(t) se f(A)\ =\ 0 .


Esempio

Abbiamo la matrice:
A=\ \begin{bmatrix}1 & 2\\ 3 & 4\end{bmatrix} ; si avrà quindi che A^2=\ \begin{bmatrix}7 & 10\\ 15 & 22\end{bmatrix}\ \ .


Date inoltre:
f(t)=\ 2t^2-3t+5\ \ \ \ g(t)=\ t^2-5t-2 ,


avremo quanto segue.


f(A)=2A^2-3A+5I=\ \begin{bmatrix}14 & 20\\ 30 & 44\end{bmatrix}\ +\ \begin{bmatrix}-3 & -6\\ -9 & -12\end{bmatrix}\ +\ \begin{bmatrix}5 & 0\\ 0 & 5\end{bmatrix}=\ \begin{bmatrix}16 & 14\\ 21 & 37\end{bmatrix}


e


g(A)=A^2-5A-2I\ =\ \begin{bmatrix}7 & 10\\ 15 & -20\end{bmatrix}\ +\ \begin{bmatrix}-5 & -10\\ -15 & -20\end{bmatrix}\ +\ \begin{bmatrix}-2 & 0\\ 0 & -2\end{bmatrix}\ =\ \begin{bmatrix}0 & 0\\ 0 & 0\end{bmatrix}


Si deduce quindi che A è uno zero di g(t).



Enunciamo ora il seguente teorema.
Siano f e g dei polinomi su K. Per ogni matrice A e per ogni scalare k,

  1. (f+g)(A)\ =\ f(A)+g(A) ;
  2. (fg)(A)\ =\ f(A)g(A) ;
  3. (kf)(A)\ =\ kf(A) ;
  4. f(A)g(A)\ =\ g(A)f(A) (due polinomi in A commutano).

Le matrici e gli operatori lineari

Consideriamo ora un operatore lineare T:V \to V su uno spazio vettoriale V. Le potenze di T sono definite mediante l'operazione di composizione:


T^2\ =\ T \circ T,\ \ \ T^3\ =\ T^2 \circ T,\ \ \ \cdots


Per ogni polinomio f(T)\ =\ a_nt^n\ +\ \cdots\ +\ a_1t\ +\ a_0 definiamo f(T) in maniera uguale a quanto fatto per le matrici, cioè:


f(T)\ =\ a_nT^n\ +\ \cdots\ +\ a_1T\ +\ a_0I


dove I è l'applicazione identità. Si dirà quindi che T èuna radice o zero di f(t) se f(T)\ =\ 0.


Va precisato che quanto esposto al teorema prima enunciato vale tanto per gli operatori lineari quanto per le matrici.


Polinomio caratteristico e teorema di Cayley - Hamilton

Prendiamo ora in considerazione una matrice quadrata A di ordine n.


La matrice M\ =\ A\ -tI_n, dove In è la matrice quadrata identità di dimensione n e t è una incognita, può essere ottenuta se si sottrae t dalla diagonale A.
L'opposta della matrice M è la matrice tI_n\ -\ A ed il suo determinante:


\Delta (t)\ =\ \det (tI_n\ -\ A)\ =\ (-1)^n\det (A\ -\ tI_n)


è un polinomio di grado n in t d è più precisamente detto polinomio caratteristico di A.


Passiamo ora ad enunciare il seguente importante teorema dovuto a Cayley ed Hamilton.
Il teorema di Cayley - Hamilton afferma che ogni matrice A è uno zero del suo polinomio caratteristico.


Esempio

Facciamo un piccolo esempio a riguardo.
Prendiamo in considerazione la matrice A (quadrata):


A=\begin{bmatrix}1 & 3\\ 4 & 5\end{bmatrix}\ \ .


Scriviamone il polinomio caratteristico:


\Delta (t)\ =\ \begin{vmatrix}tI\ -\ A\end{vmatrix}\ =\ \begin{vmatrix}t-1 & -3\\ -4 & t-5\end{vmatrix}\ =\ (t-1)(t-5)-12\ =\ t^2-6t-7


Possiamo verificare quanto dichiarato dal teorema di Cayley - Hamilton e cioè che A è uno zero di Δ(t):


\Delta (A)=A^2-6A-7I=\begin{bmatrix}13 & 18\\ 24 & 37\end{bmatrix}+\begin{bmatrix}-6 & -18\\ -24 & -30\end{bmatrix}+\begin{bmatrix}-7 & 0\\ 0 & -7\end{bmatrix}=\begin{bmatrix}0 & 0\\ 0 & 0\end{bmatrix}



Si dimostra inoltre che matrici simili hanno lo stesso polinomio caratteristico.


Alcune formule per il calcolo di polinomi caratteristici di matrici di ordine 2 e 3

Ordine 2

Data la matrice A=\begin{bmatrix}a_{11} & a_{12} & a_{13}\\ a_{21} & a_{22} & a_{23}\\ a_{31} & a_{32} & a_{33}\end{bmatrix} , allora :


\Delta (t)=t^2-(a_{11}+a_{22})t+\begin{vmatrix}
a_{11} & a_{12}\\ a_{21} & a_{22}\end{vmatrix}=t^2-\mathrm{tr}(A)t+ \det(A)

dove tr(A) è la traccia di A, cioè la somma degli elementi diagonali.


Ordine 3

Data la matrice A=\begin{bmatrix}a_{11} & a_{12} & a_{13}\\ a_{21} & a_{22} & a_{23}\\ a_{31} & a_{32} & a_{33}\end{bmatrix} , allora :


\Delta (t)=\ t^3-\mathrm{tr}(A)t^2+(A_{11}+A_{22}+A_{33})t- \det(A)

dove A_{11},\ A_{22},\ A_{33} sono i cofattori degli elementi diagonali.



Possiamo enunciare quindi il seguente teorema.
Data una matrice quadrata di ordine n, il suo polinomio caratteristico è :


\Delta (t)=\ t^{n}-S_{1}t^{n-1}+S_{2}t^{n-2}-\ \cdots\ +\ (-1)^{n}S_{n}

dove Sk è la somma dei minori principali di ordine k.


Esempio

Scriviamo il polinomio caratteristico della matrice :


A=\ \begin{bmatrix}1 & 1 & 2\\ 0 & 3 & 2\\ 1 & 3 & 9\end{bmatrix}\ \ .


Si ha \mathrm{tr}(A)=\ 1+3+9=13. I cofattori degli elementi sulla diagonale sono:


A_{11}=\ \begin{vmatrix}3 & 2\\ 3 & 9\end{vmatrix}=21,\ A_{22}=\begin{vmatrix}1 & 2\\ 1 & 9\end{vmatrix}=7,\ \ A_{33}=\ \begin{vmatrix}1 & 1\\ 0 & 3\end{vmatrix}


Quindi A_{11}+ A_{22}+ A_{33}=\ 31. Inoltre \begin{vmatrix}A\end{vmatrix}=\ 27+2+0-6-6-0=17
Conseguentemente:


Δ(t) = t3 − 13t2 + 31t − 17


Polinomio caratteristico per un operatore lineare

Consideriamo ancora un operatore lineare T:V \to V su uno spazio vettoriale V di dimensione finita.
Il polinomio caratteristico Δ(t) di T è definito come il polinomio caratteristico di una qualunque matrice che rappresenta T.
Se A e B sono matrici di rappresentazione di T, si ha B=\ P^{-1}AP, dove P è la matrice del cambiamento di base. A e B sono quindi simili e giacché due matrici simili hanno lo stesso polinomio caratteristico (lo abbiamo detto precedentemente), esse hanno lo stesso polinomio caratteristico.
Il polinomio caratteristico di T è quindi indipendente dalla base rispetto a cui è calcolata la sua matrice di rappresentazione.
f(T)=\ 0 se e solo se f(A)\ =\ 0, dove f(t) è un qualunque polinomio ed A è una matrice qualunque che rappresenta T: fatte salve tale considerazioni si può enunciare il seguente teorema per un operatore lineare.
Un'operatore lineare T è uno zero del suo polinomio caratteristico.

La diagonalizzazione: autovalori ed autovettori

Consideriamo la nostra matrice quadrata A di ordine n.
Diremo che è possibile rappresentare A con una matrice diagonale:


D=\ \mathrm{diag}(k_{1},k_{2},\ \cdots,k_{n})

se e solo se esiste una base S costituita da vettori (colonna) u_{1},u_{2},\ \cdots,u_{n}, tali che:


\begin{matrix}Au_{1} & = & k_{1}u_{1} &  & \\ Au_{2} & = &  & k_{2}u_{2} & \\ \cdots & \cdots & \cdots & \cdots & \cdots\\ Au_{n} & = &  &  & k_{n}u_{n}\end{matrix}


In questo caso A si dice diagonalizzabile.


Inoltre: sia A una matrice qualunque e sia λ uno scalare appartenente a K. Ebbene λ si dirà autovalore di A se esiste un vettore (colonna) non nullo v \in K^{n} tale che :


Av\ =\ \lambda v


Si dirà invece autovettore di A relativo all'autovalore λ ogni vettore che soddisfa tale relazione.


L'insieme Eλ di tutti gli autovettori relativi a λ è un sottospazio di V e si chiama autospazio di λ.


Enunciamo ora il seguente teorema.
Una matrice quadrata A di dimensione n è simile ad una matrice diagonale D se e solo se A ha n autovettori linearmente indipendenti. In tal caso gli elementi diagonali di D soon i corrispondenti autovalori e D\ =\ P^{-1}AP, dove P è la matrice le cui colonne sono gli autovettori.


Se una matrice A può essere diagonalizzata si dice che A ammette una fattorizzazione diagonale


A\ =\ PDP^{-1}

Con tale fattorizzazione l'algebra di A viene quindi ad essere l'algebra della matrice diagonale D, calcolabile facilmente.


Le proprietà degli autovalori e degli autovettori

Elenchiamo nel teorema seguente le proprietà che occorreranno per trovare una rappresentazione diagonale di una matrice quadrata.

Sia A una matrice quadrata. Sono equivalenti le seguenti affermazioni:

  1. lo scalare λ è un autovalore di A ;
  2. la matrice M = A − 2λI è singolare ;
  3. lo scalare λ è una radice del polinomio caratteristico Δ(t) di A.


L'autospazio Eλ è quindi lo spazio delle soluzioni del sistema omogeneo MX = 0, dove M=\ A- \lambda I, ottenuta cioè sottraendo λ dagli elementi sulla diagonale di A.
Alcune matrici possono non avere autovalori (e quindi autovettori). Ricorrendo però al Teorema fondamentale dell'algebra (ogni polinomio su \mathrm{\mathbf{C}} ha almeno una radice) e al teorema prima esposto si può ottenere il risultato che segue.
Sia A una matrice quadrata sul campo complesso \mathrm{\mathbf{C}} , allora A ha almeno un autovalore.



Consideriamo adesso la matrice A e supponiamo che λ sia un suo autovalore.
Per molteplicità algebrica di λ si intende la molteplicità di λ come polinomio caratteristico di A.
La molteplicità geometrica di λ è la dimensione del suo autospazio, in simboli : dimEλ.


Alla luce delle considerazioni finora fatte vale il seguente teorema.
Sia λ un autovalore di una matrice A: allora la molteplicità geometrica di λ non eccede la sua molteplicità algebrica.


Diagonalizzazione di operatori lineari

Cominciamo col dire che un operatore lineare T su uno spazio vettoriale V è detto diagonalizzabile se può essere rappresentato da una matrice diagonale D. Dunque T sarà diagonalizzabile se e solo se esiste una base di V


S=\ {u_{1},u_{2}, \cdots, u_{n}}


per la quale si ha:


\begin{matrix}Tu_{1} & = & k_{1}u_{1} &  & \\ Tu_{2} & = &  & k_{2}u_{2} & \\ \cdots & \cdots & \cdots & \cdots & \cdots\\ Tu_{n} & = &  &  & k_{n}u_{n}\end{matrix}


In tal caso T è rappresentato dalla matrice diagonale:


D=\ \mathrm{diag}(k_{1},k_{2},\cdots,k_{n})

relativa alla base S prima citata.


In maniera analoga a quanto fatto per le matrici procediamo col dare le seguenti definizioni.


Uno scalare \lambda \in K si dice autovalore di T se esiste un vettore v \in V non nullo per il quale


T(v)=\ \lambda v


Ogni vettore che soddisfa questa relazione è detto autovettore di T relativo all'autovalore λ.


L'insieme Eλ di tutti questi vettori è un sottospazio di V ed è detto autospazio di λ.
Senza ripetere quanto già detto per le matrici, anche per gli operatori lineari valgono le medesime definizioni di molteplicità algebrica e geometrica.


Per completare enunciamo infine i seguenti teoremi che si applicano ad un operatore lineare T su uno spazio vettoriale di dimensione finita V.


T si può rappresentare con una matrice diagonale D se e solo se esiste una base S di V costituita da autovettori di T. In tal caso gli elementi diagonali di D soon i corrispondenti autovalori.


Sia T un operatore lineare. Sono equivalenti le seguenti affermazioni:

  1. lo scalare λ è un autovalore di T ;
  2. l'operatore lineare λIT è singolare ;
  3. lo scalare λ è una radice del polinomio caratteristico Δ(t) di T .


Dato uno spazio vettoriale complesso, allora T ha almeno un autovalore.


Supponiamo che v_{1},v_{2}, \cdots, v_{n} siano gli autovettori diversi da zero di T e relativi a distinti autovalori \lambda_{1},\lambda_{2}, \cdots, \lambda_{n}, allora v_{1},v_{2}, \cdots, v_{n} sono linearmente indipendenti.


Supponiamo che il polinomio caratteristico di T sia prodotto di n fattori distinti


\Delta (t)=\ (t-a_{1})(t-a_{2})\cdots(t-a_{n})

Ebbene T può essere rappresentato dalla matrice diagonale


D=\ \mathrm{diag}(a_{1},a_{2},\cdots, a_{3})


La molteplicità geometrica di un autovalore λ di T non supera la sua molteplicità algebrica.



Infine rilevante è anche il teorema che segue che riduce la ricerca della diagonalizzazione di un operatore lineare T a quella di una matrice A. Se A è la rappresentazione matriciale di T, T è diagonalizzabile se e solo se A è diagonalizzabile.


Calcolo di autovalori ed autovettori e diagonalizzazione delle matrici

L'algoritmo

Diamo ora un algoritmo di diagonalizzazione per una matrice quadrata di ordine n.


Passo 1. Trovare il polinomio caratteristico di A.


Passo 2. Trovare le radici del polinomio caratteristico di A, ossia trovarne gli autovalori.


Passo 3. Ripetere 1. e 2. per ogni autovalore λ di A.

  1. Determinare M = A − λI sottraendo λ dalla diagonale di A.
  2. Trovare una base per lo spazio delle soluzioni del sistema omogeneo MX = 0.


Passo 4. Consideriamo la collezione S=\ {v_{1},v_{2},\cdots,v_{n}} di tutti gli autovettori che abbiamo ottenuto nel Passo 3.

  1. Se m\neq n A non è diagonalizzabile.
  2. Se m = n, A è diagonalizzabile. Detta P la matrice le cui colonne sono gli autovettori v_{1},v_{2},\cdots,v_{n}, allora
D=P^{-1}AP=\ \mathrm{diag}(\lambda_{1},\lambda_{2},\cdots,\lambda_{n})

dove λi è l'autovalore corrispondente all'autovettore vi.



Esempio

Applichiamo l'algoritmo di diagonalizzazione espresso ad una matrice A quadrata di ordine n:


A=\ \begin{bmatrix}
4 & 2\\ 3 & -1\end{bmatrix}\ \ .


Calcoliamo il polinomio caratteristico:


\mathrm{tr}(A)=4-1=-3,\ \ \begin{vmatrix}A\end{vmatrix}=-4-6=-10


quindi


\Delta (t)=t^{2}-3t-10=(t-5)(t+2)\ \ .


Le radici λ1 e λ2 sono rispettivamente 5 e − 2 e sono quindi gli autovalori di A.
Troviamo un autovettore v1 di A relativo a λ1 = 5, sottraendo quest'ultimo dalla diagonale di A ottenendo la matrice


M=\ \begin{bmatrix}-1 & 2\\ 3 & -6\end{bmatrix}\ \ .


Gli autovettori relativi a λ1 = 5 formano la soluzione del sistema omogeneo MX = 0:


\begin{bmatrix}-1 & 2\\ 3 & -6\end{bmatrix}\begin{bmatrix}x\\ y\end{bmatrix}=\begin{bmatrix}0\\ 0\end{bmatrix} oppure \left\{\begin{matrix}-x & + & 2y & = & 0\\ 3x & - & 6y & = & 0\end{matrix}\right.\ \ .


Il sistema ha una sola variabile libera. Una soluzione diversa da zero, ad esempio v1 = (2,1), è un autovettore che genera l'autospazio di λ1 = 5.


Troviamo un autovettore v2 di A relativo a λ2 = − 2, sottraendo quest'ultimo dalla diagonale di A ottenendo la matrice


M=\ \begin{bmatrix}6 & 2\\ 3 & 1\end{bmatrix}\ \ .
, ottenendo il sistema omogeneo:
\left\{\begin{matrix}6x & + & 2y & = & 0\\ 3x & + & y & = & 0\end{matrix}\right.\ \ .


Il sistema ha una sola variabile libera. Una soluzione diversa da zero, ad esempio v2 = ( − 1,3), è un autovettore che genera l'autospazio di λ2 = − 2.


Sia P la matrice le cui colonne sono gli autovettori trovati. Allora:


P=\ \begin{bmatrix}2 & -1\\ 1 & 3\end{bmatrix} e quindi P^{-1}=\ \begin{bmatrix}3/7 & 1/7\\ -1/7 & 2/7\end{bmatrix}\ \ .


In definitiva D = P − 1AP è la matrice diagonale i cui elementi sono i rispettivi autovalori:


D=P^{-1}AP=\ \begin{bmatrix}3/7 & 1/7\\ -1/7 & 2/7\end{bmatrix}\begin{bmatrix}4 & 2\\ 3 & -1\end{bmatrix}\begin{bmatrix}2 & -1\\ 1 & 3\end{bmatrix}=\begin{bmatrix}5 & 0\\ 0 & -2\end{bmatrix}


Diagonalizzazione di matrici reali simmetriche

Una generica matrice reale A può non essere diagonalizzabile. Se però A è una matrice simmetrica reale, valgono i seguenti teoremi.


Data una matrice A simmetrica reale, ogni radice λ del suo polinomio caratteristico è reale.


Data una matrice A simmetrica reale, detti u e v degli autovettori non di A, relativi ad autovalori distinti λ1 e λ2, allora u e v soon ortogonali.


A partire da questi due teoremi si arriva al teorema che segue.
Data una matrice A simmetrica reale, esiste una matrice ortogonale P, tale che D = P − 1AP è diagonale.


La matrice ortogonale P si ottiene normalizzando una base di autovettori ortogonali di A. A viene così detta ortogonalmente diagonalizzabile.


L'algoritmo

Esponiamo ora l'algoritmo di diagonalizzazione ortonormale:
Sia A una matrice reale simmetrica.


Passo 1. Trovare il polinomio caratteristico di A.


Passo 2. Trovare gli autovalori di A come radici del polinomio caratteristico.


Passo 3. Per ogni autovalore λ di A, trovare una base ortogonale del sottospazio relativo.


Passo 4. Normalizzare tutti gli autovalori ottenuti al Passo 3, formando quindi una base ortonormale di \mathrm{\mathbf{R^{n}}}.


Passo 5. Sia P la matrice le cui colonne sono gli autovettori nor,alizzati del Passo 4.


Esempio

Data la matrice simmetrica


A=\ \begin{bmatrix}2 & -2\\ -2 & 5\end{bmatrix} ,

troviamo una matrice ortogonale P tale che P − 1AP è diagonale.


Procediamo come segue.
Troviamo il polinomio caratteristico di A:

\mathrm{tr}(A)=2+5=7,\ \ \begin{vmatrix}A\end{vmatrix}=10-4=6,\ \ \Delta (t)=t^{2}-7t+6=(t-6)(t-1)


Quindi λ1 = 6 e λ2 = 1 sono gli autovalori di A.
Sottraendo λ1 = 6 dalla diagonale di A si ha la matrice M=\ \begin{bmatrix}
-4 & -2\\ 
-2 & -1
\end{bmatrix} ed il sistema omogeneo \left\{\begin{matrix}-4x & - & 2y & = & 0\\ -2x & - & y & = & 0\end{matrix}\right. oppure 2x+y\ =\ 0
Una soluzione diversa da zero è u1 = (1, − 2).


Sottraendo λ2 = 1 dalla diagonale di A si ha la matrice

M=\ \begin{bmatrix}
1 & -2\\ 
-2 & 4
\end{bmatrix} ed il sistema omogeneo x-2y\ =\ 0
La seconda equazione è eliminata in quanto multiplo della prima. Una soluzione diversa da zero è u2 = (2,1).


u1 e u2 sono ortogonali. Li normalizziamo e otteniamo i vettori ortonormali:


\widehat{u_{1}}=(1/\sqrt{5},-2/\sqrt{5}) e \widehat{u_{2}}=(2/\sqrt{5},1/\sqrt{5})


Sia infine la matrice P di rispettive colonne u1 e u2, allora:


P=\ \begin{bmatrix}1/\sqrt{5} & 2/\sqrt{5}\\ -2/\sqrt{5} & 1/\sqrt{5}\end{bmatrix} e P^{-1}AP=\ \begin{bmatrix}6 & 0\\ 0 & 1\end{bmatrix}


Gli elementi diagonali di P − 1AP sono gli autovalori corrispondenti alle colonne di P.

Bibliografia

Algebra lineare - Lipschutz, Lipson.

0

Commenti e note

Inserisci un commento

Inserisci un commento

Per inserire commenti è necessario iscriversi ad ElectroYou. Se sei già iscritto, effettua il login.