Cos'è ElectroYou | Login Iscriviti

ElectroYou - la comunità dei professionisti del mondo elettrico

Ricerca personalizzata
14
voti

Un prodotto da (ri)scoprire: Vettori alla matriciana

Indice

Matrici

Tra gli innumerevoli argomenti della matematica le matrici sono sempre state, almeno per me, un po’ ostiche. Fanno parte dell’algebra, il che già le proietta su un terreno un po’ astratto. Però hanno un loro fascino e se uno le pensa come semplici tabelle, cominciano a diventare meno strane. Le tabelle hanno righe e colonne, come è noto. Chi di noi non maneggia fogli Excel? Un foglio Excel è una tabella e, di primo acchito, assimilabile a una matrice; ma come si sa la sua natura va ben oltre le matrici.

Una matrice è una tabella ordinata di elementi.

A volte noi facciamo operazioni su un foglio Excel che possono essere ricondotte ad operazioni su matrici, come quando facciamo i conti della spesa. Se i numeri nella tabella sottostante esprimono i kg di frutta acquistati da 4 persone diverse in un certo giorno; questi numeri posti tra parentesi grandi costituiscono la matrice delle quantità Q, che ha 4 righe e 3 colonne, indicata come (4x3):


\begin{matrix} -
\qquad 
&
\qquad 
& Mele & Pere & Banane\end{matrix}


\begin{matrix} Maria \\ Gino \\Anna \\Piero \end{matrix}
\qquad
\begin{bmatrix} 
\qquad 2 \qquad &  4 & 
\qquad
1 

\quad 
\\ 3 & 1 & 

\quad
2 \\ 1.5 & 0 & 
\quad
3 
\\ 1 & 2 & 
\quad

0.5 
\end{bmatrix}

Matrice Q

Mentre posso avere un’altra matrice, P, quella dei prezzi in € al kg, che ha 3 righe e 1 colonna, ossia (3x1)


\begin{matrix} -
\qquad 
&
\qquad 
& Eur/kg\end{matrix}


\begin{matrix} Mele\\ Pere\\Banane\end{matrix}

\qquad
\begin{bmatrix} 
\quad 1.80 
\quad 
\\ 2.25 \\ 0.99 \end{bmatrix}

Matrîce P


Prodotto matriciano

Se voglio sapere quanto ognuno spende in un certo giorno per la frutta, prendo le quantità di ogni frutto e le moltiplico per i prezzi al kg; ottengo così la matrice T che ha 4 righe e 1 colonna e che contiene il costo totale della frutta per ogni persona:

\begin{matrix} -
\qquad 
&
\quad 
& SpesaTot\end{matrix}


\begin{matrix} Maria \\ Gino \\Anna \\Piero \end{matrix}

\qquad
\begin{bmatrix} 
\ 13.59 
\quad
\\ \quad 9.63 
\quad
 \\ 
\quad 
5.67 
\quad
\\ \quad 
6.79 
\quad
\end{bmatrix}

Matrîce T

La matrice T Spesa totale (SpesaTot) è il prodotto delle due matrici Q e P, cioè T = QP. La matrice T è una matrice di (4x1), quindi ha 4 elementi in tutto.

Il primo elemento (13.59) è ottenuto sommando i 4 prodotti parziali per la prima riga, ossia

- 1° elemento della prima riga per 1° elemento della prima colonna

- + 2° elemento della prima riga per 2° elemento della prima colonna

- + 3° elemento della prima riga per 3° elemento della prima colonna.

Il secondo elemento (9.63) è ottenuto sommando i 3 prodotti parziali per la seconda riga, ossia

- 1° elemento della seconda riga per 1° elemento della prima colonna

- + 2° elemento della seconda riga per 2° elemento della prima colonna

- + 3° elemento della seconda riga per 3° elemento della prima colonna.

E così via per gli altri due elementi.

Alla fine la matrice prodotto T avrà 4 righe e 1 colonna



\begin{bmatrix} 
\quad 2 \quad &  4 & 
\quad
1 

\quad 
\\ 3 & 1 & 

\quad
2 \\ 1.5 & 0 & 
\quad
3 
\\ 1 & 2 & 
\quad

0.5 
\end{bmatrix}
x 

\begin{bmatrix} 1.80 
\\ 2.25 
\\ 0.99  
\end{bmatrix}
= 

\begin{bmatrix} 
13.59 
\\  9.63  \\ 
 
5.67 
\\ 
 
6.79 
\end{bmatrix}

Esaminiamo il caso di acquisti di due giorni, in cui le quantità rimangono le stesse, ma i prezzi variano dal giorno 1 al giorno 2:


\begin{matrix} -
\qquad 
&
\qquad 
& Eur/kg/1 & 
Eur/kg/2
\end{matrix}


\begin{matrix} Mele\\ Pere\\Banane\end{matrix}

\qquad
\begin{bmatrix} 
\quad 1.80 & \qquad 1.70 \quad 
\\ 
\quad 2.25 & 
\quad
2.00 \\ 
\quad
0.99 & 
\quad
1.20\end{bmatrix}

Matrîce P

La matrice P ha sempre 3 righe, ma ora ha 2 colonne, una per ogni giorno. Il prodotto delle due matrici QP comporterà non una sola serie di 4 somme, ciascuna di 3 prodotti parziali, ma 2 serie di 4 somme, ciascuna di 3 prodotti parziali, una per ogni giorno. Ne risulta la matrice T = QP di 4 righe e 2 colonne. ossia:



\begin{bmatrix} 
\quad 2 \quad &  4 & 
\quad
1 

\quad 
\\ 3 & 1 & 

\quad
2 \\ 1.5 & 0 & 
\quad
3 
\\ 1 & 2 & 
\quad

0.5 
\end{bmatrix} x 

\begin{bmatrix} 1.80 & 1.70
\\ 2.25 & 2.00
\\ 0.99 & 1.20
\end{bmatrix}
= 

\begin{bmatrix} 
13.59 & 12,60
\\  9.63  & 9.50\\ 
 
5.67 & 6.15
\\ 
 
6.79 & 6.30
\end{bmatrix}

Q             P             T = QP.

Il discorso si può estendere a matrici diverse. Le quali per poter essere moltiplicate devono soddisfare un’unica condizione: il numero delle colonne della prima deve essere uguale al numero di righe della seconda. Se la prima ha k righe e n colonne (kxn), la seconda dovrà avere n righe e m colonne (nxm). Il loro prodotto sarà una matrice (kxm).

Occorre notare che il prodotto di matrici non è commutativo, ossia ABBA

În generale una matrîce è defînîta come în fîgura.

Gli elementi di una matrice vengono in genere indicati con una coppia di indici e pedici, dove il primo pedice indica la riga e il secondo pedice la colonna.

Le operazioni più elementari che si fanno su una matrice sono:

- Il prodotto per uno scalare: moltiplicare uno scalare per una matrice equivale a formare un’altra matrice i cui elementi sono tutti quelli della matrice di partenza moltiplicati per quello scalare.

- La somma di due matrici (delle stesse dimensioni): ne risulta una matrice delle stesse dimensioni in cui ciascun elemento è la somma dei due elementi corrispondenti.

L’operazione “prodotto di due matrici” come l’abbiamo esemplificato prima, si presta a un’interessante interpretazione geometrica: quella vettoriale.

Interpretazîone vettoriale

Ora parlerò un po’ di matematica ma senza il rigore dovuto. Non me ne vogliano i puristi. Il mio scopo non è scrivere un trattato di matematica ma solo esemplificare alcune simpatiche corrispondenze tra rappresentazioni diverse di problemi. Chiedo scusa anche per avere scritto cose che ai più appariranno troppo elementari; ma in questo io sono "anglosassone": la chiarezza non è mai troppa!

Quando si riesce a visualizzare un problema tramite un grafico (che può essere un disegno, un diagramma, una mappa), in generale la nostra comprensione aumenta, esce dalla confusione e diventa assai più chiara. In certi casi, addirittura, senza un ausilio visivo la comprensione è estremamente difficoltosa.

L’ausilio visivo si basa sulla possibilità di stabilire una corrispondenza biunivoca tra un elemento del nostro problema e un elemento grafico, in modo che quest’ultimo diventi una rappresentazione del problema, o meglio di un suo modello.

Un elemento grafico di origine fisica molto usato è il vettore, che è un “segmento orientato” e viene rappresentato con una freccia alla cui lunghezza è associata una “grandezza” (in inglese “magnitude”) o “modulo”, espressa da un numero (uno “scalare”). Altre caratteristiche del vettore sono la direzione (cioè la retta di cui fa parte) e il verso (l’orientamento della freccia verso una delle due estremità della retta). Essendo una freccia, ha la punta e la coda.

Per illustrare quanto segue mi sono servito di un sito molto interessante: 3Blue1Brown, che “is a channel about animating math” e contiene tra l’altro una serie di videolezioni intitolate Essence of linear algebra.

Un vettore può rappresentare una qualsiasi grandezza fisica che preveda anche una direzione e un verso, come una forza o una velocità; oppure può rappresentare una lista omogenea di numeri associata a delle quantità, ad esempio una lista di prezzi.

La definizione dell’orientamento richiede un sistema di riferimento e quello cartesiano è il più usato. Se giace su un piano cartesiano xy, con la coda nell’origine, il vettore è completamente individuato dalle coordinate della punta x1 e y1, che vengono convenzionalmente scritte in forma di matrice con due righe e una colonna \begin{bmatrix} x_1\\ y_1 \end{bmatrix}; si distinguono così dalle coordinate di un punto (x1, y1). Per lo spazio a 3 dimensioni naturalmente le coordinate saranno 3 e cioè \begin{bmatrix} x_1\\ y_1\\ z_1 \end{bmatrix}. In generale per ogni dimensione spaziale si avrà una coordinata e quindi una riga della matrice (ma sempre una sola colonna).

Noi ci concentriamo qui solo su vettori che hanno la coda nell’origine.

La forma di matrice per i vettori è usata anche in informatica, dove un vettore rappresenta una lista di numeri memorizzati in un registro di memoria, tenuti insieme perché uniti da un qualche legame concettuale.

Le più semplici operazioni sui vettori sono il prodotto per uno scalare e la somma vettoriale. Lo scalare moltiplica ciascuna delle coordinate e dà luogo a un vettore che ha la stessa direzione e lo stesso verso ma è “più grande” se lo scalare è >1 o “più piccolo” se lo scalare è <1. Se lo scalare è negativo, il vettore ha la stessa direzione, verso opposto ed è “più grande”; se lo scalare è > -1 o “più piccolo” se lo scalare è < -1.

La somma vettoriale di due vettori dà luogo a un terzo vettore le cui coordinate sono ottenute sommando le rispettive coordinate dei due vettori di partenza (addendi). Lo stesso vale se i vettori sommati sono più di due.

Un vettore può “giacere” su un piano, cioè avere 2 “dimensioni”, ma può anche stare su una retta e avere quindi 1 dimensione, o può trovarsi in uno spazio a 3 o più dimensioni. Ogni coordinata rappresenta una dimensione. Una “dimensione”, in soldoni, è una caratteristica indipendente dalle altre; quelle più note sono quelle spaziali: altezza, larghezza, profondità.

Per gli scalari (ossia i numeri) si usa l’unità (ossia il numero “1”) come parte della “base” della loro rappresentazione, che nel sistema decimale è l'insieme delle potenze intere di 10: in inglese “scaling” significa aumentare o diminuire una dimensione, moltiplicandola per un numero rispettivamente maggiore o minore di 1. In italiano si usa il termine "scala" per la proporzione numerica tra disegno e oggetto reale.

Niente impedisce di pensare gli scalari anche come vettori a 1 dimensione che possiamo rappresentare su una retta “orientata”, in cui un punto rappresenta lo “0” o “origine” e un segmento designato rappresenta l’unità; questo segmento può anche il vettore unitario, che fa parte della “base” della rappresentazione.


Combinazione lineare

Nella rappresentazione sul piano cartesiano xy spesso serve indicare anche una unità di misura su ognuno dei due assi, ed è appunto l'unità di misura che viene indicata a parte, allo stesso modo in cui nelle carte geografiche si indica la "scala", sia con un rapporto 1 cm: tot cm sia con un piccolo segmento che dà la corrispondenza con tot metri o km. Nel piano cartesiano si riportano delle "tacche" su ognuno dei due assi con i numeri che indicano la misura. Nelle figure soprastanti si vedono infatti le tacche negli assi. Nel linguaggio dei vettori, l'unità di misura fa parte della base della rappresentazione. Se il vettore giace su una retta, la base è costituita da un solo vettore unitario, detto versore. Se il vettore giace nel piano, le unità di misura quindi saranno due, una per ogni asse asse, ossia avremo 2 versori, mentre per lo spazio a 3 dimensioni avremo 3 versori e in uno spazio (astratto) a più dimensioni, avremo un versore per ogni dimensione.

Per definizione ogni versore ha modulo 1 e quindi le sue coordinate (x,y) saranno rispettivamente (1,0) per il versore dell'asse x, indicato spesso con î, e (0,1) per il versore dell'asse y, indicato spesso con ĵ. I due versori costituiscono dunque la base della rappresentazione vettoriale. In questo modo ogni vettore viene rappresentato come una somma (vettoriale) dei due versori, ognuno moltiplicato per uno scalare, somma “pesata” che si chiama “combinazione lineare”. Il concetto di combinazione lineare si applica non solo ai versori ma anche a vettori qualsiasi, purché appartengano allo stesso “spazio vettoriale”, un insieme che gode di certe proprietà ben definite.

Una combinazione lineare dei suddetti vettori è il vettore v individuato dalla seguente espressione:

v = a1v1 + a2v2 + … +anvn

dove a1 ….an sono scalari, che possono essere scelti ad arbitrio e sono detti coefficienti della combinazione lineare, mentre v1….vn sono vettori appartenenti allo spazio vettoriale (che evito di definire, lasciandolo all'intuizione...).

Un uso spesso quotidiano della combinazione lineare lo facciamo tutti (senza pensare che è una combinazione lineare) quando scriviamo un numero nel sistema decimale. Ad esempio, poichè scrivendo il numero 742 è come scrivere

742 = 2
\cdot10^0 + 4
\cdot10^1 + 7 
\cdot10^2

che è una combinazione lineare. Quindi si può pensare questo numero come un vettore in uno spazio a 3 dimensioni, che sono le unità, le decine e le centinaia e dove il "versore" è la potenza di 10. Per ogni cifra di un qualsiasi numero si ha una cifra: un numero a 5 cifre sarà rappresentatoda un vettore in uno spazio a 5 dimensioni (unità, decine, centinaia, migliaia, decimigliaia) e così via. Abbiamo detto sopra che il versore ha modulo unitario mentre qui ci sono le potenze di 10; ma le potenze di 10 formano una base. Ciò significa che ogni potenza ha un significato unitario e infatti viene moltiplicata per un coefficiente. Noi chiamiamo "numero" l'insieme di questi coefficienti e sottintendiamo il significato della loro posizione, la quale rappresenta la potenza di 10, da destra verso sinistra.

Il concetto di combinazione lineare assume particolare importanza quando i vettori v1….vn sono tra loro indipendenti, ossia quando nessuno di essi può essere espresso come combinazione lineare degli altri. Ciò accade se quei vettori sono ortogonali. Quindi in generale ortogonalità = indipendenza.

Ma l’indipendenza può essere definita convenzionalmente anche se i due versori formano un angolo diverso da 90° e la griglia che ne risulta non sarà di quadrati ma di parallelogrammi.

Trasformazione lineare

Con questa convenzione si può operare una “trasformazione lineare” su qualsiasi entità geometrica rappresentata nel sistema cartesiano, cioè una trasformazione che non sposta l’origine degli assi e che mantiene tutte le proporzioni; ne segue che, ad esempio, le rette rimangono sempre rette anche dopo la trasformazione.

Una trasformazione lineare applicata ai versori della base fa cambiare la base stessa, ossia il sistema di riferimento, perché produce 2 nuovi versori “trasformati”, che il sito da cui ho tratto le figure chiama “transformed i” e “transformed j”, mentre io qui li indico con Î e Ĵ. Bisogna fare una precisazione: quando si parla di “cambiamento di base” si intende in generale un cambiamento di sistema di riferimento in cui le entità geometriche rimangono invariate. Nel caso in esame non è così: la trasformazione lineare di cui ci occupiamo cambia la base ma non le coordinate. Ne segue che l’entità geometrica cambia, e cambia in senso lineare, come detto sopra.

Ad esempio il vettore v = -1î + 2ĵ non sarà più lo stesso se lo trasportiamo nella nuova base Î e Ĵ senza cambiargli le componenti, cioè i coefficienti della combinazione lineare.

I versori di partenza sono rappresentati con le due matrici (2x1): î = \begin{bmatrix} 1\\ 0 \end{bmatrix} e ĵ = \begin{bmatrix} 0\\ 1 \end{bmatrix}. Il vettore v si può scrivere come v = -1 \begin{bmatrix} 1\\ 0 \end{bmatrix} +2 \begin{bmatrix} 0\\ 1 \end{bmatrix}

I due nuovi versori vengono rappresentati, rispetto al sistema di riferimento di partenza, con due nuove matrici (2x1) ossia Î = \begin{bmatrix} 1\\-2 \end{bmatrix} e Ĵ = \begin{bmatrix} 3\\ 0 \end{bmatrix}. Questi due nuovi versori sono la nuova base e giacciono su due assi che non formano più un angolo di 90°. Per convenzione possiamo chiamarli ancora ortogonali, perché li consideriamo indipendenti, come i versori î e ĵ del sistema di riferimento di partenza. Dobbiamo notare che i due nuovi versori hanno modulo unitario nel nuovo sistema da essi definito, mentre hanno modulo non unitario nel sistema di riferimento di partenza; un po’ come quando si passa da una valuta a un’altra.

Quindi il vettore v di partenza diventa, come si vede in figura, v =\begin{bmatrix} 5\\ 2 \end{bmatrix} se lo esprimiamo nella vecchia base. Se invece lo esprimiamo nella nuova base rimane \begin{bmatrix} -1\\ 2 \end{bmatrix} ossia v = -Î + 2Ĵ perché i versori sono per definizioni unitari. Si può osservare che la trasformazione ha prodotto nei due nuovi versori è sia una rotazione sia un cambiamento di angolo (di fase), generando una griglia a parallelogrammi invece che a quadrati.

La trasformazione lineare quindi è una funzione che trasforma un vettore in un altro vettore, mantenendo le proporzioni, ma si può interpretare come una trasformazione dello spazio, che viene dilatato o compresso, ruotato o reso “a forbice” (asimmetrizzato).

Se ora rappresentiamo il vettore di partenza v in forma matriciale \begin{bmatrix} -1\\ 2 \end{bmatrix} potremmo usare la notazione più compatta: \begin{bmatrix}1 & 3 \\ -2 & 0 \end{bmatrix} x \begin{bmatrix} -1 \\ 2   \end{bmatrix} = \begin{bmatrix} 5 \\  2  \end{bmatrix}

Essa corrisponde al prodotto delle due matrici, quella (2x2) che unisce i due nuovi versori e quella (2x1) del vettore di partenza.

Più in generale, per trasformare un vettore u = \begin{bmatrix} x\\ y \end{bmatrix} in un vettore w = \begin{bmatrix} p\\ q \end{bmatrix} occorre

\begin{bmatrix}a & b \\ c & d \end{bmatrix} x \begin{bmatrix} x \\ y   \end{bmatrix} = \begin{bmatrix} p \\  q  \end{bmatrix} Dove p = ax + by e q = cx + dy.

L'intuizione aiuta

Tornando alle matrici, la figura mostra come si ottiene il prodotto di due matrici particolari, la prima \begin{bmatrix} a \   b\\ c\ d \end{bmatrix} di (2x2) e la seconda (che è un vettore generico u = \begin{bmatrix} x\\ y \end{bmatrix} di (2x1) .

La parte centrale è intuitiva, mentre la sua uguaglianza con la parte di sinistra non lo è. La parte centrale ci dice che il vettore \begin{bmatrix} x\\ y \end{bmatrix} , che prima era espresso dalla combinazione lineare u = xî + yĵ, ora viene espresso da w = xÎ + yĴ. Poiché i 2 nuovi versori hanno coordinate \begin{bmatrix} a\\ c \end{bmatrix} e \begin{bmatrix} b\\ d \end{bmatrix} ecco che nasce l’espressione al centro della figura.


Adesso una nota "di servizio". Rendendomi conto che infarcire questo testo di vettori in forma di matrice risulta graficamente un po' pesante (anche per chi scrive) da adesso in avanti userò per le matrici un notazione lineare simile a quella di Excel che per una matrice M (3*2), scrive M = [a\b, c\d, e\f], dove "a" e "b" sono gli elementi della prima riga, "c" e "d" sono gli elementi della seconda riga, "e" e "f" sono gli elementi della seconda riga.

Ma io ometterò il carattere "\" sostituendolo con uno spazio.

I versori di partenza, ad esempio, vengono scritti quindi î = [1, 0] e ĵ = [0, 1] mentre la matrice di trasformazione lineare in 2 dimensioni sarà [a b, c d]

Come abbiamo detto, il vettore [x, y] non è più lo stesso, anche se le coordinatexe y della combinazione lineare sono le stesse, perché la base è cambiata. Per ottenere il vettore trasformato, espresso di nuovo nella “vecchia” base î - ĵ, dobbiamo solo eseguire le operazioni elementare sulle 2 matrici dell’espressione di centro nella figura.

Le due uguaglianze soprastanti definiscono il prodotto delle due matrici di sinistra e il loro significato vettoriale: ciò che risulta è un vettore sempre in 2 dimensioni le cui componenti (le coordinate nelle vecchia base) sono il risultato delle due somme indicate.

Per orientarsi meglio è utile tenere presente che [a c] è la trasformazione lineare del versore î nel versore Î e [b d] è la trasformazione lineare del versore ĵ nel versore Ĵ. In questo modo dovrebbe risultare chiaro che la trasformazione lineare espressa dalla matrice [a b, c d], quando applicata a un vettore generico [x, y], trasforma questo vettore in un altro vettore di coordinate [ax+by, cx+dy]. Queste coordinate sono espresse nel sistema di riferimento di partenza, quello che ha la base î = [1, 0] e ĵ = [0, 1]. Al tempo stesso, il nuovo vettore, risultato della trasformazione [a b, c d], si può interpretare come un vettore di coordinate “vecchie” [x, y] nel nuovo sistema di riferimento che ha base Î-Ĵ.

Riassumendo, si può notare la dualità: il vettore risultato della trasformazione lineare può essere interpretato in due modi:

1. Vettore di coordinate [x, y] nella base I-Ĵ che forma quindi un nuovo sistema di riferimento. Questa nuova base ha coordinate rispettivamente Î = [a, c] e Ĵ = [b, d] nel vecchio sistema di riferimento.

2. Vettore di coordinate [ax+by, cx+dy] nella base î-ĵ del sistema di riferimento iniziale. Questa “vecchia” base ha coordinate rispettivamente [1, 0] e [0, 1].

In pratica, moltiplicare una matrice per un vettore (che è a sua volta una matrice di una sola colonna) significa operare una trasformazione lineare sui versori della base per esprimere il vettore nella sua “nuova” base oppure operare una trasformazione lineare sulle coordinate del vettore, generando quindi un nuovo vettore.

D’ora in poi continueremo il discorso attenendoci a questa seconda interpretazione, in cui tutto viene rappresentato nel sistema di riferimento di partenza î-ĵ .

Tutto questo può apparire un po’ complicato ma se ci si familiarizza un po’ vi assicuro che la comprensione delle operazioni con le matrici si chiarisce non poco.

Trasformazioni fondamentali

Esaminiamo ora alcune trasformazioni lineari fondamentali da applicare sui vettori, limitandoci allo spazio a 2 dimensioni, cioè il piano..

La prima è la trasformazione unitaria ed è quella che lascia il vettore inalterato, in modo simile a quanto avviene ai numeri quando li moltiplichiamo per 1.

Nel piano, la trasformazione unitaria , detta anche “matrice identità”, è I = [1 0, 0 1] perché applicandola a un vettore [x, y] con la formula della figura soprastante si ottiene ancora [x, y]. Detto nell’altro modo, i nuovi versori diventano uguali a quelli vecchi, cioè [1, 0] e [0, 1]. Nello spazio a 3 dimensioni si ha I = [1 0 0, 0 1 0, 1 0 0].

Una seconda trasformazione è la rotazione. Ad esempio la rotazione di 90° antioraria, applicata al vettore giallo [x, y] è espressa dalla matrice [0 1, -1 0].

Infatti il versore î (verde in figura) è diventato Î di coordinate [0, 1] e il versore ĵ (rosso) è diventato Ĵ di coordinate [-1 , 0]: cioè la base ha ruotato di 90° in senso antiorario.

Una terza trasformazione è la forbice (Shear), che cioè produce versori (e assi) a “forbice”; nella figura si vede una forbice a 45°, in cui cioè il versore ĵ è finito su Ĵ di coordinate [1, 1]; si vede come ha acquisito il modulo √2 che diventa così la nuova “unità” per la 2a dimensione, quella inclinata.

Prodotto come Composizione

Ammettiamo ora di voler applicare sul vettore [x, y] una trasformazione che generi i nuovi versori indicati in figura. Le loro coordinate sono ben visibili dalla figura e possiamo riportarle nella matrice indicata

Si vede che la trasformazione indicata può pensarsi come rotazione antioraria di 90° dei 2 versori, seguita da un’inclinazione a 45° (con relativo incremento di √2 del modulo) del versore verde (ex ĵ), tutto compattato nella matrice della figura.

Notare che i versori î, ĵ sono ruotati di 90° in senso antiorario. Segue la trasformazione a forbice (shear):

La composizione viene chiamata “prodotto” fra la matrice Shear e la matrice Rotation. Ciò corrisponde ad eseguire prima la Rotation e dopo, sul vettore risultante, la Shear.

Se applichiamo prima la Rotation al vettore [x, y], ossia moltiplichiamo la matrice Rotation per il vettore [x, y], otterremo un vettore uguale ma ruotato di 90°. Se a questo vettore applichiamo la Shear otteniamo il vettore trasformato

Si tratta di muoversi da destra a sinistra, proprio come quando si fa una composizione di funzioni f(g(x)), in cui si parte dalla g(x) e poi si opera sulla f(g).

Anche qui la cosa si può visualizzare con la trasformazione Shear sui due vettori [0, 1] e [-1, 0] della matrice Rotation, che a loro volta si possono pensare generati dalla rotazione antioraria di 90° dei versori î e ĵ (vista più sopra).

Quindi avremo:

[1 0, 1 1] [0, 1] che, partendo dalla matrice di destra, dà 0[1, 0] + 1[1, 1] = [1, 1]

[1 0, 1 1] [-1, 0] che, partendo dalla matrice di destra, dà -1[1, 0] + 0[1, 1] = [-1, 0].

La composizione che abbiamo rappresentato sopra non è altro che un prodotto di due matrici, in questo caso quadrate. Quindi applicare prima una trasformazione (espressa dalla matrice M1Rotation”) e poi un’altra (espressa da M2 “Shear”) corrisponde a fare il prodotto M2M1 = Composition; notare che bisogna procedere da destra verso sinistra. Che è diverso dal prodotto M1M2: ci se ne può convincere facilmente per via grafica.

Matrice come insieme di vettori

Una matrice può anche essere vista come l’insieme di più vettori, ognuno rappresentato da una colonna della matrice stessa. Ad esempio nel prodotto M2M1 si può pensare che M2 (=[1 1, 0 1]) sia la trasformazione lineare applicata ai due vettori che compongono la matrice M1 [0 -1, 1 0], cioè [0 1] e [-1 0]. Il risultato sarà l’insieme dei due vettori [1 1] e [-1 0], ossia la matrice “Composition” = [1 -1, 1 0]. In altre parole il prodotto di due matrici A1A2 si può scomporre in tanti prodotti della prima matrice per ogni vettore che compone la seconda matrice. Ogni prodotto matrice*vettore diventa una colonna della matrice risultato. In questo modo il prodotto matrice*vettore viene esteso al prodotto tra due matrici qualsiasi A e B, che devono però rispettare la condizione A(mxn), B(nxp) altrimenti la moltiplicazione non è possibile.

Se le 2 colonne della trasformazione sono linearmente dipendenti, significa che i due versori î, ĵ non sono più ortogonali e non possono più rappresentare un piano. Ne segue che le due dimensioni collassano su una sola, ossia il piano diventa una retta e qualsiasi vettore del piano finisce sulla retta. Il legame tra matrici e dimensioni è fondamentale. Come abbiamo già visto ogni riga della matrice rappresenta una dimensioneo dello spazio vettoriale. Nella figura le due colonne non sono linearmente indipendenti perché la seconda altro non è che la prima moltiplicata per -1.

Prodotto scalare

Abbiamo visto che la trasformazione lineare, espressa con una matrice [a b, c d] e applicata al vettore [x, y], si attua con 2 combinazioni lineari ax +cy e bx + dy.

Ma qualcuno potrebbe notare che queste 2 combinazioni lineari possono interpretarsi come 2 prodotti scalari (“dot products”), il primo tra i vettori [a, c] e [x, y], e il secondo tra i vettori [b, d] e [,x y].

Per esempio, il prodotto scalare tra i vettori [1, 2] e [3, 4] è:

Dal punto di vista geometrico però, fare il prodotto scalare corrisponde a proiettare il primo vettore sul secondo, moltiplicando questa proiezione per il modulo del secondo vettore. Ne risulta un numero. Lo stesso numero si ottiene anche scambiando i due vettori e facendo le stesse operazioni. Ossia il prodotto scalare è commutativo (ricordiamo che invece il prodotto tra matrici non lo è). Vediamo in figura il prodotto scalare tra [4 1].[2 -1]

Una conseguenza di ciò è che se i due vettori sono ortogonali, il loro prodotto scalare è = 0. Ad esempio [4 1].[2 -8] = 0

Lo stesso risultato del prodotto scalare si ottiene considerando il primo vettore come una trasformazione lineare applicata sul secondo [4 1] [2, -1]. Questa operazione conduce a trasformare il vettore [2, -1], che è a 2 dimensioni, nel vettore [7], che è a una dimensione, ossia giace sulla “retta orientata”.

Questo si spiega facilmente pensando che, nella matrice associata a una trasformazione lineare, ogni colonna rappresenta “dove il versore corrispondente va a finire” (e anche quanto si ingrandisce o si rimpicciolisce). Se questa matrice ha una sola riga, significa che ogni versore viene sbattuto su una sola retta (la retta orientata) cioè su una sola dimensione.

Nella figura sottostante vediamo che il vettore [4, 1] può diventare la matrice di una trasformazione lineare che trasforma il versore î nel versore trasformato [4] e il versore ĵ nel versore trasformato [1].

D’altra parte, sappiamo anche che quando scomponiamo un vettore nelle sue componenti, noi proiettiamo il vettore negli assi, ossia facciamo il prodotto scalare tra il vettore e ogni asse implicato (ogni dimensione del vettore). Viceversa esprimiamo il vettore come combinazione lineare della sua componenti moltiplicate ciascuna per il proprio versore.

Troviamo quindi una “dualità” tra prodotto scalare e prodotto matriciale, il che può essere sorprendente.

Siamo di nuovo ... alla frutta!

Come esempio di prodotto di matrici siamo partiti del calcolo dei costi della frutta comprata da 4 persone: Maria, Gino, Anna, Piero.


Poiché un vettore è un ente matematico astratto, per noi può rappresentare qualsiasi cosa. Qui possiamo considerare il vettore “prezzi unitari” P = [1.80, 2.25, 0.99]. Abbiamo poi la matrice di trasformazione Q = [2 4 1, 3 1 2, 1.5 0 3, 1 2 0.5] che si trova in uno spazio a 4 dimensioni, una per ogni persona. Otterremo quindi come risultato del prodotto un nuovo vettore T in uno spazio a 4 dimensioni, dove ogni componente rappresenta la spesa totale di ognuna delle 4 persone.

Peraltro, seguendo il principio di dualità visto sopra, potremmo anche considerare le righe della matrice Q come 4 vettori, ognuno di 3 componenti nello spazio tridimensionale delle quantità (mele, pere, banane) Q = [2, 4, 1] + [3, 1, 2] + [1.5, 0, 3] + [1, 2, 0.5], mentre il vettore P rimane invariato. Sovrapponendo gli spazi, quello delle quantità e quello di prezzi unitari, il prezzo totale per persona si può ricavare anche tramite il prodotto scalare dei vettori che si corrispondono. Ossia, ogni vettore quantità (ce n’è uno per ogni persona) viene proiettato sul vettore prezzi unitari e poi moltiplicato, il che corrisponde a eseguire la somma di 3 doppi prodotti

Maria 2x1.80 + 4x2.25 + 1x0.99 = 13.59

Gino 3x1.80 + 1x2.25 + 2x0.99 = 9.63

Anna 1.5x1.80 + 0x2.25 + 3x0.99 = 5.67

Piero 1x1.80 + 2x2,25 + 0,5x0.99 = 6.79

Si ottiene un vettore T spesa totale generale, ripartito tra le 4 persone, cioè un vettore le cui componenti nello spazio 4 dimensioni rappresentano la spesa totale di ciascuno. T = [13.59, 9.63, 5.67, 6.79]

Conclusione

Altri aspetti che riguardano le matrici e le trasformazioni lineari sono trattate nel sito e sarebbe troppo lungo riportarle qui, dove mi sono concentrato sul prodotto di matrici e la sua interpretazione vettoriale. Certo, limitare le matrici ai conti della spesa può apparire riduttivo e qualcuno potrebbe dire: ma perché tutta questa complicazione per fare due conti della spesa? Effettivamente avrebbe ragione. Però consideriamo il caso in cui i prodotti invece che 3 siano 5000 e le persone coinvolte magari un centinaio. Certo in Excel si possono facilmente copiare le formule con riferimenti misti. Ma volete mettere l’eleganza di una formula con prodotto di matrici?

7

Commenti e note

Inserisci un commento

di ,

Grazie. Va bene, tornerò sull'argomento per illustrare qualche altro aspetto: Ma non so dire quando...

Rispondi

di ,

Mi complimento con l'Autore, cui faccio la mia preghiera di approfondire il tema "matrici" con nuovi articoli.

Rispondi

di ,

Vedo che questo articolo ha ricevuto un numero abbastanza alto di visualizzazioni, nonostante l'argomento un po' ostico (salvo che per gli studenti di ingegneria, fisica o matematica). Sarei curioso di sapere quanto il contenuto è chiaro, o dove non è chiaro (l'unico che me l'ha detto, ma in privato, è stato Waltermwp, molto simpaticamente).

Rispondi

di ,

Eh, ma proprio perchè si tratta di matriciana, meglio accompagnarla con un po' di frutta, no? :-)

Rispondi

di ,

Bell'articolo, solo un piccolissimo appunto: visto che si trattava di "vettori alla matriciana", al posto di pere, mele e banane ci avrei messo guanciale, pomodori e spaghetti...

Rispondi

di ,

Questo prodotto scalare dot fra vettori mi fa impazzire. Per calcolare un prodotto scalare come prodotto dei moduli x il coseno dell'angolo chissà quanti calcoli farei, invece basta moltiplicare le componenti parallele e sommare.. ancora non ci credo.

Rispondi

di ,

Articolo interessante, che ha avuto il merito di "spolverare" ricordi di studi passati.

Rispondi

Inserisci un commento

Per inserire commenti è necessario iscriversi ad ElectroYou. Se sei già iscritto, effettua il login.