Mátrix (matematika)

A Wikipédiából, a szabad enciklopédiából

A mátrix a matematikában mennyiségek téglalap alakú elrendezése (táblázata) (számoké, függvényeké, kifejezéseké, vagy egyéb elemeké, esetleg más mátrixoké; általánosan valamilyen gyűrű vagy vektortér elemeié).

A mátrixokra hasonló kalkulus („algebra”) építhető fel, mint az elemeikre, amelynek rendkívül sokféle alkalmazása lehetséges. Ennek tanulmányozása a lineáris algebra feladata. Mátrixokat szoktak használni lineáris egyenletek és lineáris, valamint bilineáris transzformációk leírására. A mátrixok - a lineáris algebra (egyik) leghasznosabb fogalmaként - a matematikának a gyakorlatban legtöbbször alkalmazott eszközei között vannak, a matematika számos más ága mellett pedig a fizikától és komputergrafikától kezdve a biológián át egészen a nyelvészetig, számtalan tudományágban használhatóak akár az elméleti leírás tömör megfogalmazására, akár a számítások megkönnyítésére vagy automatizálására.

A mátrix egyik kedvenc szava a sci-fi íróknak is [mj 1]; azonban ezen használati módok legtöbbször még lazán sem kapcsolódnak a matematikai fogalomhoz.

Definíciók és jelölések[szerkesztés | forrásszöveg szerkesztése]

A mátrix vízszintes vonalban elhelyezkedő elemei sorokat, függőleges vonalban elhelyezkedő elemei oszlopokat alkotnak. Egy m sorból és n oszlopból álló mátrixot m-szer n mátrixnak neveznek (írva: m×n), az m és n pozitív egész számok a mátrix dimenziói. A mátrix dimenzióit mindig először a sorok számával, majd azt követően az oszlopok számával adják meg. Az A mátrix jelölése:


  A=
  \begin{bmatrix}
a_{11}&a_{12}&a_{13}&\dots&a_{1n}\\
a_{21}&a_{22}&a_{23}& &a_{2n}\\
a_{31}&a_{32}&a_{33}&\dots&a_{3n}\\
\vdots& &\vdots&\ddots&\vdots\\
a_{m1}&a_{m2}&a_{m3}&\dots&a_{mn}
\end{bmatrix}\mbox{ vagy }
  \begin{pmatrix}
a_{11}&a_{12}&a_{13}&\dots&a_{1n}\\
a_{21}&a_{22}&a_{23}& &a_{2n}\\
a_{31}&a_{32}&a_{33}&\dots&a_{3n}\\
\vdots& &\vdots&\ddots&\vdots\\
a_{m1}&a_{m2}&a_{m3}&\dots&a_{mn}
\end{pmatrix}

A mátrixnak az i-edik sorában és j-edik oszlopában lévő elemét a mátrix i,j-edik elemének nevezik, jelölése Ai,j vagy A[i,j]. Mindig először a sorszám, majd az oszlopszám szerepel.

Az m × n méretű mátrixot gyakran így jelölik: A:=(a_{i,j})_{m \times n}, a mátrix minden A[i,j] elemét ai,j-vel jelölik, ahol 1 ≤ im és 1 ≤ jn. Konvenció, hogy a mátrixokat nagybetűvel, a mátrix elemeit pedig kisbetűvel jelölik. Szokás szerint a mátrix sorainak és oszlopainak számozása 1-gyel kezdődik – noha vannak számítógépes programok, melyek 0-val kezdenek. A legtöbb programozási nyelv szintén nullától indexel. Azokat a mátrixokat, melyek egyik dimenziója 1, vektornak szokták nevezni. A sorvektornak csak egy sora van:


  \begin{bmatrix}
    a_{1} & a_{2} & \dots & a_{n}
  \end{bmatrix}
,

az oszlopvektornak pedig egyetlen oszlopa:


  \begin{bmatrix}
    a_{1} \\
    a_{2} \\
    .     \\
    .     \\
    .     \\
    a_{m}
  \end{bmatrix}

Az 1×1-es mátrixot skalárnak hívjuk.

Tisztán matematikai igényű definíció[szerkesztés | forrásszöveg szerkesztése]

Ha  \mathcal{T} gyűrű (általában kommutatív gyűrű vagy test), akkor az m × n-es mátrixok  \mathcal{T}^{m \times n} halmazán a

A:\{1,2,...,m\}\times\{1,2,...,n\}\longrightarrow \mathcal{T}\quad\langle i,j\rangle\mapsto a_{ij}

típusú, véges (m \cdot n elemszámú) értelmezési tartományú, \mathcal{T}-be képező függvények halmazát értjük. Itt × a halmazok Descartes-szorzata, \mbox{ }_{\langle i,j\rangle} rendezett pár.

Példák[szerkesztés | forrásszöveg szerkesztése]

A = \begin{bmatrix}
1 & 2 & 3 \\
1 & 2 & 7 \\
4&9&2 \\
6&0&5\end{bmatrix}

Az A mátrix egy 4×3-as mátrix. Az A[2,3] vagy a2,3 elem a 7.

 R = \begin{bmatrix} 1 & 2 & 3 & 4 & 5 & 6 & 7 & 8 & 9 \end{bmatrix}

Az R mátrix egy 1×9-es mátrix vagy 9 elemű sorvektor.

Műveletek mátrixokkal[szerkesztés | forrásszöveg szerkesztése]

Transzponálás[szerkesztés | forrásszöveg szerkesztése]

A transzponálás egy argumentumú művelet. Egy mátrix transzponálása sorainak és oszlopainak a felcserélését jelenti. Egy m × n-es típusú mátrix transzponáltja n × m-es típusú. Kétszer végrehajtva visszakapjuk az eredeti mátrixot. A transzponálás jele A^T vagy A'.

Egy mátrix szimmetrikus, ha transzponáltja önmaga, azaz A^T = A. Szimmetrikus mátrix csak négyzetes mátrix (lásd alább) lehet.

Példa[szerkesztés | forrásszöveg szerkesztése]

A = \begin{bmatrix}
1 & 2 & 3 \\
1 & 2 & 7 \\
4&9&2 \\
6&0&5\end{bmatrix}, A^T = \begin{bmatrix}
1 & 1 & 4 & 6\\
2 & 2 & 9 & 0 \\
3 & 7 & 2 & 5\end{bmatrix}

Összeadás[szerkesztés | forrásszöveg szerkesztése]

Csak azonos dimenziójú mátrixok adhatók össze. Legyen A és B két azonos dimenziójú, m × n-es méretű mátrix. Az A + B összeget úgy képezzük, hogy az azonos helyen lévő elemeket összegezzük (vagyis (A + B)[i, j] = A[i, j] + B[i, j] ).

Példa[szerkesztés | forrásszöveg szerkesztése]


  \begin{bmatrix}
    1 & 3 & 2 \\
    1 & 0 & 0 \\
    1 & 2 & 2
  \end{bmatrix}
+
  \begin{bmatrix}
    0 & 0 & 5 \\
    7 & 5 & 0 \\
    2 & 1 & 1
  \end{bmatrix}
=
  \begin{bmatrix}
    1+0 & 3+0 & 2+5 \\
    1+7 & 0+5 & 0+0 \\
    1+2 & 2+1 & 2+1
  \end{bmatrix}
=
  \begin{bmatrix}
    1 & 3 & 7 \\
    8 & 5 & 0 \\
    3 & 3 & 3
  \end{bmatrix}

Tulajdonságai[szerkesztés | forrásszöveg szerkesztése]

Skalárral való szorzás[szerkesztés | forrásszöveg szerkesztése]

Az A mátrix egy c skalárral való cA szorzatát úgy számítjuk, hogy a c számmal A minden elemét megszorozzuk (vagyis (cA)[i, j] = cA[i, j] ).

Ha a skalárt 1×1-es mátrixnak tekintjük, akkor a skalárral való szorzás speciális Kronecker-szorzat.

Példa[szerkesztés | forrásszöveg szerkesztése]

2\cdot
  \begin{bmatrix}
    1 & 8 & -3 \\
    4 & -2 & 5
  \end{bmatrix}
=
  \begin{bmatrix}
    2\cdot 1 & 2\cdot 8 & 2\cdot (-3) \\
    2\cdot 4 & 2\cdot (-2) & 2\cdot 5
  \end{bmatrix}
=
  \begin{bmatrix}
    2 & 16 & -6 \\
    8 & -4 & 10
  \end{bmatrix}

Tulajdonságai[szerkesztés | forrásszöveg szerkesztése]

  • aM = Ma. (Bármelyik oldalról szorozhatunk a skalárral.)
  • (a + b)M = aM + bM.
  • a(bM) = (ab)M = (ba)M = b(aM).

Az összeadás viszonyában teljesül, hogy:

  • a(M + N) = aM + aN.

Mátrixszorzás[szerkesztés | forrásszöveg szerkesztése]

Két mátrix szorzata akkor definiált, ha a bal oldali mátrix oszlopainak száma megegyezik a jobb oldali mátrix sorainak számával. Ha A egy m×n-es mátrix és B egy n×p-s mátrix, mátrixszorzatuk egy m×p méretű (m sorból, p oszlopból álló) AB mátrix lesz, melynek elemei így számíthatók:

 (AB)[i,j] = A[i,1]  B[1,j] + A[i,2]  B[2,j] + ... + A[i,n]  B[n,j] \!\

minden i-re és j-re.

Példa[szerkesztés | forrásszöveg szerkesztése]


  \begin{bmatrix}
    1 & 0 & 2 \\
    -1 & 3 & 1 \\
  \end{bmatrix}
\cdot
  \begin{bmatrix}
    3 & 1 \\
    2 & 1 \\
    1 & 0
  \end{bmatrix}
=
  \begin{bmatrix}
     (1 \cdot 3  +  0 \cdot 2  +  2 \cdot 1) & (1 \cdot 1   +   0 \cdot 1   +   2 \cdot 0) \\
    ((-1) \cdot 3  +  3 \cdot 2  +  1 \cdot 1) & ((-1) \cdot 1   +   3 \cdot 1   +   1 \cdot 0) \\
  \end{bmatrix}
=

\begin{bmatrix}
    5 & 1 \\
    4 & 2 \\
  \end{bmatrix},

illetve a megfelelő sort a megfelelő oszloppal történő szorzást kidomborítandó:


\begin{matrix}
 &
 \begin{bmatrix}
    3 & 1 \\
    2 & 1 \\
    1 & 0
  \end{bmatrix}\\\\
\begin{bmatrix}
    1 & 0 & 2 \\
    -1 & 3 & 1 \\
  \end{bmatrix}
&
\begin{bmatrix}
    5 & 1 \\
    4 & 2 \\
  \end{bmatrix}
\end{matrix},

ahol például az eredménymátrix 5-ös elemét úgy kaptuk, hogy a sorában lévő (1,0,2) elemeket páronként összeszoroztuk az oszlopában lévő (3,2,1) elemekkel, majd összeadtuk őket.

Tulajdonságai[szerkesztés | forrásszöveg szerkesztése]

  • asszociativitás: (AB)C = A(BC) minden k×m-es A, m×n-es B és n×p-s C mátrixra. Ezt a tulajdonságot kihasználva optimalizálni lehet a mátrixszorzást. A leghatékonyabb zárójelezés megtalálása nevezetes optimalizációs probléma.
  • jobb oldali disztributivitás: (A + B)C = AC + BC minden m×n-es A és B, valamint n×k-s C mátrixra.
  • bal oldali disztributivitás: C(A + B) = CA + CB minden m×n-es A és B, valamint k×m-es C mátrixra.

Fontos tudni, hogy a kommutativitás általában nem teljesül; vagyis adott A és B összeszorozható mátrixra általában igaz, hogy ABBA.

A négyzetes mátrixok összeszorozhatók önmagukkal, ezért magasabb hatványaik is képezhetők. Skalár együtthatós polinomba is behelyettesíthetők; ekkor a konstans tagot a permanenciaelv alapján nulladik hatványnak definiált megfelelő méretű egységmátrixszal szorozzák össze. A polinomok segítségével más függvényeik is approximálhatók hatványsorok segítségével. Ezekhez a számításokhoz a mátrix Jordan-normálalakját használják, mert azzal egyszerűbb számolni.

Az ugyanolyan hosszú sor- és oszlopvektorok kétféleképpen is összeszorozhatók mátrixszerűen. Az egyik szorzat egy skalár, ami éppen a vektorok skaláris szorzata, a másik egy négyzetes mátrix, a vektorok diadikus vagy tenzorszorzata.

C nyelvű kódpélda[szerkesztés | forrásszöveg szerkesztése]

Két mátrix összeszorzásának kódja C-ben önálló programként kiíratással:

#include <stdio.h>
 
#include <stdlib.h>
 
double A[1000][1000];
 
double B[1000][1000];
 
double AB[1000][1000];
 
  int main () {
 
    int m, n, k; //m-oszlop, n-sor (k-oszlop)
 
    int i, j, p;
 
    int sum=0;
 
    printf("A matrix merete: ");
 
    scanf("%d%d",&n, &m);
 
    printf("B matrix oszlopai: ");
 
    scanf("%d", &k);
 
    printf("B matrix sorainak szama igy: %d\n", m);
 
    printf("Adja meg az A matrixot:\n");
 
    for (i=0; i<n; i++) //A matrix feltoltese
 
      {
 
      for(j=0; j<m; j++)
 
      scanf("%lf", &A[i][j]);
 
      }
 
    printf("Adja meg a B matrixot:\n");
 
    for (i=0; i<m; i++) //B matrix feltoltese
 
     {
 
     for(j=0; j<k; j++)
 
     scanf("%lf", &B[i][j]);
 
     }
 
    printf("A matrix:\n");
 
    for (i=0; i<n; i++) //A matrix kiiratasa
 
     {
 
       for(j=0; j<m; j++)
 
         printf("%0.5lf ", A[i][j]);
 
       printf("\n");
 
    }
 
    printf("B matrix:\n");
 
    for (i=0; i<m; i++) //B matrix kiiratas
 
      {
 
      for(j=0; j<k; j++)
 
        printf("%0.5lf ", B[i][j]);
 
      printf("\n");
 
      }
 
    for ( i = 0 ; i < n ; i++ )
 
      {
 
      for ( j = 0 ; j < k ; j++ )
 
        {
 
          for ( p = 0 ; p < m ; p++ )
 
           {
 
           sum = sum + A[i][p]*B[p][j];
 
           }
 
        AB[i][j] = sum;
 
        sum = 0;
 
      }
 
    }
 
    printf("\nEredmenymatrix:\nAB=\n");
 
    for (i=0; i<m; i++) //B matrix kiiratas
 
      {
 
      for(j=0; j<k; j++)
 
        printf("%0.5lf  ", AB[i][j]);
 
      printf("\n");
 
      }
 
    return 0;
 
  }

Diadikus szorzás[szerkesztés | forrásszöveg szerkesztése]

Az n dimenziós valós vektortér a és b vektorainak diadikus szorzatán értjük és a o b -vel jelöljük azt a tenzort, mely a vektortérbe tartozó minden egyes r vektorhoz az a (b r) vektort rendeli.

Hadamard-szorzat[szerkesztés | forrásszöveg szerkesztése]

Két mátrix elemenkénti szorzatát Hadamard- vagy Schur-szorzatnak hívják, elemei:

 (A \circ B)_{ij} = (A)_{ij}(B)_{ij}

Egy explicit példán:

 \mathbf{A} \circ \mathbf{B} = \begin{pmatrix} A_{11} & A_{12} & \cdots & A_{1m} \\
 A_{21} & A_{22} & \cdots & A_{2m} \\
\vdots & \vdots & \ddots & \vdots \\
 A_{n1} & A_{n2} & \cdots & A_{nm} \\
\end{pmatrix}\circ\begin{pmatrix}
 B_{11} & B_{12} & \cdots & B_{1m} \\
 B_{21} & B_{22} & \cdots & B_{2m} \\
\vdots & \vdots & \ddots & \vdots \\
 B_{n1} & B_{n2} & \cdots & B_{nm} \\
\end{pmatrix} =\begin{pmatrix}
 A_{11}B_{11} & A_{12}B_{12} & \cdots & A_{1m}B_{1m} \\
 A_{21}B_{21} & A_{22}B_{22} & \cdots & A_{2m}B_{2m} \\
\vdots & \vdots & \ddots & \vdots \\
 A_{n1}B_{n1} & A_{n2}B_{n2} & \cdots & A_{nm}B_{nm} \\
\end{pmatrix}

A Hadamard-szorzat kommutatív, asszociatív és az összeadásra nézve disztributív.

Kronecker-szorzás[szerkesztés | forrásszöveg szerkesztése]

Ha A m\times n-es és B p\times r-es mátrix, akkor a C = A \otimes B Kronecker-szorzat nem más, mint

C = (a_{ij} \cdot B)
=\begin{pmatrix} a_{11} B & \cdots & a_{1n} B \\ \vdots & \ddots & \vdots \\ a_{m1} B & \cdots & a_{mn} B \end{pmatrix}

azaz az A mátrix minden elemét megszorozzuk a B mátrixszal, és ebből képezünk egy új mátrixot, aminek mérete mp\times nr.

Hogyha A és B rendre a V1W1 és a V2W2, lineáris leképezéseket reprezentálják, akkor AB a V1V2W1W2 tenzorszorzatot reprezentálja.

Használják a regressziós analízisben és a kvantummechanikában.

Invertálás[szerkesztés | forrásszöveg szerkesztése]

Az invertálás csak a nem nulla determinánsú mátrixokra értelmezett. Vagyis, ha egy n\times  n-es A mátrixra \det(A) \neq 0, akkor létezik egy A^{-1} mátrix, amire A  A^{-1} = A^{-1}  A = I, ahol I az n\times  n-es identitásmátrix. Ezeket a mátrixokat invertálhatóknak nevezzük, míg a többit szingulárisnak.

A szinguláris mátrixokhoz nem tartozik ilyen mátrix. Ehelyett az inverzhez hasonló módon pszeudoinverzet definiálnak, ahol a szorzatról csak azt kötik ki, hogy szimmetrikus legyen:

A  A^{-} = A^{-}  A = S

Tipikusan ez egy diagonális mátrix, a főátlóján 1 és 0 értékekkel.

Speciálisan vektorok esetén további műveletek is léteznek.

Mátrix rangja[szerkesztés | forrásszöveg szerkesztése]

Az A n×k-as mátrix rangja a mátrix lineárisan független oszlopainak maximális száma. Igazolható, hogy ez egy jól definiált természetes szám és megegyezik a mátrix lineárisan független sorainak maximális számával (a sorrang tehát egyenlő az oszlopranggal). Másként úgy is fogalmazhatunk, hogy a rang a mátrix oszlopvektorai által kifeszített altér dimenziója a Tk vektortérben (T az a test, ahonnan a mátrix elemeit vesszük). Tehát a rang:

r(A):=\mathrm{dim}\,\left\langle\{a_1, ..., a_{k}\}\right\rangle

ahol a1,…,ak az A mátrix oszlopai, mint vektorok.

Négyzetes mátrix[szerkesztés | forrásszöveg szerkesztése]

A négyzetes mátrix olyan mátrix, melyben a sorok és oszlopok száma megegyezik. Egy adott test feletti összes n-szer n-es négyzetes mátrix a skalárral való szorzással, mátrixösszeadással és mátrixszorzással algebrát alkot. Az n > 1 esetben az algebra általában nem kommutatív.

Egy A mátrix főátlója az a_{ii} alakú elemeket tartalmazza, tehát azokat, amelyek ugyanannyiadik sorban vannak, mint oszlopban. (Főátlónak tehát a bal fölső és a jobb alsó sarkot összekötő átlót hívjuk.)

Diagonálmátrix olyan négyzetes mátrix, amelynek minden főátlón kívüli eleme 0. (A nullmátrix is ide tartozik.)

Példa (diagonális mátrix)[szerkesztés | forrásszöveg szerkesztése]

Egy harmadrangú (n=3) diagonális mátrix:


  \begin{bmatrix}
    15 & 0 & 0 \\
    0 & -3 & 0 \\
    0 & 0 & 23
  \end{bmatrix}

Az In egységmátrix olyan négyzetes mátrix, melynek elemei a főátlóban egységnyiek, összes többi eleme 0, azaz olyan diagonálmátrix, melynek főátlóbeli elemei egységnyiek. Az egységmátrix kielégíti az alábbi egyenlőségeket: MIn = M' és InN = N minden m-szer n M mátrixra és n-szer k N mátrixra.

Példa (egységmátrix)[szerkesztés | forrásszöveg szerkesztése]

Ha n = 3:


  I_3 =
  \begin{bmatrix}
    1 & 0 & 0 \\
    0 & 1 & 0 \\
    0 & 0 & 1
  \end{bmatrix}

Az egységmátrix a négyzetes mátrixok gyűrűjének egységeleme.

A gyűrű invertálható elemeit invertálható mátrixnak vagy nem-szinguláris mátrixnak hívják. Egy n-szer n-es A mátrix akkor és csakis akkor invertálható, ha létezik egy olyan B mátrix, melyre igaz: AB = In ( = BA). Ebben az esetben a B mátrix az A mátrix inverz mátrixa és A‒1-nel jelölik.

Ha λ egy szám és v egy nemzéró vektor, melyre igaz az, hogy Av = λv, akkor v-t az A mátrix sajátvektorának, λ-t pedig a hozzá tartozó sajátértékének nevezik.

Az A négyzetes mátrix determinánsa


\det(A)=\sum_{\pi}(-1)^{|\pi|}a_{1,\pi(1)}\cdots a_{n,\pi(n)}

képlettel adható meg, ahol a \pi:\{1,2,\dots,n\}\to\{1,2,\dots,n\} permutációkra kell összegezni és |\pi| a \pi permutáció inverzióinak számát jelöli: azon (i,j) párokét, amikre i<j, de \pi(i)>\pi(j).

Invertálható mátrixok determinánsa nullától különbözik.

Az A négyzetes mátrix karakterisztikus polinomja a p_A(\lambda)=\det(A-\lambda I)\, polinom. Ez n-szer n-es A esetén n-edfokú, főegyütthatója (-1)^n\,, konstans tagja pedig A determinánsa. A Cayley–Hamilton-tétel szerint az A mátrix gyöke a p_A(\lambda)\, polinomnak. A λ szám akkor és csakis akkor sajátértéke A mátrixnak, ha A‒λIn nem invertálható, azaz, ha pA(λ) = 0. Így pA(x) gyökei pontosan A sajátértékei.

A Gauss-elimináció algoritmusának alapvető fontossága van: ezt lehet használni mátrixok determinánsának, rangjának és inverzének számítására, valamint lineáris egyenletrendszerek megoldására.

Egy négyzetes mátrix nyoma (angol kifejezéssel trace-e, vagy német szóval spurja) a főátlójában lévő elemek összege, ez mindig egyenlő az n sajátértékeinek összegével.

Az A négyzetes mátrix hasonló a B négyzetes mátrixhoz, ha

C négyzetes mátrix, melyre A = C‒1·B·C

Jelölés:

 A \cong B

A hasonló mátrixok sajátértékei egyenlők, továbbá a mátrixok hasonlósága nagyon jó példája az ekvivalencia relációnak.

Vektorterek[szerkesztés | forrásszöveg szerkesztése]

Ha R kommutatív, egységelemes gyűrű, akkor a fölötte definiált n \times m-es mátrixok a mátrixösszeadásra és a skalárral való szorzásra modulust alkotnak R fölött. Az A^T \cdot B mátrixszorzat nyoma

\left\langle A,B\right\rangle = \operatorname{Tr}(A^TB)
=\sum_{i=1}^n\sum_{j=1}^m a_{ij}b_{ij}

skalárszorzat a mátrixok tere fölött.

Speciálisan, ha az alapgyűrű test, akkor a mátrixok euklideszi vektorteret alkotnak. Ha n=m, akkor a térben a szimmetrikus és a ferdén szimmetrikus mátrixok alterei ortogonálisak, tehát \begin{matrix}\left\langle A,B\right\rangle=0\end{matrix}.

A komplex mátrixok szorzatának nyoma \overline{A}^T \cdot B

\left\langle A,B\right\rangle = \operatorname{Tr}(\overline{A^T}B)
=\sum_{i=1}^n\sum_{j=1}^m \overline{a_{ij}}b_{ij} a Hilbert-Schmidt-skalárszorzat, amivel a tér unitér tér lesz. Az általa indukált norma a Frobenius-norma, amivel a mátrixok tere Banach-tér.

A négyzetes mátrixok alkotta mátrixgyűrűkben az egységelem az identitásmátrix. Általánosságban, a főátlóján az alapgyűrű egységeleme, azon kívül nulleleme áll; számtestek esetén a főátlón egyeseket, azon kívül nullákat tartalmaz. A csupa nullelemet, illetve nullákat tartalmazó mátrix a nullmátrix, ami a mátrixgyűrű nullelemeként szolgál.

Alkalmazások[szerkesztés | forrásszöveg szerkesztése]

Mátrixegyenletek átalakítása[szerkesztés | forrásszöveg szerkesztése]

A statisztikában a magasabb dimenziós tételeket, eljárásokat, objektumokat gyakran mátrixokkal adják meg, és a számításokat, bizonyításokat ebben az alakban végzik. Mátrixegyenletek keletkeznek differenciálegyenletek diszkretizálásakor is.

Az egyenletek átalakításakor figyelembe kell venni, hogy a mátrixszorzás nem kommutatív, és hogy léteznek nullosztók. Osztás helyett például az inverzzel kell szorozni a megfelelő oldalról.

Egy egyszerű egyenlet:

A \cdot x=b

Ha az A mátrix invertálható, akkor szorozhatunk az inverzzel:

A^{-1} \cdot A \cdot x=A^{-1} \cdot b \Leftrightarrow  E \cdot x=A^{-1} \cdot b,

így kapjuk az

x=A^{-1} \cdot b.

megoldást.

Lineáris leképezések[szerkesztés | forrásszöveg szerkesztése]

Egy adott gyűrű, K fölött definiált mátrixok kapcsolódnak a gyűrű fölötti modulusokhoz. Ha A \in K^{m\times n}, akkor a K^n értelmezési tartomány és a K^m képtér (értékkészlet) egy rögzített bázisában az A mátrix egy lineáris leképezést ábrázol, ahol is az u\in K^n bázisát a képtér bázisának a sorok szerinti lineáris kombinációjába viszi. Azaz, ha az ábrázolt lineáris leképezés \phi, akkor a j-edik oszlopban a \phi (b_j) vektor képének koordinátái állnak. A leképezés az értelmezési tartomány egy tetszőleges x vektorát az Ax vektorba viszi. [1]

Megfordítva, minden \phi \colon K^n \to K^m lineáris leképezés ábrázolható A \in K^{m\times n} mátrixszal a fenti bekezdés megfordításaként. Tehát, ha nincs eleve adott bázis a mag- és a képtérben, akkor először választunk egy bázist, majd megnézzük az értelmezési tartomány bázisának képvektorait a képtér bázisában. Ezt az összefüggést kanonikus izomorfizmusnak nevezzük a lineáris leképezések és a mátrixok között:

\operatorname{Hom}_K(K^n,K^m)\simeq K^{m \times n}.

adott K, n és m esetén. A mátrixszorzás szintén megfelel a lineáris leképezések kompozíciójának, vagyis szorzatának. Ez asszociatív, ami egy újabb bizonyítást ad a mátrixszorzás asszociativitására.

Ha K kommutatív egységelemes gyűrű, akkor modulus helyett szabad K-modulusokat tekinthetünk. Ha K test, akkor tetszőleges véges dimenziós K fölötti V és W vektorterek izomorfak egy bázis választásával K^n-nel és K^m-mel valamely n-re és m-re, ahol n és m a V és a W terek dimenziói. Ha v=(v_1,\ldots,v_n) bázisa V-nek és w=(w_1,\ldots,w_m) bázis W-ben, akkor tetszőleges u\in V vektor egyértelműen előáll :u = \sum_{j=1}^n \alpha_j v_j alakban, és hasonlók tudhatók W vektorairól is. Az itt megjelenő testelemek a vektor koordinátái, és

{}_vu=\begin{pmatrix}\alpha_1 \\ \vdots \\ \alpha_n\end{pmatrix} \in K^n

az u koordinátavektora.

Hogyha \phi\colon V\to W lineáris leképezés, akkor V bázisvektorainak képei előállnak a W bázisvektorainak lineáris kombinációjaként:

\phi(v_j) = \sum_{i=1}^m a_{ij}w_i

a

{}_w\phi(v_j)=\begin{pmatrix}a_{1j} \\ \vdots \\ a_{mj}\end{pmatrix} \in K^m.

koordinátavektorral. Ekkor a leképezés egyértelműen ábrázolható az

{}_w\phi _v = \begin{pmatrix}
  a_{11} & \ldots & a_{1n} \\
  \vdots & \ddots & \vdots \\
  a_{m1} & \ldots & a_{mn}
\end{pmatrix} \in K^{m\times n},

mátrixszal. A mátrix függ a terek bázisaitól. Beszorzáskor a v bázisvektorokat a w bázisvektorok váltják fel.

Két lineáris leképezés, f\colon V\to W és g\colon W\to X szorzatát a

{}_x(g\circ f)_v = {}_xg_w \cdot {}_wf_v

mátrixs ábrázolja, feltéve, hogy a wbázis közös. Eszerint a V-ből W-be menő lineáris leképezések halmaza izomorf K^{m\times n}-nel. Az f \mapsto {}_wf_v izomorfia azonban a bázisoktól függ, ezért nem kanonikus.

Legyenek v' a V, és w' a W tér egy másik bázisa. Az adott leképezés ebben a bázisban is ábrázolható. Ez az ábrázolás a korábbi bázisból mátrixszorzással számítható, mégpedig az értelmezési tartomány bázisának megváltozásakor balról kell szorozni egy m \times m-es mátrixszal, míg a képtér bázisváltásához egy n \times n-es mátrixszal jobbról. Ez a szorzási szabály kétszeri alkalmazásával látható be:

{}_{w'}f_{v'} = {}_{w'}e^W_w \cdot {}_wf_v \cdot {}_ve^V_{v'}

ahol is az e^V és e^W identitásmátrixok mindent önmagára képeznek le,

Ha a bázistranszformáció egyes tulajdonságokat érintetlenül hagy, akkor azokat érdemes bázisfüggetlenül a lineáris leképezésnek tulajdonítani. Egy ilyen tulajdonság test fölött a rang, ami a képtér dimenzióját adja meg. Teljes rang esetén a leképezést ábrázoló mátrixok invertálhatók.

A determinánst csak négyzetes mátrixokra definiálják. Ekkor a két tér dimenziója megegyezik, tehát, mivel az azonos dimenziójú vektorterek izomorfak, V=W feltehető. Hogyha az értelmezési és a képtartományban ugyanazt a bázistranszformációt végezzük, akkor

{}_{v'}f_{v'} = ({}_ve^V_{v'})^{-1} \cdot {}_vf_v \cdot {}_ve^V_{v'}.

és a determináns is megmarad. A determináns akkor és csak akkor nem nulla, ha a leképezés teljes rangú.

Végtelen dimenziós terek[szerkesztés | forrásszöveg szerkesztése]

Végtelen dimenziós terekben is teljesül, hogy tetszőleges f\colon U\to V, lineáris leképezést meghatározzák egy tetszőleges u bázis f(u) képvektorai. Ebben az esetben azonban megszokottabb a lineáris operátor elnevezés. Amennyiben korlátos, kiterjeszthető egész U-ra. Ha most \mathcal{B}_V bázis V-ben, akkor f(u) egyértelműen előáll \mathcal{B}_V elemeinek lineáris kombinációjaként, ahol az együtthatók közül véges sok nullától különböző testelem van, így: f(u)=\sum_{b\in\mathcal{B}_V}f(u)_b b Test helyett vehető ferdetest is. Így minden korlátos lineáris operátor felfogható végtelenszer végtelen mátrixként, ami extrém ritka, ugyanis a végtelen sok eleme között csak véges sok különbözik nullától. A lineáris transzformációk szorzása ismét megfelel a mátrixszorzásnak.

A nem korlátos lineáris operátorok nem folytonosak, és legfeljebb egy sűrű altérre terjeszthetők ki. Ilyenek például függvénytereken a differenciáloperátorok. Jellemzésükben fontos szerephez jut az értelmezési tartomány. Sok tulajdonságot csak sűrűn definált operátorokra tudunk bizonyítani.[2]

A funkcionálanalízisben topologikus vektortereket vizsgálnak, így lehet beszélni határértékről, és képezhetők végtelen sorozatok összegei is. Így vizsgálhatók olyan végtelen mátrixok is, amelyek végtelen sok nullától különböző értéket tartalmaznak, és akár egész sorok és oszlopok is teltek lehetnek. Itt bázison is valami mást értenek.

Ennek egy speciális alesetét alkotják a Hilbert-terek. Legyenek U, V Hilbert-terek, és (u_i)_{i\in I}, (v_i)_{i\in I} rendre U és V ortonormált bázisa. Ekkor a f\colon U\to V lineáris operátor, ahol a mátrix elemei a

f_{i,k} :=\langle u_i, f u_k\rangle

testelemek, és ahol \langle u,v\rangle a Hilbert-tér skalárszorzata. Sűrűn definiált lineáris operátorok is hasonlóan ábrázolhatók, amennyiben az értelmezési tartománynak van ortonormált bázisa.

A Hilbert‑Schmidt-skalárszorzat csak a lineáris leképezések egy részére definiálható. Ezek a Hilbert‑Schmidt-operátorok, amelyekre a definiáló sor folytonosan konvergens.

Speciális mátrixok[szerkesztés | forrásszöveg szerkesztése]

Alkalmazások[szerkesztés | forrásszöveg szerkesztése]

Hivatkozások[szerkesztés | forrásszöveg szerkesztése]

Irodalom[szerkesztés | forrásszöveg szerkesztése]

Megjegyzések[szerkesztés | forrásszöveg szerkesztése]

  1. Az azonos című filmtől kezdve a Marvel képregényein és -filmjein keresztül - Superman, Transformers - egészen a Star Trek: Voyagerig megszámlálhatatlan sok alkotás használta ezt a szót.

Források[szerkesztés | forrásszöveg szerkesztése]

  1. www.math.klte.hu/~kozma/linlek-f.pdf
  2. www.cs.elte.hu/~karatson/nfa.pdf