Temeller

Bu ilk bölümde, lisans derslerinde verilen bilgilerin bazılarını hızlıca gözden geçirdiğimiz, temel kavram ve sonuçların tartışılacağı bir çerçeve sunacağız. Genel olarak teorem kanıtları ve örneklerin kısıtlı tutulacağı bu bölümde, sonraki bölümler için gerekli olan bazı kavram ve sonuçları hatırlatmakla yetineceğiz.

Vektör Uzayları

Vektör kavramı ve vektör uzayları, doğrusal cebirin temel yapı taşlarıdır. Vektörler, özellikle Fizik alanı ile ilişkili konularda (örn. mekanik, dinamik vb.) bir yön ve büyüklük taşıyan temsiller olarak düşünülse de doğrusal cebir bağlamında soyut bir kavram olarak ele alınır. Bu sayede vektörler, hemen hemen bütün bilim alanlarında, geometrik olarak temsil edilmesi gerekmeden de kullanışlı araçlar olarak iş görürler.

Vektör uzayları ise, vektörlerin bazı temel özellikleri sağlayan topluluğudur. Bu temel özelliklerden biri de bir skalerle çarpma işleminin tanımlı olmasıdır. Yani bir vektör ile skaler adı verilen bir büyüklüğün işleme girmesi sonucunda yine bir vektör elde edilebilmelidir. Skaler büyüklükler uygulamada genellikle reel sayılar veya karmaşık sayılar olarak düşünülse de çok daha genel bir çerçevede tanımlanabilirler. Örneğin, bir vektör uzayını tanımlamak için skalerleri herhangi bir cisimden seçebiliriz. Bir cisim, üzerinde iki işlemin tanımlı olduğu ve bu işlemlerin belirli özellikleri sağladığı bir kümedir.

Tanım 1.1: Cisim Kavramı

$\mathbb{F}$, boş olmayan bir küme ve $\mathbb{F}$ üzerinde $+$ (toplama) ve $\cdot$ (çarpma) şeklinde iki işlem tanımlı olsun. Aşağıdaki özellikler sağlanıyorsa $(\mathbb{F},+,\cdot)$ sistemine bir cisim denir:

$(\mathbb{F},+)$ --birim elemanını $0$ ile göstereceğimiz-- bir değişmeli gruptur.
$(\mathbb{F}\setminus\{0\},\cdot)$ --birim elemanını $1$ ile göstereceğimiz-- bir değişmeli gruptur.
Çarpma işleminin toplama işlemi üzerine dağılma özelliği vardır: $$a\cdot(b+c) = a\cdot b + a\cdot c$$

Yukarıdaki tanımda, kullanılan grup kavramı, üzerinde bir işlemin tanımlı olduğu bir kümenin belirli özellikleri sağladığı bir yapıyı tarif eder. Buna göre bir grup, üzerindeki işlemin birleşmeli olduğu, birim elemanının bulunduğu ve her elemanının tersinin olduğu bir kümedir. Değişmeli grup ise, işlemin değişmeli olduğu bir grup olarak tanımlanır. Dolayısıyla $\mathbb{F}$ bir cisim ise, $\mathbb{F}$ üzerinde tanımlı $+$ işlemi birleşmeli, birim elemanı $0$ olan ve her elemanın toplamsal tersinin bulunduğu bir kümedir ve toplama işlemi değişmelidir. Ek olarak eğer $x\in\mathbb{F}$ ise $x$'in toplamsal tersi $-x$ ile gösterilir. Buna göre her $x\in \mathbb{F}$ için

$$\begin{align*} x + 0 &= x, \\ x + (-x) &= 0, \\ x + y = 0 &\implies y = -x \text{ ve } x = -y \end{align*}$$

olur. Ayrıca $\mathbb{F}$ üzerinde tanımlı $\cdot$ işlemi de değişmeli, birleşmeli, birim elemanı $1$ olan ve sıfırdan farklı her elemanın çarpımsal tersinin bulunduğu bir kümedir. Yani $\mathbb{F}$ cismi için $x\in\mathbb{F}$ ve $x\neq 0$ ise $x^{-1}$ ile gösterilen $x$'in çarpımsal tersi vardır ve bu ters eleman tek türlü belirlidir. Buna göre her $x\in \mathbb{F}$ için

$$\begin{align*} x\cdot 1 &= x, \\ x\cdot x^{-1} &= 1, \\ x\cdot y =1 &\implies y = x^{-1} \text{ ve } x = y^{-1} \end{align*}$$

olur.

Bir $\mathbb{F}$ cismi üzerinde çıkarma işlemi olarak bilinen ve $-$ ile gösterilen işlem ise her $a,b\in \mathbb{F}$ için

$$a - b = a + (-b)$$

şeklinde tanımlanır. Buna göre çıkarma işlemi, toplama işleminin özel bir durumu olarak düşünülebilir. Toplama işleminin aksine çıkarma işlemi, genellikle değişmeli ve birleşmeli değildir.

Bir $\mathbb{F}$ cisminde elemanların çarpımı, genellikle, elemanların yan yana yazılması ile ifade edilir; yani $x\cdot y$ yerine $xy$ yazılır. Biz her iki yazımı da serbestçe kullanacağız. Ayrıca $\mathbb{F}$ cismi için $x\in\mathbb{F}$ ve $x\neq 0$ ise $x^{-1}$ ile gösterilen $x$'in çarpımsal tersi $1/x$ ile de gösterilebilir.

Cisimler pek çok farklı bağlamda karşımıza çıkabilirler. Örneğin rasyonel sayılar $\mathbb{Q}$, reel sayılar $\mathbb{R}$, karmaşık sayılar $\mathbb{C}$, sonlu cisimler $\mathbb{F}_{p^n}$ ve rasyonel fonksiyonlar cismi gibi cisimlerin kendine has uygulama sahaları mevcuttur. Doğrusal cebir, bu uygulama sahalarının çoğunda cisimlerin özelliklerini kullanarak soyut bir çerçeve sunar. Şimdi bir vektör uzayının nasıl tanımlandığını görelim:

Tanım 1.2: Vektör Uzayı

$\mathbb{F}$ bir cisim ve $\mathcal{V}$ boş olmayan bir küme olsun. Sırasıyla toplama ve skalerle çarpma denilen aşağıdaki gibi işlemler tanımlı olsun. $$\begin{align*} \mathcal{V}\times \mathcal{V} &\to \mathcal{V} \\ (x,y) &\mapsto x+y \end{align*}$$

$$\begin{align*} \mathbb{F}\times \mathcal{V} &\to \mathcal{V} \\ (a,x) &\mapsto a\cdot x \end{align*}$$

Bu işlemler aşağıdaki özellikleri sağlıyorsa $(\mathcal{V},+,\cdot)$ sistemine $\mathbb{F}$ üzerinde bir vektör uzayı veya kısaca bir $\mathbb{F}$-uzayı denir:

$(\mathcal{V},+)$ --birim elemanını $\mathbf{0}$ ile göstereceğimiz-- bir değişmeli gruptur.
$\forall \mathbf{x},\mathbf{y}\in \mathcal{V}, \forall a,b\in\mathbb{F}, a\cdot(\mathbf{x}+\mathbf{y}) = a\cdot\mathbf{x} + a\cdot\mathbf{y}$.
$\forall \mathbf{x}\in \mathcal{V}, \forall a,b\in\mathbb{F}, (a+b)\cdot\mathbf{x} = a\cdot\mathbf{x} + b\cdot\mathbf{x}$.
$\forall \mathbf{x}\in \mathcal{V}, \forall a,b\in\mathbb{F}, (ab)\cdot\mathbf{x} = a\cdot (b\cdot\mathbf{x})$.
$\forall \mathbf{x}\in \mathcal{V}, 1\cdot\mathbf{x} = \mathbf{x}$.

Tanımdan da görüldüğü gibi bir vektör uzayı, skalerlerin etki ettiği bir toplamsal değişmeli gruptur.

Bir vektör uzayının elemanlarına genel olarak vektör denir. Vektör uzayları söz konusu olduğunda, iki türlü büyüklük söz konusudur: skaler büyüklük ve vektörel büyüklük. Bir vektörü temsil ederken skalerlerden ayırmak için genellikle vektörleri kalın harflerle göstereceğiz.

$\cv$ bir vektör uzayı ve $\vek x\in \cv$ ise $x$'in toplamsal tersi $-\vek x$ ile gösterilir. Tanım gereği elde edilen özellikleri aşağıdaki gibi sıralayabiliriz:

Her $\vek x\in \cv$ için $0\cdot \vek x = \vek 0$.
Her $a$ skaleri için $a\cdot \vek 0 = \vek 0$.
Her $a$ skaleri ve $\vek x\in \cv$ için $a\cdot (-\vek x) = (-a)\cdot \vek x=-(a \cdot \vek x)$.
Her $n$ tamsayısı, $a$ skaleri ve $\vek x\in \cv$ için $(n\cdot a)\cdot \vek x = a\cdot (n\cdot \vek x)=n\cdot (a\cdot \vek x)$.

Bir $\mathbb{F}$ cismi için

$$\mathbb{F}^n=\{(x_1,\ldots,x_n)\mid \text{her }1\le i\le n \text{ için } x_i\in\mathbb{F}\}$$

kartezyen çarpım kümesi üzerinde toplama ve skalerle çarpma işlemlerini her $\mathbf{x}=(x_1,\ldots,x_n),\mathbf{y}=(y_1,\ldots,y_n)\in \mathbb{F}^n$ ve her $a\in \mathbb{F}$ için

$$\begin{align*} \mathbf{x} + \mathbf{y} &= (x_1+y_1,\ldots,x_n+y_n), \\ a\cdot \mathbf{x} &= (a x_1,\ldots,a x_n) \end{align*}$$

şeklinde tanımlarsak, $\mathbb{F}^n$ bir $\mathbb{F}$-uzayı olur. $\mathbb{F}^n$ uzayı, sonlu boyutlu $\mathbb{F}$-uzaylarının tipik bir örneğidir ve pek çok uygulama için kullanışlı bir çatı yapı sunar. Örneğin $\mathbb{F}=\mathbb{R}$ için, $\mathbb{F}^2$, $2$-boyutlu Öklid uzayıdır ve önemli geometrik yapıları içinde barındırır. Bunlardan biri orijiden geçen doğrular olarak verilebilir. Mesela, $\mathcal{D}=\{(x,x)\mid x\in\mathbb{R}\}$ kümesi, $y=x$ eşitliği ile temsil edilen birici açıortay doğrusu olarak bilinen doğrudur. Dikkat edilirse $\mathcal{D}$, $\mathbb{R}^2$ uzayının bir alt kümesidir ve $\mathbb{R}^2$ üzerinde tanımlı toplama ve skalerle çarpma işlemleri ile $\mathcal{D}$ de bir $\mathbb{R}$-uzayı olur. Bu tür alt kümelere alt uzay denir.

Tanım 1.3: Alt Uzay

$\mathcal{V}$ bir $\mathbb{F}$-uzayı ve $\emptyset\neq W\subseteq \mathcal{V}$ olsun. Eğer $\mathcal{W}$, $\mathcal{V}$'nin işlemlerine göre bir $\mathbb{F}$-uzayı oluyorsa $\mathcal{W}$ kümesine $\mathcal{V}$'nin bir alt uzayı denir.

Aşağıdaki sonuç alt uzayları belirlemek için kullanışlıdır:

Teorem 1.1: Alt uzay kriteri

$\mathcal{V}$ bir $\mathbb{F}$-uzayı ve $\mathcal{W}\subseteq \mathcal{V}$ olsun. Eğer

$\mathcal{W}\neq \emptyset$,
$\forall \mathbf{x},\mathbf{y}\in \mathcal{W}, \mathbf{x}+\mathbf{y}\in \mathcal{W}$, ve
$\forall a\in\mathbb{F}, \mathbf{x}\in \mathcal{W}, a\cdot \mathbf{x}\in \mathcal{W}$

ise $\mathcal{W}$, $\mathcal{V}$'nin bir alt uzayıdır.

Kanıt

$\mathcal{W}$ boş olmadığından, bir $\mathbf{w} \in \mathcal{W}$ elemanı vardır.

Üçüncü koşul gereği $0 \cdot \mathbf{w} = \mathbf{0} \in \mathcal{W}$ olur. Benzer şekilde, $(-1) \cdot \mathbf{w} = -\mathbf{w} \in \mathcal{W}$ olduğundan her elemanın toplamsal tersi $\mathcal{W}$ içindedir. İkinci koşul ile toplama işlemi $\mathcal{W}$ üzerine kapalıdır. Böylece $(\mathcal{W}, +)$ bir alt gruptur. Vektör uzayı aksiyomları $\mathcal{V}$'de sağlandığından $\mathcal{W}$'da da sağlanır.

Yukarıdaki kriteri kullanarak, alt uzayların keyfi kesişimlerinin de bir alt uzay olduğunu kolayca gösterebiliriz. Buna göre belirli elemanları içeren minimal bir alt uzay bulmak için bu elemanları içeren alt uzayların kesişimini alabiliriz. Örnein, $\mathcal{V}$ uzayının $X=\{\mathbf{x}_1,\ldots,\mathbf{x}_n\}$ alt kümesini içeren tüm alt uzaylarının kesişimi, $X$ kümesini içeren en küçük alt uzayı verir. Bu alt uzaya $\mathcal{V}$'nin $X$ ile gerilen (veya üretilen) alt uzayı denir ve genellikle $\operatorname{span} X$ veya $\langle X \rangle$ ile gösterilir.

Önerme 1.2

$\mathcal{V}$ bir $\mathbb{F}$-uzayı ve $X\subseteq \mathcal{V}$ olsun. O zaman $$\operatorname{span} X=\left\{\sum_{i=1}^n a_i \mathbf{x}_i \bigg\vert n\in \mathbb{N}, a_i\in \mathbb{F}, \mathbf{x}_i\in X\right\}$$

olur.

Kanıt

$S = \left\{\sum_{i=1}^n a_i \mathbf{x}_i \mid n\in \mathbb{N}, a_i\in \mathbb{F}, \mathbf{x}_i\in X\right\}$ olsun. $S = \operatorname{span} X$ olduğunu göstermek için iki taraflı içerme ispatlayacağız.

($S \subseteq \operatorname{span} X$): $\operatorname{span} X$, $X$'i içeren tüm alt uzayların kesişimi olduğundan, $X$'i içeren herhangi bir $\mathcal{W}$ alt uzayı alalım. $\mathcal{W}$ alt uzay olduğundan toplama ve skalerle çarpma işlemlerine göre kapalıdır. Dolayısıyla her $\sum_{i=1}^n a_i \mathbf{x}_i \in S$ elemanı için, $\mathbf{x}_i \in X \subseteq \mathcal{W}$ olduğundan $a_i \mathbf{x}_i \in \mathcal{W}$ ve toplamları da $\mathcal{W}$'dadır. Böylece $S \subseteq \mathcal{W}$. Bu $X$'i içeren her alt uzay için doğru olduğundan $S \subseteq \operatorname{span} X$.

($\operatorname{span} X \subseteq S$): $S$'nin bir alt uzay olduğunu ve $X \subseteq S$ olduğunu gösterirsek, $\operatorname{span} X$ bu şekildeki en küçük alt uzay olduğundan $\operatorname{span} X \subseteq S$ olur. Her $\mathbf{x} \in X$ için, $\mathbf{x} = 1 \cdot \mathbf{x}$ yazılabilir, dolayısıyla $X \subseteq S$ olur. $S$ toplama ve skalerle çarpma işlemlerine göre kapalıdır çünkü iki lineer kombinasyonun toplamı ve bir lineer kombinasyonun skalerle çarpımı yine bir lineer kombinasyondur. Ayrıca $\mathbf{0} = 0 \cdot \mathbf{x} \in S$ olup $S \neq \emptyset$ dir. O halde $S$, $X$'i içeren bir alt uzaydır ve $\operatorname{span} X \subseteq S$.

$\cv$ bir vektör uzayı ve $\cw$ ile $\cw'$, $\cv$'nin iki alt uzayı olsun. Bu durumda

$$\mathbf{\mathcal{W} + \mathcal{W}'} := \{ \mathbf{x} + \mathbf{y} \mid \mathbf{x} \in \mathcal{W}, \mathbf{y} \in \mathcal{W}' \}$$

kümesi $\mathcal{V}$'nin bir alt uzayıdır. Bu alt uzaya $\mathcal{W}$ ile $\mathcal{W}'$ uzaylarının toplamı denir. Tümevarım ile iki alt uzayın toplamını, sonlu tane alt uzayın toplamına genişletebiliriz: Örneğin $\mathcal{W}_1,\ldots,\mathcal{W}_k$ alt uzayları için

$$\mathbf{\sum_{i=1}^k \mathcal{W}_i} := \{ \mathbf{x}_1 + \cdots + \mathbf{x}_k \mid \mathbf{x}_i \in \mathcal{W}_i \text{ için } 1\le i\le k \}$$

toplamını tanımlayabiliriz. Daha da genel olarak, bir $I$ indeks kümesi ve $\{\mathcal{W}_i\}_{i\in I}$ alt uzaylar ailesi için

$$\mathbf{\sum_{i\in I} \mathcal{W}_i} := \left\{\sum_{j\in J}\mathbf{x}_j \bigg\vert J\subseteq I\text{ sonlu ve her }j\in J\text{ için }\mathbf{x}_j \in \mathcal{W}_j \right\}$$

toplamını tanımlayabiliriz. Dikkat edilirse, bu tanım, sonlu sayıda alt uzayın toplamı için verdiğimiz tanımın bir genelleştirmesidir. Daha açık ifade etmek gerekirse, eğer $I=\{1,\ldots,k\}$ ise, o zaman yukarıdaki tanımlar aynı anlama gelir.

Taban ve Boyut

$\mathcal{V}$ bir vektör uzayı ve $X\subseteq \mathcal{V}$ olsun. Eğer $\mathcal{V}=\operatorname{span} X$ ise, yani $X$ kümesi $\mathcal{V}$ uzayını gererse, $X$ kümesine $\mathcal{V}$'nin bir *üreteç kümesi* denir. Bu durumda, $\mathcal{V}$'nin her $\mathbf{x}$ elemanı için $\mathbf{x}=\sum_{i=1}^n a_i \mathbf{x}_i$ olacak şekilde $a_i\in \mathbb{F}$ ve $\mathbf{x}_i\in X$ ($1\le i\le n$) elemanları bulunabilir.

Tanım 1.4: Taban

$\mathcal{V}$ bir $\mathbb{F}$-uzayı ve $X\subseteq \mathcal{V}$ olsun.

Eğer $X$ kümesi $\mathcal{V}$'nin bir üreteç kümesi olduğu halde $X$'in hiçbir öz alt kümesi $\mathcal{V}$'yi geremiyorsa, $X$ kümesine $\mathcal{V}$'nin bir tabanı denir.

Yukarıdaki tanım gereği, bir taban, vektör uzayını geren minimal bir üreteç kümesidir. $X$, $\mathcal{V}$ uzayının bir tabanı olduğunda $X$ kümesinin elemanları $\mathcal{V}$ uzayının lineer bağımsız elemanları olur. Yani $X$ kümesinin her $\{\mathbf{x}_1,\ldots,\mathbf{x}_n\}$ sonlu alt kümesi için

$$a_1\mathbf{x}_1+\ldots+a_n\mathbf{x}_n=\mathbf{0}$$

eşitliğinin sağlanması için $a_1,\ldots,a_n\in\mathbb{F}$ katsayılarının hepsinin sıfır olması gerekir. Aksi halde en az bir $a_i$ katsayısı sıfırdan faklı ise --örneğin $a_1\neq 0$ ise--

$$\mathbf{x}_1=\frac{1}{a_1}\left(-a_2\mathbf{x}_2-\ldots-a_n\mathbf{x}_n\right)$$

olacağından $\mathbf{x}_1\in \operatorname{span}\{\mathbf{x}_2,\ldots,\mathbf{x}_n\}$ ve böylece $X\setminus\{\mathbf{x}_1\}$ kümesi $\mathcal{V}$ uzayının bir üreteç kümesi olur. Bu ise $X$ kümesinin minimal olma özelliği ile çelişir.

Bir vektör uzayının lineer bağımsız elemanlarından oluşan bir alt kümesine o vektör uzayının bir lineer bağımsız alt kümesi denir. Aşağıdakiler bir $X=\{\mathbf{x}_1,\ldots,\mathbf{x}_n\}$ kümesinin lineer bağımsız olması ile eşdeğerdir:

$a_1\mathbf{x}_1+\ldots+a_n\mathbf{x}_n=b_1\mathbf{x}_1+\ldots+b_n\mathbf{x}_n$ ise her $1\le i\le n$ için $a_i=b_i$ dir.
$a_1\mathbf{x}_1+\ldots+a_n\mathbf{x}_n=\mathbf{0}$ ise her $1\le i\le n$ için $a_i=0$ dir.
$\mathbf{x}_1\neq \mathbf{0}$, $\mathbf{x}_2\notin \operatorname{span}\{\mathbf{x}_1\}$, $\mathbf{x}_3\notin \operatorname{span}\{\mathbf{x}_1,\mathbf{x}_2\}$, $\ldots$, $\mathbf{x}_n\notin \operatorname{span}\{\mathbf{x}_1,\ldots,\mathbf{x}_{n-1}\}$.
$Y$ kümesi $\mathcal{V}$'nin lineer bağımsız bir alt kümesi,
$\mathcal{V}$'nin $Y$ kümesini içeren $Y$'den farklı her alt kümesi lineer bağımlı ise,

Teorem 1.3

$\mathcal{V}$ bir vektör uzayı ve $X\subseteq \mathcal{V}$ olsun. Aşağıdakiler denktir:

$X$ kümesi $\mathcal{V}$'nin bir maksimal lineer bağımsız alt kümesidir.
$X$ kümesi $\mathcal{V}$'nin bir minimal üreteç kümesidir.

Kanıt

(1 $\Rightarrow$ 2): $X$, $\mathcal{V}$'nin maksimal lineer bağımsız alt kümesi olsun. Öncelikle $\operatorname{span} X = \mathcal{V}$ olduğunu gösterelim. $\mathbf{v} \in \mathcal{V}$ keyfi bir eleman olsun. Eğer $\mathbf{v} \in X$ ise $\mathbf{v} \in \operatorname{span} X$. Eğer $\mathbf{v} \notin X$ ise, $X$ maksimal olduğundan $X \cup \{\mathbf{v}\}$ lineer bağımlıdır. Yani $a_1\mathbf{x}_1 + \ldots + a_n\mathbf{x}_n + b\mathbf{v} = \mathbf{0}$ olacak şekilde, hepsi sıfır olmayan katsayılar vardır. Eğer $b = 0$ olsaydı $X$ lineer bağımlı olurdu, ki bu da bir çelişki olurdu. O halde $b \neq 0$ ve $\mathbf{v} = -\frac{1}{b}(a_1\mathbf{x}_1 + \ldots + a_n\mathbf{x}_n) \in \operatorname{span} X$. Dolayısıyla $X$ bir üreteç kümesidir.

Minimalliği göstermek için, $X$'in bir öz alt kümesi $Y \subsetneq X$ alırsak, herhangi bir $\mathbf{x} \in X \setminus Y$ için $\mathbf{x} \notin \operatorname{span} Y$ olur (aksi halde $X$ lineer bağımlı olurdu). O halde $Y$, $\mathcal{V}$'yi geremez ve böylece $X$ minimaldir.

(2 $\Rightarrow$ 1): $X$, $\mathcal{V}$'nin bir minimal üreteç kümesi olsun. $X$'in lineer bağımsız olduğunu gösterelim. Aksini varsayalım: $\vek x_1,\ldots,\vek x_n \in X$ için $a_1\mathbf{x}_1 + \ldots + a_n\mathbf{x}_n = \mathbf{0}$ olacak şekilde hepsi birden sıfır olmayan $a_1,\ldots,a_n\in\mathbb{F}$ katsayıları olsun ve genelliği bozmadan $a_1 \neq 0$ alalım. O zaman $\mathbf{x}_1 \in \operatorname{span}(X \setminus \{\mathbf{x}_1\})$ olur ve $X \setminus \{\mathbf{x}_1\}$ kümesi de $\mathcal{V}$'yi gerer. Bu ise $X$'in minimalliği ile çelişir.

Maksimalliği göstermek için, $\mathbf{v} \in \mathcal{V} \setminus X$ olsun. $X$ üreteç olduğundan $\mathbf{v} = \sum a_i\mathbf{x}_i$, yani $\mathbf{v} - \sum a_i\mathbf{x}_i = \mathbf{0}$. Bu $X \cup \{\mathbf{v}\}$'nin lineer bağımlı olduğunu gösterir. O halde $X$ bir lineer bağımsız küme olarak maksimaldir.

Lineer bağımsız alt kümelerin bir artan zincirinin birleşimi de yine lineer bağımsız bir alt küme verir. Bu nedenle, Zorn LemmasıZorn Lemması: Kısmi sıralı bir kümenin her zincirinin bir üst sınırı varsa bu kısmi sıralı kümenin bir maksimal elemanı vardır ile, her vektör uzayının bir tabana sahip olacağı görülebilir.

Teorem 1.4

$\mathcal{V}$ bir vektör uzayı olsun. O zaman $\mathcal{V}$'nin en az bir tabanı vardır. Ayrıca $\mathcal{V}$'nin her tabanının kardinalitesi aynıdır. Yani $\mathcal{V}$'nin herhangi iki tabanı arasında bir birebir eşleme vardır.

Kanıt

Varlık: $\mathcal{L} = \{S \subseteq \mathcal{V} \mid S \text{ lineer bağımsız}\}$ kümesini ele alalım. $\emptyset \in \mathcal{L}$ olduğundan $\mathcal{L} \neq \emptyset$. $\mathcal{L}$ üzerinde $\subseteq$ ile bir kısmi sıralama tanımlıdır.

$\{S_i\}_{i \in I}$, $\mathcal{L}$'de bir zincir olsun. $S = \bigcup_{i \in I} S_i$ tanımlansın. $S$'nin lineer bağımsız olduğunu gösterelim: $\mathbf{v}_1, \ldots, \mathbf{v}_n \in S$ ve $\sum a_k \mathbf{v}_k = \mathbf{0}$ olsun. Her $\mathbf{v}_k$ bir $S_{i_k}$'da olduğundan ve $\{S_i\}$ zincir olduğundan, hepsi bir $S_j$'de bulunur. $S_j$ lineer bağımsız olduğundan her $k$ için $a_k = 0$. Dolayısıyla $S \in \mathcal{L}$ ve $S$, zincirin bir üst sınırıdır.

Zorn Lemması ile $\mathcal{L}$'nin bir maksimal elemanı $\mathcal{B}$ vardır. Önceki teoremden $\mathcal{B}$, $\mathcal{V}$'nin bir tabanıdır.

Kardinalite: $\mathcal{B}$ ve $\mathcal{C}$, $\mathcal{V}$'nin iki tabanı olsun. Her $\mathbf{c} \in \mathcal{C}$ için $\mathbf{c} = \sum_{i=1}^{n} a_i \mathbf{b}_i$ yazılabilir. $f(\mathbf{c}) = \{\mathbf{b}_i \mid a_i \neq 0\}$ tanımlansın. $\mathcal{C}$ lineer bağımsız olduğundan, $\mathcal{C}$'nin herhangi bir sonlu alt kümesi $\{c_1, \ldots, c_m\}$ için $|\bigcup_{j=1}^{m} f(c_j)| \geq m$ olmalıdır (aksi halde bu vektörler lineer bağımlı olurdu). Hall Evlilik Teoremi'nin bir genellemesi ile $|\mathcal{C}| \leq |\mathcal{B}|$. Simetrik argümanla $|\mathcal{B}| \leq |\mathcal{C}|$. Dolayısıyla $|\mathcal{B}| = |\mathcal{C}|$.

Vektör uzayı tabanlarının yukarıdaki teorem ile verilen değişmezlik özelliği boyut kavramını doğurur.

Tanım 1.5: Boyut

$\mathcal{V}$ bir $\mathbb{F}$-uzayı ve $X\subseteq \mathcal{V}$ olsun. Eğer $X$ kümesi $\mathcal{V}$'nin bir tabanı ise, $X$ kümesinin eleman sayısına $\mathcal{V}$'nin boyutu denir ve $\dim_\mathbb{F} \mathcal{V}$ ile gösterilir.

Eğer $\mid X\mid=n<\infty$ ise, $\mathcal{V}$'ye bir $n$-boyutlu vektör uzayı denir. Eğer $\mid X \mid = \infty$ ise, $\mathcal{V}$'ye sonsuz boyutlu vektör uzayı denir.

Bu tabana $\mathbb{F}^n$ uzayının standart tabanı denir.

Aşağıdaki kullanışlı teorem, önceki teoremin doğal bir sonucudur:

Teorem 1.5

$\mathcal{V}$ bir vektör uzayı olsun.

$\mathcal{V}$'nin her lineer bağımsız alt kümesi bir tabana genişletilebilir: $X\subseteq \mathcal{V}$ lineer bağımsız bir alt kümesi ise, $\mathcal{V}$'nin $X$ kümesini içeren bir tabanı vardır.
$\mathcal{V}$'nin her üreteç kümesi bir tabana daraltılabilir: $Y\subseteq \mathcal{V}$ bir üreteç kümesi ise, $\mathcal{V}$'nin $Y$ kümesi içinde kalan bir tabanı vardır.

Koordinat Kavramı

$$\mathbf{x} = x_1\mathbf{b}_1+\ldots+x_n\mathbf{b}_n$$

olacak şekilde $x_1,\ldots,x_n\in\mathbb{F}$ skalerleri bulunabilir. $\{\mathbf{b}_1,\ldots,\mathbf{b}_n\}$ kümesi lineer bağımsız olduğundan yukarıdaki eşitlikteki $x_1,\ldots,x_n$ skalerleri tek türlü belirlidir. Bu tek türlü belirli $x_1,\ldots,x_n$ skalerleri, $\mathbf{x}$'in $\mathcal{B}$ tabanına göre koordinatları olarak adlandırılır ve

$$[\mathbf{x}]_\mathcal{B} = \begin{pmatrix} x_1 \\ \vdots \\ x_n \end{pmatrix}$$

şeklinde bir koordinat matrisi ile gösterilir.

$$[\mathbf{x}]_\mathcal{C} = \begin{pmatrix} y_1 \\ \vdots \\ y_n \end{pmatrix}$$

biçiminde bir sütun matrisidir. Burada akla gelebilecek bir soru $[\mathbf{x}]_\mathcal{B}$ ve $[\mathbf{x}]_\mathcal{C}$ koordinat matrisleri arasında nasıl bir ilişki olduğudur. Bu ilişkiyi bulmak için $\mathbf{c}_i$'lerin $\mathcal{B}$ tabanına göre koordinatlarını bulabiliriz:

$$\mathbf{c}_i = c_{1i}\mathbf{b}_1+\ldots+c_{ni}\mathbf{b}_n,$$

yani

$$[\mathbf{c}_i]_\mathcal{B} = \begin{pmatrix} c_{1i} \\ \vdots \\ c_{ni} \end{pmatrix}$$

olsun. Buna göre

$$\mathbf{x}=\sum_{i=1}^n y_i \mathbf{c}_i=\sum_{i=1}^n \sum_{j=1}^{n} c_{ji} y_i \mathbf{b}_j=\sum_{j=1}^{n} \left( \sum_{i=1}^{n} c_{ji} y_i \right) \mathbf{b}_j$$

eşitlikleri yazılabilir.

$$x_j=\sum_{i=1}^{n} c_{ji} y_i=(c_{j1}\ldots c_{jn})\begin{pmatrix} y_1 \\ \vdots \\ y_n \end{pmatrix}$$

olur. Dolayısıyla $P=[c_{ij}]$ denirse

$$[\mathbf{x}]_\mathcal{B} = P[\mathbf{x}]_\mathcal{C}$$

eşitliği elde edilir. Bu eşitlik sayesinde $\mathcal{B}$ ve $\mathcal{C}$ tabanlarına göre olan koordinatlar arasında geçiş yapabiliriz. Bu nedenle, yukarıdaki gibi elde edilen $P$ matrisine, $\mathcal{C}$ tabanından $\mathcal{B}$ tabanına geçiş matrisi denir. $P$ geçiş matrisi tersinirdir -yani $P\cdot P^{-1}=P^{-1}\cdot P=\mathbb{I}_n$ olacak şekilde bir (ve yalnız bir tek) $P^{-1}$ kare matrisi vardır- ve $P^{-1}$ matrisi de bir geçiş matrisidir: $\mathcal{B}$ tabanına göre olan koordinatları $\mathcal{C}$ tabanına göre olan koordinatlara dönüştürür. Başka bir deyişle,

$$[\mathbf{x}]_\mathcal{C} = P^{-1}[\mathbf{x}]_\mathcal{B}$$

eşitliği sağlanır.

Lineer Dönüşümler

$\cv$, n-boyutlu bir $\ff$-uzayı ve $\cb=\{\vek b_1,\ldots,\vek b_n\}$, $\cv$'nin bir tabanı olsun.

$$\begin{align*} \phi:\mathcal{V} &\to \mathbb{F}^n \\ \mathbf{x} &\mapsto [\mathbf{x}]_\mathcal{B}^t \end{align*}$$

şeklinde tanımlanan $\phi$ fonksiyonunu ele alalım. (Burada $t$ ile transpoz alma işlemi belirtilmiştir.) Dikkat edilirse, her $\mathbf{x},\mathbf{y}\in \mathcal{V}$ için

$$\begin{align*} \phi(\mathbf{x}+\mathbf{y}) &= [\mathbf{x}+\mathbf{y}]_\mathcal{B}^t = [\mathbf{x}]_\mathcal{B}^t + [\mathbf{y}]_\mathcal{B}^t = \phi(\mathbf{x})+\phi(\mathbf{y}), \\ \phi(a\cdot \mathbf{x}) &= [a\cdot \mathbf{x}]_\mathcal{B}^t = a\cdot [\mathbf{x}]_\mathcal{B}^t = a\cdot \phi(\mathbf{x}) \end{align*}$$

olur. Buna göre $\phi$, $\mathcal{V}$ uzayındaki vektörleri, cebirsel yapıyı koruyarak, $\mathbb{F}^n$ uzayına taşıyan bir dönüşümdür. Böyle dönüşümlere lineer dönüşümler denir.

Tanım 1.6: Lineer Dönüşüm

$\mathcal{V}$ ve $\mathcal{W}$ iki $\mathbb{F}$-uzayı olsun. Eğer bir $\phi:\mathcal{V}\to\mathcal{W}$ fonksiyonu aşağıdaki özellikleri sağlıyorsa, $\phi$'ye bir lineer dönüşüm denir:

$\forall \mathbf{x},\mathbf{y}\in \mathcal{V},\ \phi(\mathbf{x}+\mathbf{y}) = \phi(\mathbf{x})+\phi(\mathbf{y})$,
$\forall a\in\mathbb{F}, \mathbf{x}\in \mathcal{V},\ \phi(a\cdot \mathbf{x}) = a\cdot \phi(\mathbf{x})$

Eğer bir $\phi:\mathcal{V}\to \mathcal{W}$ lineer dönüşümü birebir ise $\phi$'ye gömme dönüşümü denir. Eğer $\phi$ hem birebir hem de örten ise $\phi$'ye bir izomorfizma denir.

Dikkat edilirse, yukarıdaki $\phi$ fonksiyonu, bir izomorfizmadır. Buna göre her $n$-boyutlu $\mathbb{F}$-uzayı, $\mathbb{F}^n$ uzayına izomorftur.

Her $a\in\mathbb{F}$ ve $\phi,\psi\in\mathscr{L}(\mathcal{V},\mathcal{W})$ için

$$\begin{align*} \phi+\psi :& \mathcal{V} \to \mathcal{W} \\ &\ \mathbf{x} \mapsto \phi(\mathbf{x})+\psi(\mathbf{x}) \\ \end{align*}$$ $$\begin{align*} a\cdot\phi :& \mathcal{V} \to \mathcal{W} \\ & \ \mathbf{x} \mapsto a\cdot \phi(\mathbf{x}) \end{align*}$$

şeklinde tanımlanan işlemler ile $\mathscr{L}(\mathcal{V},\mathcal{W})$, bir $\mathbb{F}$-uzayı olur. Bu uzaya lineer dönüşümler uzayı denir. $\mathscr{L}(\mathcal{V},\mathcal{W})$ lineer dönüşümler uzayının sıfır elemanı,

$$\mathbf{0}_{\mathscr{L}(\mathcal{V},\mathcal{W})}:\mathcal{V}\to\mathcal{W},\ \mathbf{x}\mapsto \mathbf{0}_\mathcal{W}$$

şeklinde tanımlanan dönüşümdür.

$$[\phi(\mathbf{x})]_\mathcal{C} = A\cdot [\mathbf{x}]_\mathcal{B}$$

şeklinde bir $A$ matrisi vardır. Burada $A$, sütunları $\phi(\mathbf{b}_1),\ldots,\phi(\mathbf{b}_n)$'in $\mathcal{C}$ tabanına göre koordinat matrisleridir. Yani

$$A = \begin{pmatrix} [\phi(\mathbf{b}_1)]_\mathcal{C} & \ldots & [\phi(\mathbf{b}_n)]_\mathcal{C} \end{pmatrix}$$

şeklinde bir $m\times n$ matrisidir. Bu $A$ matrisi $\phi$'nin $(\mathcal{B},\mathcal{C})$ taban çiftine göre matris temsili olarak adlandırılır ve $\mathcal{M}_{\phi}^{\mathcal{B},\mathcal{C}}$ ile gösterilir.

$\phi:\cv\to\cw$ lineer dönüşümü, aynı zamanda, her $\vek x\in\cv$ için $[\phi(\vek x)]_\mathcal{C}= \mathcal{M}_{\phi}^{\cb,\mathcal{C}}\cdot [\vek x]_\cb$ eşitliğini sağlar.
Eğer $A\in\ff^{m\times n}$ ise her $\vek x\in\cv$ için $[\phi(\vek x)]_\mathcal{C}= A\cdot [\vek x]_\cb$ olacak şekilde tanımlı bir $\phi:\cv\to\cw$ lineer dönüşümü vardır ve bu $\phi$ dönüşümünün matris temsili $\mathcal{M}_{\phi}^{\cb,\mathcal{C}}=A$ olur.
Özel olarak her $\phi:\ff^n\rightarrow\ff^m$ lineer dönüşümü, bir $m\times n$ matrisi ile temsil edilebilir. Eğer her iki vektör uzayının da standart tabanları kullanılırsa, $\phi$ dönüşümünün matris temsili, $\ff^n$'nin $i$-inci standart taban vektörü $\vek e_i$ için $\phi(\vek e_i)$'nin $i$-yinci sütuna yerleştirildiği $m\times n$ matristir.
Tersine, her $A\in\ff^{m\times n}$ matrisine karşılık gelen bir $\phi:\ff^n\rightarrow\ff^m$ lineer dönüşümü vardır.
Kolayca görülebilir ki her $a\in\ff$ ve $\phi,\psi\in\mathscr{L}(\cv,\cw)$ için$$\begin{equation*} \mathcal{M}_{\phi+\psi}^{\cb,\mathcal{C}} = \mathcal{M}_{\phi}^{\cb,\mathcal{C}} + \mathcal{M}_{\psi}^{\cb,\mathcal{C}},\quad \mathcal{M}_{a\cdot\phi}^{\cb,\mathcal{C}} = a\cdot \mathcal{M}_{\phi}^{\cb,\mathcal{C}} \end{equation*}$$
eşitlikleri sağlanır. Dolayısıyla
$$\begin{align*} \Phi:\mathscr{L}(\cv,\cw) &\to \ff^{m\times n} \\ \phi &\mapsto \mathcal{M}_{\phi}^{\cb,\mathcal{C}} \end{align*}$$
dönüşümü bir lineer dönüşümdür. Öte yandan $\Phi$ dönüşümünün birebir ve örten olduğu kolayca görülebilir. Dolayısıyla $\Phi$ bir izomorfizmadır. Bu nedenle $\mathscr{L}(\cv,\cw)$ uzayı, $\ff^{m\times n}$ matrisler uzayına izomorftur. Özel olarak $\dim_\ff(\mathscr{L}(\cv,\cw)) = n \cdot m$ olur.
Eğer $\phi:\cv\to\cw$ lineer dönüşümü birebir ise, $\mathcal{M}_{\phi}^{\cb,\mathcal{C}}$ matrisinin sütunları lineer bağımsızdır. Buna göre $\mathcal{M}_{\phi}^{\cb,\mathcal{C}}$ matrisinin rankı $n$ olur.
Eğer $\phi$ bir izomorfizma ise $n=m=\rank(\mathcal{M}_{\phi}^{\cb,\mathcal{C}})$ ve böylece $\mathcal{M}_{\phi}^{\cb,\mathcal{C}}$ matrisi tersinirdir. Ayrıca, bu durumda, $$\left(\mathcal{M}_{\phi}^{\cb,\mathcal{C}}\right)^{-1}=\mathcal{M}_{\phi^{-1}}^{\mathcal{C},\cb}$$olur.
%Taban değişimi altında temsil matrisleri arasındaki ilişki. Eğer $\phi:\cv\to\cw$ lineer dönüşümü $(\cb,\mathcal{C})$ taban çiftine göre $\mathcal{M}_{\phi}^{\cb,\mathcal{C}}$ matrisine sahipse, $\phi$'nin$(\cb',\mathcal{C}')$ taban çiftine göre matris temsili $$\begin{equation*} \mathcal{M}_{\phi}^{\cb',\mathcal{C}'} = P\cdot \mathcal{M}_{\phi}^{\cb,\mathcal{C}} \cdot Q\end{equation*}$$
eşitliğini sağlar. Burada $P$ ve $Q$ matrisleri, sırasıyla, $\mathcal{C}$ tabanından $\mathcal{C}'$ tabanına ve $\cb'$ tabanından $\cb$ tabanına geçiş matrisleridir.

Tanım 1.7: Çekirdek ve Görüntü

$\phi:\mathcal{V}\to\mathcal{W}$ bir lineer dönüşüm olsun. $\mathcal{V}$'nin $$\ker(\phi) := \{\mathbf{x}\in\mathcal{V}\mid \phi(\mathbf{x})=\mathbf{0}_\mathcal{W}\}$$

alt kümesine $\phi$'nin çekirdeği denir.

$\phi$'nin görüntüsü ise $\mathcal{W}$ uzayının $$\operatorname{im}(\phi) = \{\phi(\mathbf{x})\mid \mathbf{x}\in\mathcal{V}\}$$

alt kümesidir.

Kolayca görülebilir ki $\ker(\phi)$, $\cv$ uzayının, $\im(\phi)$ ise $\cw$ uzayının bir alt uzayıdır.

Teorem 1.6: Çekirdek ve Görüntü Boyutları Arasındaki İlişki

$\phi:\mathcal{V}\to\mathcal{W}$ bir lineer dönüşüm ve $\dim_\mathbb{F} \mathcal{V}=n$ olsun. O zaman $$\dim_\mathbb{F} (\ker(\phi)) + \dim_\mathbb{F} (\operatorname{im}(\phi)) = n$$

eşitliği sağlanır.

Önerme 1.7

Bir $\phi:\mathcal{V}\to\mathcal{W}$ lineer dönüşümü birebirdir ancak ve ancak $\ker(\phi) = \{\mathbf{0}\}$ dır.

Not 1.1

Bir matris ile lineer dönüşüm, bir lineer dönüşüm ile de bir matris tanımlanabileceğinden bahsetmiştik. Bu nedenle lineer dönüşümler ile matrislerin teorisi birbirine paralel bir yapıdadır. Bunu ilk olarak lineer dönüşümler için tanımladığımız çekirdek ve görüntü kavramlarının matrisler üzerine nasıl aktarıldığını göstererek inceleyelim.

$A\in\mathbb{F}^{m\times n}$ olsun. O zaman $A$ matrisi ile tanımlı bir lineer dönüşüm $$\begin{align*} \phi:\mathbb{F}^n &\to \mathbb{F}^m \\ \mathbf{x} &\mapsto A\mathbf{x} \end{align*}$$

şeklinde elde edilir. $A$ matrisinin çekirdeği, bu $\phi$ dönüşümünün çekirdeği olarak tanımlanır:

$$\ker(A):=\ker(\phi) = \{\mathbf{x}\in\mathbb{F}^n \mid A\mathbf{x} = \mathbf{0}\}$$

Dolayısıyla $\ker(A)$, $\mathbb{F}^n$'nin bir alt uzayıdır. Bu alt uzaya bazı kaynaklarda $A$ matrisinin sıfır uzayı (null space) denir. $\dim_\mathbb{F}(\ker(A))$ ise $A$ matrisinin sıfırlığı (nullity) olarak adlandırılır ve $\operatorname{null}(A)$ ile gösterilir.

Benzer şekilde, $A$ matrisinin görüntüsü, bu $\phi$ dönüşümünün görüntüsü olarak tanımlanır:

$$\operatorname{im}(A):=\operatorname{im}(\phi) = \{A\mathbf{x} \mid \mathbf{x}\in\mathbb{F}^n\}$$

Dolayısıyla $\operatorname{im}(A)$, $\mathbb{F}^m$'nin bir alt uzayıdır. Dikkat edilirse bu alt uzay $A$ matrisinin sütunlarının $\mathbb{F}^m$ içinde gerdiği alt uzaydır. O nedenle $\operatorname{im}(A)$ uzayına aynı zamanda $A$'nın sütun uzayı da denmektedir.

$$\dim_\mathbb{F}(\operatorname{im}(A))$$

boyutuna $A$ matrisinin rankı denir. Buna göre $\operatorname{rank}(A) + \operatorname{null}(A) = n$ eşitliği sağlanır.

Diğer taraftan, $\phi:\mathcal{V}\to\mathcal{W}$ bir lineer dönüşüm ve $\dim_\mathbb{F} \mathcal{V}=n$ ise o zaman $\mathcal{V}$ ve $\mathcal{W}$ uzaylarının, sırasıyla, $\mathcal{B}$ ve $\mathcal{C}$ gibi herhangi iki tabanı için $\ker(\phi)$ ve $\operatorname{im}(\phi)$ alt uzaylarının boyutları, $\dim_\mathbb{F} \ker(\phi) = n-\operatorname{rank}(\mathcal{M}_{\phi}^{\mathcal{B},\mathcal{C}})$ ve $\dim_\mathbb{F} \operatorname{im}(\phi) = \operatorname{rank}(\mathcal{M}_{\phi}^{\mathcal{B},\mathcal{C}})$ eşitlikleri ile hesaplanabilir. Özel olarak, $\operatorname{null}(\mathcal{M}_{\phi}^{\mathcal{B},\mathcal{C}}) + \operatorname{rank}(\mathcal{M}_{\phi}^{\mathcal{B},\mathcal{C}}) = n$ eşitliği sağlanır.

Bölüm Uzayları ve İzomorfizma Teoremleri

$\mathcal{V}$ bir vektör uzayı ve $\mathcal{W}\subseteq \mathcal{V}$ bir alt uzay olsun. $\mathcal{W}$, $(\mathcal{V},+)$ toplamsal değişmeli grubunun

bir alt grubu olduğundan $\mathcal{V}/\mathcal{W}$ bölüm grubu tanımlıdır. Buna göre $\mathcal{V}/\mathcal{W}$, $\mathcal{W}$'nun $\mathcal{V}$ içindeki kosetlerinin kümesidir:

$$\mathcal{V}/\mathcal{W} =\{\mathbf{x}+\mathcal{W}\mid \mathbf{x}\in\mathcal{V}\}$$

Ayrıca her $\mathbf{x} + \mathcal{W},\mathbf{y} + \mathcal{W}\in\mathcal{V}/\mathcal{W}$ için

$$\mathbf{x} + \mathcal{W} = \mathbf{y} + \mathcal{W} \iff \mathbf{x} - \mathbf{y} \in \mathcal{W}$$ $$\left(\mathbf{x} + \mathcal{W}\right) + \left(\mathbf{y} + \mathcal{W}\right) = \left(\mathbf{x} + \mathbf{y}\right) + \mathcal{W}$$

olur.

şeklinde bir skalerle çarpma işlemi tanımlanırsa, $\mathcal{V}/\mathcal{W}$ bir $\mathbb{F}$-uzayı olur.

Not 1.2

Eğer $\mathcal{V}$ bir sonlu boyutlu vektör uzayı ise, $\mathcal{V}/\mathcal{W}$ bölüm uzayı da sonlu boyutludur ve $\dim_\mathbb{F} \mathcal{V}/\mathcal{W} \le \dim_\mathbb{F} \mathcal{V}$ eşitsizliği sağlanır. Aslında $\mathcal{B}_{\mathcal{W}}=\{\mathbf{w}_1,\ldots,\mathbf{w}_k\}$ kümesi $\mathcal{W}$ alt uzayının bir tabanı ise $\mathcal{V}$ uzayının bir $\mathcal{B}_{\mathcal{V}}=\{\mathbf{w}_1,\ldots,\mathbf{w}_k,\mathbf{v}_1,\ldots,\mathbf{v}_m\}$ tabanına genişletilebilir. Buna göre $\{\mathbf{v}_1+\mathcal{W},\ldots,\mathbf{v}_m+\mathcal{W}\}$ kümesi $\mathcal{V}/\mathcal{W}$ bölüm uzayının bir tabanıdır. Özel olarak,

$$\dim_\mathbb{F}(\mathcal{V})=k+m=\dim_\mathbb{F}(\mathcal{W})+\dim_\mathbb{F}(\mathcal{V}/\mathcal{W})$$

olduğu görülür.

$\cv$ bir vektör uzayı ve $\cw$, $\cv$'nin bir alt uzayı olsun. O zaman

$$\phi:\mathcal{V}\to\mathcal{V}/\mathcal{W},$$

her $\mathbf{x}\in\mathcal{V}$ için $\phi(\mathbf{x}) = \mathbf{x} + \mathcal{W}$ şeklinde tanımlı örten bir lineer dönüşüm vardır. Bu dönüşümün çekirdeği $\mathcal{W}$ alt uzayıdır. Özel olarak bu dönüşüme bir doğal izdüşüm denir.

Teorem 1.8: İzomorfizma Teoremleri

$\phi:\mathcal{V}\to\mathcal{W}$ bir lineer dönüşüm olsun. O zaman $$\operatorname{im}(\phi)\cong \mathcal{V}/\ker(\phi)$$
dir.
$\mathcal{V}$ bir vektör uzayı ve $\mathcal{W}$ ile $\mathcal{U}$, $\mathcal{V}$'nin alt uzayları olsun. Eğer $\mathcal{W}\subseteq \mathcal{U}$ ise, $$(\mathcal{V}/\mathcal{W})/(\mathcal{U}/\mathcal{W})\cong \mathcal{V}/\mathcal{U}$$
olur.
$\mathcal{V}$ bir vektör uzayı ve $\mathcal{W}$ ile $\mathcal{U}$, $\mathcal{V}$'nin alt uzayları olsun. O zaman $$(\mathcal{U}+\mathcal{W})/\mathcal{U}\cong \mathcal{W}/(\mathcal{U}\cap\mathcal{W})$$
olur.

Dik Çarpım ve Dik Toplamlar

$$\begin{align*} (\mathbf{x}_1,\ldots,\mathbf{x}_k) + (\mathbf{y}_1,\ldots,\mathbf{y}_k) &= (\mathbf{x}_1+\mathbf{y}_1,\ldots,\mathbf{x}_k+\mathbf{y}_k), \\ a\cdot (\mathbf{x}_1,\ldots,\mathbf{x}_k) &= (a\cdot \mathbf{x}_1,\ldots,a\cdot \mathbf{x}_k) \end{align*}$$

şeklinde tanımlayarak yeni bir $\mathbb{F}$-uzayı elde edebiliriz. Bu uzaya $\mathcal{V}_1,\ldots,\mathcal{V}_k$ uzaylarının dik çarpımı denir. Zermelo-Freankel küme teorisi çerçevesinde, seçme aksiyomunu kabul ederek, dik çarpım uzaylarını keyfi sayıda $\mathbb{F}$-uzayı için de tanımlayabiliriz. Yani $\{\mathcal{V}_i\}_{i\in I}$, $\mathbb{F}$-uzaylarının bir ailesi ise

$$\prod_{i\in I} \mathcal{V}_i =\left\{ f:I\to \bigcup_{i\in I} \mathcal{V}_i \ \bigg|\ \text{ her } i\in I \text{ için } f(i)\in \mathcal{V}_i\right\}$$

kümesi boştan farklıdır ve her $f,g\in\prod_{i\in I}\mathcal{V}_i$ ve $a\in\mathbb{F}$ için

$$(f+g)(i) = f(i) + g(i),\quad (a\cdot f)(i) = a\cdot f(i)$$

şeklinde tanımlı işlemlerle, $\prod_{i\in I}\mathcal{V}_i$ kümesi bir $\mathbb{F}$-uzayı olur. Bu uzaya $\{\mathcal{V}_i\}_{i\in I}$ ailesinin dik çarpım uzayı denir. Bu noktada, $\prod_{i\in I}\mathcal{V}_i$ kümesinin elemanları olarak $I$ indeksi üzerinden tanımlanan fonksiyonları daha kullanışlı bir gösterim ile değiştirebiliriz: $f\in\prod_{i\in I}{\mathcal{V}_i}$ olmak üzere her $i\in I$ için $x_i=f(i)\in \mathcal{V}_i$ olarak tanımlarsak,

$$(x_i)_{i\in I}+(y_i)_{i\in I}=(x_i+y_i)_{i\in I},\quad a\cdot (x_i)_{i\in I}=(a\cdot x_i)_{i\in I}$$

eşitlikleri yazılabilir.

$\prod_{i\in I}\cv_i$ uzayının dik toplam uzayı adı verilen çok özel bir alt uzayı vardır: $$\begin{equation} \label{eq:dir_sum} \bigoplus_{i\in I}\cv_i = \left\{ (x_i)_{i\in I} \in \prod_{i\in I}\cv_i \ \bigg| \ \text{en fazla sonlu tane } i\in I \text{ hariç her }i\text{ için } x_i=0\right\}\tag{1} \end{equation}$$ $\bigoplus_{i\in I}\cv_i$'nin, $\prod_{i\in I}\cv_i$ uzayının bir alt uzayı olduğunu görmek zor değildir.

Her $j\in I$ için

$$\begin{equation} \cv'_j = \bigoplus_{\substack{i\in I \\ i\neq j}} \cv_i \end{equation}$$

alt uzayı tanımlansın. Buna göre

$\sum_{i\in I} \cv'_i = \bigoplus_{i\in I} \cv_i$,
Her $j\in I$ için $\cv_j \cap \cv'_j = \{\vek 0\}$

olduğu görülür. Bu özellikler, bir dik toplam uzayı için belirleyici niteliktedir. Daha açık söylemek gerekirse, eğer bir $\cv$ vektör uzayı için

$\cv = \sum_{i\in I} \cv_i$ ve
Her $j\in I$ için $$\cv_j \cap \left(\sum_{\substack{i\in I \\ i\neq j}} \cv_i\right) = \{\vek 0\}$$

olacak şekilde $\cv$'nin bir $\{\cv_i\}_{i\in I}$ alt uzay ailesi varsa o zaman $\cv$ uzayı bir dik toplam uzayına izomorf olur.

Gerçekten,

$$\begin{array}{rrcl} \phi: & \cv & \longrightarrow & \displaystyle\prod_{i\in I} \cv_i \\ &\displaystyle \sum_{\substack{i\in I \\ \text{sonlu}}} x_i & \longmapsto & (x_i)_{i\in I} \end{array}$$

tanımlanırsa (1) koşulu ile $\phi$, $\cv$'nin her elemanı için tanımlıdır. (2) koşulu ile de $\phi$ iyi tanımlı olur. Öte yandan $\phi$'nin birebir oluşu, tümüyle, $\prod_{i\in I} \cv_i$ uzayının elemanlarının yapısı ile ilgilidir. Son olarak, $\im(\phi)=\bigoplus_{i\in I} \cv_i$'dir. Bu durumda $\cv$'yi $\im(\phi)$ ile özdeşleştirerek onu bir dik toplam uzayı olarak değerlendirebiliriz ve buna mukabil $\cv = \bigoplus_{i\in I} \cv_i$ yazabiliriz. Bu yazım bazı kaynaklarda bir iç dik toplam olarak anılır. Aynı kaynaklar ( \ref{eq:dir_sum} ) ile tanımlanan dik toplamı da dış dik toplam olarak adlandırır. Biz bu iki dik toplamı birbirinden ayırt etmeden her ikisini de sadece dik toplam şeklinde ifade edeceğiz.

$\cv$ bir vektör uzayı ve $\cv = \sum_{i\in I} \cv_i$ olsun. Her $i\in I$ için $\cb_i$, $\cv_i$ alt uzayının bir tabanı olsun.

O zaman $\cv = \bigoplus_{i\in I} \cv_i$ ancak ve ancak

$\cb_j\cap\left(\bigcup_{\substack{i\in I \\ i\neq j}} \cb_i\right) = \emptyset$ ve
$\bigcup_{i\in I} \cb_i$ kümesi $\cv$'nin bir tabanıdır.

Özel olarak $\cv$ uzayının bir $\cb$ tabanı için $\cb = \cb_1 \cup \cb_2$ ve $\cb_1\cap\cb_2=\emptyset$ ise $\cv_1 = \langle \cb_1 \rangle$ ve $\cv_2 = \langle \cb_2 \rangle$ olmak üzere $\cv = \cv_1 \oplus \cv_2$ olur.

Örnek 1.9

Bir $A\in\mathbb{F}^{n\times n}$ kare matrisi için eğer $A^t=A$ (veya $A^t=-A$) ise $A$'ya simetrik matris (veya antisimetrik matris) denir.

Dikkat edilirse, simetrik ve antisimetrik matrisler, $\mathbb{F}^{n\times n}$ uzayının birer alt uzayını oluşturur.

$\text{Sym}_n(\mathbb{F})$ ile gösterilen simetrik matrisler uzayı için $$\dim_\mathbb{F}(\text{Sym}_n(\mathbb{F})) = \frac{n(n+1)}{2}$$

ve $\text{ASym}_n(\mathbb{F})$ ile gösterilen antisimetrik matrisler uzayı için

$$\dim_\mathbb{F}(\text{ASym}_n(\mathbb{F})) = \frac{n(n-1)}{2}$$

eşitlikleri sağlanır. (Nedenini araştırınız.)

Araştırınız

$\text{Sym}_n(\mathbb{F})$ için $\{e_{ij}+e_{ji}\mid 1\le i < j \le n\}\cup \{e_{ii}\mid 1\le i \le n\}$ kümesi bir tabandır.
$\text{ASym}_n(\mathbb{F})$ için $\{e_{ij}-e_{ji}\mid 1\le i < j \le n\}$ kümesi bir tabandır.

Öte yandan her $A\in\mathbb{F}^{n\times n}$ için

$$A=\frac{1}{2}(A+A^t)+\frac{1}{2}(A-A^t),\quad \frac{1}{2}(A+A^t)\in\text{Sym}_n(\mathbb{F}),\quad \frac{1}{2}(A-A^t)\in\text{ASym}_n(\mathbb{F})$$

olduğundan $\mathbb{F}^{n\times n} = \text{Sym}_n(\mathbb{F}) + \text{ASym}_n(\mathbb{F})$ eşitliğini yazabiliriz. Ayrıca $\text{Sym}_n(\mathbb{F})\cap \text{ASym}_n(\mathbb{F}) = \{\mathbf{0}_{n\times n}\}$ olduğundan $\mathbb{F}^{n\times n} = \text{Sym}_n(\mathbb{F}) \oplus \text{ASym}_n(\mathbb{F})$ olur.

Yukarıdaki örneği genelleştirerek, her $A\in\mathbb{F}^{m\times n}$ matrisi için $A = \frac{1}{2}(A+A^t) + \frac{1}{2}(A-A^t)$

Kendimizi sınayalım

Kısa sınav

⚠️ Quiz cevaplamak için giriş yapmalısınız. Giriş Yap.