Eine Funktion \(f\) ist
- surjektiv (onto), wenn jedes Element des Wertebereichs im Bild von \(f\) liegt.
- injektiv (one-to-one), wenn jedes Element im Bild von \(f\) genau ein Urbild hat. Also wenn keine zwei Elemente im Definitionsbereich das gleiche Bild haben, d.h. wenn \(a\neq b\) impliziert, dass \(f(a)\neq f(b)\) .
Strukturerhaltung
FĂŒr algebraische Strukturen sind besonders die strukturerhaltenden Abbildungen zwischen ihnen interessant.
Lineare Abbildungen zwischen VektorrÀumen sind strukturerhaltend in dem Sinne, dass sie sich mit der Addition und Skalarmultiplikation des Vektorraums vertragen, d.h. Linearkombinationen wieder auf Linearkombinationen abbilden, und intrinsische Eigenschaften der Vektoren (wie Verschiedenheit und lineare UnabhÀngigkeit) erhalten blieben.
Genauer gesagt ist eine Funktion \(f\) linear, wenn gilt:
- \(f(x+x')=f(x)+f(x')\)
- \(f(cx)=cf(x)\)
Eine Abbildung zwischen metrischen RĂ€umen \((X,d_X)\) und \((Y,d_Y)\) ist isometrisch, wenn sie die Metrik erhĂ€lt (d.h. der Abstand zweier Bildpunkte ist gleich dem Abstand ihrer Urbildpunkte): $$d_Y(f(x),f(y)) = d_X(x,y) \quad\text{fĂŒr alle }x,y\in X$$ Jede isometrische Abbildung ist stetig (sogar gleichmĂ€Ăig stetig).
Stetigkeit ist auch eine Art der Strukturerhaltung: Sie erhÀlt die NÀhe zwischen Elementen in topologischen RÀumen.
Stetigkeit
Die Stetigkeit einer Funktion in einem Punkt ist eine lokale Eigenschaft, d.h. sie hÀngt nur vom Verhalten der Funktion in einer Umgebung des Punktes ab.
Abbildungen zwischen topologischen RĂ€umen
Wir betrachten Abbildungen \(f:X\to Y\) zwischen topologischen RĂ€umen \(X\) und \(Y\) .
Topologisch bedeutet Stetigkeit einer Funktion, dass sie die NÀhe zwischen Elementen erhÀlt, also im Sinne der Topologie strukturerhaltend ist. Das kann mithilfe von Umgebungen definiert werden.
Stetigkeit vererbt auch andere Eigenschaften; wenn z.B. die Urbildmenge einer stetigen Abbildung kompakt oder zusammenhÀngend ist, so ist es die Bildmenge auch.
Umgebungskriterium
\(f:M\to Y\) ist stetig im Punkt \(p\in M\) genau dann, wenn es zu jedem \(\varepsilon > 0\) eine Umgebung \(U_\varepsilon(p)\) gibt, so dass fĂŒr alle \(u\in U\) gilt, dass \(d(f(u), f(p)) < \varepsilon\) .
Anders ausgedrĂŒckt ist \(f\) genau dann stetig in \(p\) , wenn gilt:
- Zu jeder Umgebung \(V\) von \(f(p)\) gibt es eine Umgebung \(U\) von \(p\) , so dass \(f(U\cap M)\subseteq V\) (d.h. fĂŒr alle \(x\in U\cap M\) gilt, dass \(f(x)\in V\) ).
- FĂŒr jede Umgebung \(V\) von \(f(p)\) ist die Menge \(f^{-1}(V)\) eine Umgebung von \(p\) .
- FĂŒr alle offenen Mengen \(U\) ist \(f^{-1}(U)\) offen in M. (Die Urbilder offener Mengen sind offen. Das gilt analog auch fĂŒr abgeschlossene Mengen.)
Abbildungen zwischen metrischen RĂ€umen
Wir betrachten Abbildungen \(f:X\to Y\) zwischen metrischen RĂ€umen \((X,d_X)\) und \((Y,d_Y)\) (oder auch zwischen normierten RĂ€umen \((X,\|\cdot\|_X)\) und \((Y,\|\cdot\|_Y)\) mit \(d(a,b)=\|a-b\|\) ).
Folgenkriterium
\(f\) ist stetig in \(p\) , wenn fĂŒr jede Folge \((x_n)\) in \(X\) mit \(\lim_{n\to\infty} x_n = p\) gilt: $$\lim_{n\to\infty} f(x_n) = f(\lim_{n\to\infty} x_n) = f(p)$$
\(\varepsilon-\delta\) -Kriterium
Hinreichend kleine Ănderungen des Arguments ziehen nur beliebig kleine Ănderungen des Funktionswertes nach sich.
\(f\) ist stetig in \(p\) , wenn es fĂŒr alle \(\varepsilon > 0\) ein \(\delta > 0\) gibt, so dass fĂŒr alle \(x\in X\) gilt: $$d_X(x,p) < \delta \Rightarrow d_Y(f(x),f(p)) < \varepsilon$$
Das garantiert Approximierbarkeit der Funktion: FĂŒr jeden maximalen Fehler \(\varepsilon\) und eine Stelle \(p\) findet man ein \(\delta\) , so dass sich jeder Funktionswert \(f(x)\) fĂŒr Argumente \(x\) in der Umgebung \(U_\delta(p)\) um maximal \(\varepsilon\) von \(f(p)\) unterscheiden.
StÀrkere Arten von Stetigkeit
GleichmĂ€Ăige Stetigkeit
\(f\) ist gleichmĂ€Ăig stetig, wenn es fĂŒr alle \(\varepsilon > 0\) ein \(\delta > 0\) gibt, so dass fĂŒr alle \(x,y\in X\) gilt: $$d_X(x,y) < \delta \Rightarrow d_Y(f(x),f(y)) < \varepsilon$$
\(\delta\) ist also global und hĂ€ngt nicht mehr von der Stelle der Funktion ab. Das entspricht einer gleichmĂ€Ăigen Approximierbarkeit.
(Links: Stetigkeit, rechts: gleichmĂ€Ăige Stetigkeit. Quelle: Serlo)
Lipschitz-Stetigkeit
\(f\) ist Lipschitz-stetig mit Lipschitz-Konstante \(L\) (oder dehnungsbeschrĂ€nkt), wenn fĂŒr alle \(p,q\in X\) gilt: $$d_Y(f(p),f(q)) \leq L\cdot d_X(p,q)$$ $$\|(f(p)-f(q))\|_Y \leq L\cdot \|p-q\|_X$$
Das heiĂt, der Abstand zweier Punkte \(x,x'\) wird durch Anwendung der Funktion höchstens um den Faktor \(L\) gestreckt (wenn \(L > 1\) ) oder gestaucht (wenn \(L<1\) ).
Hölder-Stetigkeit
\(f\) ist Hölder-stetig zum Exponenten \(\alpha\in(0,\infty)\) , wenn es eine Konstante \(C>0\) gibt, so dass fĂŒr alle \(p,q\in X\) gilt: $$d_Y(f(p),f(q)) \leq C\cdot d_X(p,q)^\alpha$$ $$\|(f(p)-f(q))\|_Y \leq C\cdot \|p-q\|_X^\alpha$$
Die Stetigskeitsbegriffe lassen sich ihrer StÀrke nach ordnen:
Hölder-stetig \(\Rightarrow\) Lipschitz-stetig \(\Rightarrow\) gleichmĂ€Ăig stetig \(\Rightarrow\) stetig
Die Umkehrungen gelten im allgemeinen nicht, zum Beispiel ist \(f(x)=x^2\) stetig, aber nicht gleichmĂ€Ăig stetig.
Wichtige SĂ€tze
Ist \(M\) kompakt und \(f:M\to Y\) stetig, dann ist \(f(M)\) kompakt und \(f\) gleichmĂ€Ăig stetig.
Ist \(M\) zusammenhÀngend und \(f:M\to Y\) stetig, dann ist \(f(M)\) zusammenhÀngend.
Fortsetzbarkeit
In einem Punkt \(a\) stetig fortsetzbar? Wenn \(a\) kein HĂ€ufungspunkt, dann immer. Wenn \(a\) HĂ€ufungspunkt, dann nur wenn \(f\) in \(a\) konvergiert.
Differenzierbarkeit
Die Ableitung einer Funktion untersucht deren lokale VerĂ€nderung: Wie stark Ă€ndert sich der Funktionswert bei einer VerĂ€nderung des Eingabewerts? Das kann man verstehen als Ănderungsrate der Funktion an einer Stelle. Die Ănderungsrate entspricht der Steigung derjenigen linearen Funktion, die die Ănderung der betrachteten Funktion in dem gegebenen Punkt lokal am besten approximiert. Eine Funktion ist also an einer Stelle differenzierbar, wenn sie dort hinreichend gut linear approximiert werden kann. (Wobei linear hier bedeutet, dass die Funktion ein Polynom vom Grad \(\leq 1\) ist.)
Differenzierbarkeit in einem Punkt ist eine lokale Eigenschaft, d.h. sie hÀngt nur vom Verhalten der Funktion in einer Umgebung des Punktes ab.
Ănderungsrate und lineare Approximierbarkeit
Der Differenzenquotient ist die mittlere Ănderungsrate der Funktion auf dem Intervall \([x,a]\) , das entspricht geometrisch der Sekantensteigung: $$\frac{f(x)-f(a)}{x-a}$$ Verringert man das Intervall immer weiter, lĂ€sst also \(x\) gegen \(a\) laufen, bekommt man die lokale Ănderungsrate an der Stelle \(a\) . Das ist die Ableitung bzw. der Differentialquotient (oder Differential): der Grenzwert des Differenzenquotienten. $$f'(a) = \text{lim}_{x\to a}\frac{f(x)-f(a)}{x-a}$$ Die lokale Ănderungsrate entspricht also dem ProportionalitĂ€tsfaktor zwischen infinitesimalen Ănderungen des Eingabewertes und daraus resultierenden infinitesimalen Ănderungen des Funktionswertes.
Eine Àquivalente Formulierung ergibt sich, wenn man \(x\) durch \(a+h\) ersetzt. Der Grenzwert der Steigung der Sekanten durch die Punkte \((a,f(a))\) und \((a+h,f(a+h))\) ist dann: $$f'(a)=\text{lim}_{h\to 0}\frac{f(a+h)-f(a)}{h}$$ Das ist Àquivalent zu $$\text{lim}_{h\to 0}\frac{f(a+h)-f(a)-L(h)}{h}=0$$ Wobei \(L(h)=f'(a)\,h\) eine lineare Abbildung ist.
Diese Formulierung ist praktisch, da sie sich einfach auf mehrdimensionale Funktionen ĂŒbertragen lĂ€sst. (Im Gegensatz zur ersten: Da bei mehrdimensionalen Funktionen \(x-a\) und \(f(x)-f(a)\) Vektoren unterschiedlicher RĂ€ume sein können, ist der Quotient beider in vielen FĂ€llen gar nicht vernĂŒnftig definiert.) Das Differential ist dann die eindeutig bestimmte lineare Abbildung \(L:\mathbb{R}^n\to\mathbb{R}\) , so dass
$$\text{lim}_{h\to 0}\frac{f(a+h)-f(a)-L(h)}{\|h\|} = 0$$Und eine Funktion ist differenzierbar, wenn diese lineare Abbildung existiert. Daraus ergibt sich die Sichtweise, dass die Ableitung einer Funktion die Steigung der linearen Abbildung ist, die die Ănderung der betrachteten Funktion in dem gegebenen Punkt lokal am besten approximiert. D.h. die Ănderung des Funktionswerts \(f(x)\) hĂ€ngt annĂ€hernd linear von der Ănderung des Wertes \(x\) (von \(x\) zu \(x+h\) ) ab. Das entspricht der Vorstellung, dass die Tangente der Graph derjenigen linearen Funktion \(h\to L(h)\) ist, die \(f(a+h)âf(a)\) mit einem sehr kleinen Fehler approximiert.
Eine Funktion ist also differenzierbar in einem Punkt, wenn sie in dem Punkt “annĂ€hernd linear” ist.
Aus der Approximation \(f'(a)\approx\dfrac{f(x)-f(a)}{x-a}\) ergibt sich direkt \(f(x)\approx f(a) + f'(a)\cdot (x-a)\) . Daher kann man Differenzierbarkeit auch wie folgt definieren:
\(f:M\to \mathbb{R}^m\) ist genau dann differenzierbar in \(a\) mit der Ableitung \(c=f'(a)\in \mathbb{R}^m\) , wenn es eine Funktion \(r:M\to \mathbb{R}^m\) gibt, so dass
- \(f(x) = f(a) + c\,(x-a) + r(x)\)
- \(\lim_{x\to a}\dfrac{r(x)}{x-a} = 0\)
Hier versteht man \(f(a) + c\,(x-a)\) als lokale lineare NĂ€herung von \(f(x)\) , und \(r(x)\) als Fehler, also als Differenz zwischen dieser NĂ€herung und der eigentlichen Funktion. Die zweite Bedingung bedeutet, dass \(r\) fĂŒr \(x\to a\) schneller gegen 0 geht als \(x-a\) (und daher schneller als linear). Wenn \(x=a\) , dann ist \(r(x)=0\) .
Da \(r(x) = f(x) - f(a) - c\,(x-a)\) ist, gelten diese Bedingungen genau dann, wenn $$\lim_{x\to a}\frac{f(x) - f(a) - c\,(x-a)}{x-a}=\lim_{x\to a}\frac{f(x) - (a)}{x-a} - c = 0,$$ also wenn $$\lim_{x\to a}\frac{f(x) - f(a)}{x-a} = c = f'(a).$$
Im mehrdimensionalen Fall heiĂt das, \(f:M\to Y\) ist genau dann differenzierbar in \(a\) mit der Ableitung \(A=f'(a)\in Y\) (die Jacobi-Matrix, siehe Matrizen fĂŒr lineare Abbildung), wenn es eine Funktion \(r:M\to Y\) gibt, so dass
- \(f(x) = f(a) + A\cdot(x-a) + r(x)\)
- \(\lim_{x\to a}\dfrac{r(x)}{\|x-a\|} = 0\)
Die Wahl der Norm spielt keine Rolle, da alle Normen ĂŒber \(\mathbb{R}^n\) Ă€quivalent sind.
Das Differential wird in der Regel ĂŒber normierten RĂ€umen betrachtet, die neben einer metrischen Strukur auch eine lineare Strukur haben. In allgemeinen metrischen RĂ€umen ist eine lineare Approximation nicht immer möglich. Da kann man aber ĂŒber isometrische NĂ€herungen ein metrisches Differential definieren. (FĂŒr Anwendungen sind vor allem Funktionen ĂŒber euklidischen RĂ€umen wichtig, d.h. reellwertige Funktionen mehrerer VerĂ€nderlicher von \(\mathbb{R}^n\) nach \(\mathbb{R}\) und vektorwertige Funktionen von \(\mathbb{R}^n\) nach \(\mathbb{R}^m\) .)
Partielle und totale Differenzierbarkeit
Die partielle Differenzierbarkeit einer Funktion in einem Punkt bedeutet, dass sich die Funktion in dem Punkt lokal in einer der Koordinatenrichtungen approximieren lÀsst, aber möglicherweise durch verschiedene lineare Abbildungen. Total differenzierbar, also approximierbar durch eine einzige lineare Abbildung, ist die Funktion erst dann, wenn die partiellen Ableitungen alle stetig sind.
Differentialoperatoren
Differentialoperatoren bilden eine Funktion auf eine andere Funktion ab, die eine Ableitung enthÀlt.
Richtungsableitung
Die Richtungsableitung ist die momentane relative Ănderung des Funktionswertes \(f(x)\) , wenn sich der Wert \(x\) mit dem Vektor \(h\) fortbewegt. Sie beschreibt also das lokale Verhalten der Komponentenfunktion bei Ănderung dieser Komponente. Das Differential weist im Prinzip jedem Vektor die Richtungsableitung in Richtung des Vektors zu (und hĂ€ngt damit von der Richtung und der LĂ€nge des Vektors ab).
Operator: \(\partial_h\) fĂŒr \(f:M\to\mathbb{R}\) mit \(M\subset\mathbb{R}^n\) offen, \(a\in M,h\in\mathbb{R}^n\) und $$\partial_h f(a) := \lim_{x\to 0} \frac{f(a+xh) - f(a)}{x}$$
Partielle Ableitung
Ein Spezialfall der Richtungsableitung ist die partielle Ableitung. Die partielle Ableitung einer Funktion mehrerer VerÀnderlicher ist nichts anderes als die Ableitung der Funktion, die man erhÀlt, wenn man alle VerÀnderlichen bis auf eine festhÀlt.
Operator: \(\frac{\partial}{\partial x_i}:f\to \frac{\partial f}{\partial x_i}\)
Gradient
Der Gradient bestimmt die gröĂte Ănderungsrate, also die Richtungsbaleitung in Richtung der gröĂten Ănderung.
Differentialoperator: \(\nabla\) (grad, Vektoranalysis)
Wichtige SĂ€tze
Wenn \(f\) in einer Umgebung eines Punktes \(a\) partiell differenzierbar ist und alle partiellen Ableitungen stetig sind, dann ist \(f\) in \(a\) differenzierbar.
Wenn \(f\) in einem Punkt \(a\) differenzierbar ist, ist sie in dem Punkt auch stetig.