Seminararbeit aus Angewandter Statistik
Klassische schließende Statistik für unscharfe Daten

Inhalt

Punktschätzung für Parameter

Dieser Abschnitt befaßt sich mit einer Verallgemeinerung der Punktschätzung für den Parameter $\theta$ eines stochastischen Modells $X\sim F_{\theta },\, \theta \in \Theta$ mit dem Parameter $\theta$ und Beobachtungsraum $M_{X}$ für $X$ für unscharfe Daten.

Die Schätzfunktion $\vartheta \left( \cdot ,...,\cdot \right)$ für den Parameter $\theta$ ist eine meßbare Funktion, die den Stichprobenraum $M^{n}_{X}$ in $\Theta$ abbildet, d.h.

$\begin{displaymath} \vartheta :\mathrm{M}^{n}_{X}\rightarrow \Theta .\end{displaymath}$

Für Funktionen $\tau (\theta )$ des Parameters $\theta$ mit

$\begin{displaymath} \tau :\Theta \rightarrow \Xi =\left\{ \tau (\theta ):\theta \in \Theta \right\} \end{displaymath}$

kann eine Verallgemeinerung der Schätzfunktion für unscharfe Daten gegeben werden. In diesem Fall sind die Schätzfunktionen $t(\cdot ,...,\cdot )$ von der Form

$\begin{displaymath} t:M^{n}_{X}\rightarrow \Xi \end{displaymath}$

Beispiel 1.1:

Für eine Normalverteilung $X\sim \mathrm{N}\left( \mu ,\sigma ^{2}\right)$ gilt

$\begin{displaymath} \theta =\left( \mu ,\sigma ^{2}\right) \end{displaymath}$

Eine wichtige, zu schätzende Funktion $\tau (\theta )$ des Parameters $\theta$ ist

$\begin{displaymath} \tau (\theta )=\mu \end{displaymath}$

mit $\Theta =\{(\mu ,\sigma ^{2}):\mu \in \mathbb {R},\sigma ^{2}>0\}$ und $\Xi =\mathbb {R}$

Punktschätzung bei unscharfen Daten

Ist $\mathrm{t}(X_{1},...,X_{n})$ eine Schätzfunktion eines gerafften Parameters $\tau (\theta )\in \mathbb {R}$ basierend auf einer Stichprobe $X_{1},...,X_{n}$ einer stochastischen Größe $X$ , so erhält man für die beobachteten Werte $x_{1},...,x_{n}\in M^{n}_{X}$ einen Schätzwert

$\begin{displaymath} \widehat{\tau (\theta )}=t(x_{1},...,x_{n})\in \Xi .\end{displaymath}$

Für unscharfe Beobachtungen $x^{*}_{1},...,x^{*}_{n}$ muß eine brauchbare Verallgemeinerung einer Schätzfunktion zu einem unscharfen Schätzwert $\widehat{\tau (\theta )}^{*}$ für $\tau (\theta )$ führen.

Um einen unscharfen Schätzwert zu ermitteln, verwendet man die charakterisierenden Funktionen $\xi _{i}(\cdot )$ der Beobachtungen $x^{*}_{i},i=1(1)n$ . Diese werden mit einer passenden Regel kombiniert um so das unscharfe kombinierte Stichprobenelement $\underline{x}^{*}$ des Stichprobenraumes $M^{n}_{X}$ zu erhalten. Dieses unscharfe kombinierte Stichprobenelement ist ein unscharfer Vektor mit der vektorcharakterisierenden Funktion $\xi (\cdot ,...,\cdot )$ gegeben durch

$\begin{displaymath} \xi (x_{1},...,x_{n})=\mathcal{K}_{n}(\xi _{1}(x_{1}),...,\xi _{n}(x_{n}))\qquad \textrm{mit}\quad x_{i}\in M_{X}\end{displaymath}$

Das unscharfe kombinierte Stichprobenelement ist die Basis für die Konstruktion einer unscharfen Verallgemeinerung von Schätzfunktionen für $\theta$ bzw. $\tau (\theta )$ .

Definition 1.1:

Ist $\vartheta (X_{1},...,X_{n})$ eine Schätzfunktion für den Parameter $\theta$ eines stochastischen Modells $X\sim f(.\vert\theta ),\theta \in \Theta$ basierend auf einer Stichprobe $X_{1},...,X_{n}$ von $X$ , so ist für die unscharfen Beobachtungen $x^{*}_{1},...,x^{*}_{n}$ ein unscharfer Schätzwert $\widehat{\theta }^{*}$ für $\theta$ basierend auf dem unscharfen kombinierten Stichprobenelement $\underline{x}^{*}$ gegeben durch ein unscharfes Element $\widehat{\theta }^{*}$ des Parameterraumes mit der charakterisierenden Funktion $\psi (\cdot )$ , für die gilt

$\begin{displaymath} \psi (\theta ):=\sup \{\xi (x_{1},...,x_{n}):\vartheta (x_{1},...,x_{n})=\theta \}\qquad \forall \theta \in \Theta .\end{displaymath}$

Um das Supremum zu ermitteln, müssen alle Elemente $(x_{1},...,x_{n})$ des Stichprobenraumes berücksichtigt werden, die die Bedingung erfüllen. Verwendet man die Bezeichnung $\underline{x}=(x_{1},...,x_{n})$ , kann man anschreiben:

$\begin{displaymath} \psi (\theta )=\sup _{\underline{x}\in M^{n}_{X}}\{\xi (\underline{x}):\vartheta (\underline{x})=\theta \}\end{displaymath}$

Bemerkung:

In der Stichprobe kann auch eine genaue Beobachtung $x_{i}$ enthalten sein. In diesem Fall ist die entsprechende charakterisierende Funktion $\textrm{I}_{\{x_{i}\}}(\cdot )$ .

Abbildung

erklärt das Prinzip für eine Stichprobe mit $n=2$ unscharfen Beobachtungen.

**Abbildung:** Konstruktion der charakterisierenden Funktion eines unscharfen Schätzwertes: Für den eindimensionalen Parameter $\theta \in \Theta =\mathbb {R}\protect$ soll ein Schätzwert für den Erwartungswert ermittelt werden. Als Schätzfunktion wird das Stichprobenmittel verwendet. Um nun das Supremum $\sup _{\underline{x}\in M^{n}_{X}}\left\{ \xi (\underline{x}):\vartheta (\underline{x})=\frac{x+y}{2}=\theta \right\} \protect$ zu ermitteln, wird für jedes mögliche $\theta$ die Menge $\vartheta ^{-1}(\theta )\protect$ in die $(x_{1},x_{2})\protect$ -Ebene eingezeichnet (Verbindungslinie zwischen den Punkten $(2\theta ,0)\protect$ und $(0,2\theta )\protect$ ). Durch diese Gerade wird nun eine Ebene parallel zur $\xi (x_{1},x_{2})\protect$ -Achse aufgespannt. Innerhalb des Schnittes dieser Ebene mit dem unscharfen kombinierten Stichprobenelement muß nun das Supremum gesucht werden(Wert der vektorcharakterisierenden Funktion $\xi (\underline{x})\protect$ an der Stelle $\underline{x}_{0}\protect$ ). Dies entspricht nun dem Wert der charakterisierenden Funktion $\psi (\cdot )$ des Schätzwertes $\hat{\theta }^{*}\protect$ an der Stelle $\theta$ .
$\includegraphics {Abbildung1.1.eps}$

Beispiel 1.2:

Für das stochastische Modell $X\sim Ex_{\theta },\theta \in (0,\infty )$ , d.h. für die Exponentialverteilung mit Dichtefunktion

$\begin{displaymath} f(x\vert\theta )=\frac{1}{\theta }e^{-x/\theta }I_{(0,\infty )}(x),\end{displaymath}$

ist eine optimale Schätzfunktion (bezüglich Unverzerrtheit, Effizienz, Konsistenz und Plausibilität) für $\theta$ basierend auf einer exakten Stichprobe $X_{1},...,X_{n}$ von $X$ gegeben durch das Stichprobenmittel

$\begin{displaymath} \vartheta (X_{1},...,X_{n})=\overline{X}_{n}=\frac{1}{n}\sum _{i=1}^{n}X_{i}\end{displaymath}$

Für unscharfe Beobachtungen $x^{*}_{1},...,x^{*}_{n}$ von $X$ mit dem unscharfen kombinierten Stichprobenelement $\underline{x}^{*}$ und entsprechender vektorcharakterisierender Funktion $\xi (\cdot ,...,\cdot )$ ist die charakterisierende Funktion $\psi (\cdot )$ des unscharfen Schätzwertes $\theta ^{*}$ für $\theta$ gegeben durch

$\begin{displaymath} \psi (\theta )=\sup \{\xi (x_{1},...,x_{n}):\overline{x}_{n}=\theta \},\end{displaymath}$

wobei das Supremum über dem Stichprobenraum $M^{n}_{X}=(0,\infty )^{n}$ ermittelt werden muß.
Abbildung

zeigt eine unscharfe Stichprobe sowie die charakterisierenden Funktionen von zwei möglichen unscharfen Schätzwerten, ermittelt mit verschiedenen Kombinationsregeln.

**Abbildung:** Unscharfe Stichprobe einer Exponentialverteilung und die charakterisierenden Funktionen der Schätzwerte für den Mittelwert: Ausgehend von sechs gleichgestaltigen Beobachtungen wird ein Schätzwert für den Mittelwert berechnet. Im mittleren Bild ist das Ergebnis dargestellt, falls zur Kombination der einzelnen charakterisierenden Funktionen die Minimum-Kombinationsregel verwendet wird. Im unteren Bild wurde die Produkt-Kombinationsregel verwendet. Zu beachten ist, daß die Träger sowie die Bereiche für $\alpha \protect$ =1 übereinstimmen.
$\includegraphics {Abbildung1.2.eps}$

Punktschätzung für geraffte Parameter bei unscharfen Daten

Für Funktionen $\tau (\theta )$ der Parameter eines stochastischen Modells können durch Modifikation von Definition 1.1 unscharfe Schätzwerte gewonnen werden.

Defintion 1.2:: Unter den Annahmen von Definition 1.1 sei $t(X_{1},...,X_{n})$ eine Schätzfunktion für $\lambda =\tau (\theta )$ . Für unscharfe Beobachtungen $x^{*}_{1},...,x^{*}_{n}$ von $X$ mit dem unscharfen kombinierten Stichprobenelement $\underline{x}^{*}$ und der entsprechenden vektorcharakterisierenden Funktion $\xi (\cdot ,...,\cdot )$ ist der unscharfe Schätzwert $\lambda ^{*}=\widehat{\tau (\theta )}^{*}$ gegeben durch seine charakterisierende Funktion $\psi (\cdot )$

$\begin{displaymath} \psi (\lambda )=\sup _{\underline{x}\in M^{n}_{X}}\{\xi (\underline{x}):t(\underline{x})=\lambda \}.\end{displaymath}$

Beispiel 1.3:

Für $X\sim N(\mu ,\sigma ^{2}),\, \theta =(\mu ,\sigma ^{2})\in \Theta ,\, \tau (\theta )=\mu$ und einer unscharfen Stichprobe $x^{*}_{1},...,x^{*}_{n}$ ist die charakterisierende Funktion des unscharfen Schätzwertes $\hat{\mu }^{*}$ gegeben durch

$\begin{displaymath} \psi (\mu )=\sup _{\underline{x}\in R^{n}}\{\xi (\underline{x}):\overline{x}_{n}=\mu \}\end{displaymath}$

Ergänzende Beispiele

Beispiel 1.4:

Es ist zu zeigen, dass die gegebenen Definitionen bei exakten Daten zur Indikatorfunktion des exakten Punktschätzers führen.
Dazu betrachtet man zuerst eine der Bedingungen, die eine gültige Kombinationsregel erfüllen muß:

$\begin{displaymath} \textrm{K}_{n}(\textrm{I}_{\{\dot{x}_{1}\}}(x_{1}),...,\text... ...)=\textrm{I}_{\{(\dot{x}_{1},...,\dot{x}_{n})\}}(\underline{x})\end{displaymath}$

Wenn man nun die Indikatorfunktionen für exakte Daten verwendet, erhält man für die vektorcharakterisierende Funktion

$\begin{displaymath} \xi (\underline{x})=\textrm{K}_{n}\{\xi (x_{1}),...,\xi (x_{... ...textrm{mit}\quad \xi (\cdot )=\textrm{I}_{\{\dot{x}\}}(\cdot ).\end{displaymath}$

Für den Schätzwert ergibt sich daher

$\begin{displaymath} \psi (\theta )=\textrm{sup}\{\textrm{I}_{\{(\dot{x}_{1},...,... ...{x}_{n})\}}(\underline{x}):\vartheta (\underline{x})=\theta \}.\end{displaymath}$

Mit $\hat{\theta }=\vartheta (\dot{x}_{1},...,\dot{x}_{n})$ läßt sich dies noch vereinfachen zu

$\begin{displaymath} \psi (\theta )=\textrm{I}_{\{\hat{\theta }\}}(\theta )\qquad \textrm{q}.\textrm{e}.\textrm{d}.\end{displaymath}$

Beispiel 1.5:

Es ist zu zeigen, dass sich für Intervalldaten unabhängig von der verwendeten Kombinationsregel derselbe unscharfe Schätzwert ergibt.
Die Kombinationsregeln sind wie folgt definiert:

$\begin{displaymath} \begin{array}{ll} \xi (x_{1},...,x_{n})=\min _{i=1(1)n}\xi _... ..._{i}) & \textrm{Produkt}-\textrm{Kombinationsregel} \end{array}\end{displaymath}$

Ausgehend von der charakterisierenden Funktion für Intervalldaten $\xi (\cdot )=\textrm{I}_{[a,b]}(\cdot )$ betrachtet man die Ergebnisse der Minimum- bzw. Produkt-Kombinationsregel für zwei Beobachtungen in nachfolgender Tabelle.
Man erkennt, dass die Ergebnisse für beide Kombinationsregeln übereinstimmen, d.h. es ergibt sich die gleiche vektorcharakterisierende Funktion. Da bei der Berechnung des unscharfen Schätzwertes mit der vektorcharakterisierenden Funktion weitergerechnet wird, die verwendete Kombinationsregel aber keinerlei Berücksichtigung findet, ist auch das Endergebnis unabhängig von der verwendeten Kombinationsregel. Diese Schlußfolgerung läßt sich für beliebig viele Beobachtungen anwenden.

$\xi _{1}(x_{1})$	$\xi _{2}(x_{2})$	Min.	Prod.
0	0	0	0
0	1	0	0
1	0	0	0
1	1	1	1

Konfidenzbereiche für Parameter

Bezeichnet $P(\Theta )$ die Potenzmenge und ist $\kappa (X_{1},...,X_{n})$ eine Konfidenzfunktion mit Überdeckungswahrscheinlichkeit $1-\alpha$ für den Parameter $\theta$ basierend auf einer Stichprobe $X_{1},...,X_{n}$ der stochastischen Größe $X\sim F_{\theta },\, \theta \in \Theta$ , d.h.

$\begin{displaymath} \kappa :M^{n}_{X}\rightarrow P(\Theta ),\end{displaymath}$

so muß gelten

$\begin{displaymath} \mathrm{W}\{\theta \in \kappa (X_{1},...,X_{n})\}=1-\alpha \quad \forall \theta \in \Theta .\end{displaymath}$

Für eine konkrete beobachtete Stichprobe erhält man eine Teilmenge $\kappa (x_{1},...,x_{n)}$ von $\Theta$ .

Konfidenzbereiche bei unscharfen Daten

Im Fall von unscharfen Daten $x^{*}_{1},...,x^{*}_{n}$ erhält man durch eine Verallgemeinerung der Konfidenzbereiche eine unscharfe Teilmenge des Parameterraumes auf folgende Art:

Definition 2.1:

Ist $\xi (\cdot ,...,\cdot )$ die vektorcharakterisierende Funktion des unscharfen kombinierten Stichprobenelements und $\kappa (X_{1},...,X_{n})$ eine Konfidenzfunktion, so ist die charakterisierende Funktion $\varphi (\cdot )$ des verallgemeinerten Konfidenzbereiches gegeben durch

$\begin{displaymath} \varphi (\theta ):=\sup \{\xi (x_{1},...,x_{n}):\theta \in \kappa (x_{1},...,x_{n})\}\end{displaymath}$

wobei $(x_{1},...,x_{n})$ über den Stichprobenraum $M^{n}_{X}$ von $X$ variiert wird.

Bemerkung:

Für diesen verallgemeinerten Konfidenzbereich gilt im Fall von exakten Daten und dem klassischen Konfidenzbereich $\kappa (x_{1},...,x_{n})$ :

$\begin{displaymath} \varphi (\theta )=\textrm{I}_{\kappa (x_{1},...,x_{n})}(\theta ).\end{displaymath}$

Allgemein gilt

$\begin{displaymath} \varphi (\theta )=1\quad \forall \: \theta \in \bigcup _{(x_{1},...,x_{n}):\xi (x_{1},...,x_{n})=1}\kappa (x_{1},...,x_{n}),\end{displaymath}$

d.h die Indikatorfunktion der Vereinigung auf der rechten Seite ist immer unterhalb der charakterisierenden Funktion $\varphi (\cdot )$ des unscharfen Konfidenzintervalles. Mit der Abkürzung $\underline{x}=(x_{1},...,x_{n})$ kann man schreiben

$\begin{displaymath} \textrm{I}_{\bigcup _{\underline{x}:\xi (\underline{x})=1}\k... ...)\leq \varphi (\theta )\qquad \forall \quad \theta \in \Theta .\end{displaymath}$

Das erkennt man am einfachsten durch:

$\begin{displaymath} \begin{array}{l} \theta \in \bigcup _{\underline{x}:\xi (\un... ...{x})\}=1\quad \Rightarrow \quad \varphi (\theta )=1 \end{array}\end{displaymath}$

Beispiel 2.1:

Ein unscharfer Konfidenzbereich für den Parameter $\theta =(\mu ,\sigma ^{2})$ einer Normalverteilung basierend auf unscharfen Daten ist in Abbildung

zu sehen.

**Abbildung:** Charakterisierende Funktion eines unscharfen Konfidenzbereiches.
$\includegraphics {Abbildung2.1.eps}$

Konfidenzbereiche für geraffte Parameter bei unscharfen Daten

Für Funktionen $\lambda =\tau (\theta )$ des Parameters $\theta$ eines stochastischen Modells $X\sim F_{\theta },\theta \in \Theta$ mit gerafftem Parameterraum $\Lambda =\{\tau (\theta ):\theta \in \Theta \}$ kann das Konzept der Konfidenzbereiche ebenfalls verallgemeinert werden.

Definition 2.2:

Ist $x^{*}_{1},...,x^{*}_{n}$ eine unscharfe Stichprobe, dessen unscharfes kombiniertes Stichprobenelement $\underline{x}^{*}$ die vektorcharakterisierende Funktion $\xi (\cdot ,...,\cdot )$ aufweist, so ist für eine Konfidenzfunktion $\kappa (X_{1},...,X_{n})$ für geraffte Parameter $\lambda =\tau (\theta )$ ein verallgemeinerter Konfidenzbereich für $\lambda =\tau (\theta )$ eine unscharfe Teilmenge $\Lambda ^{*}$ von $\Lambda$ , deren charakterisierende Funktion $\psi (\cdot )$ gegeben ist durch

$\begin{displaymath} \psi (\lambda )=\sup \{\xi (x_{1},...,x_{n}):\lambda =\tau (\theta )\in \kappa (x_{1},...,x_{n})\},\end{displaymath}$

wobei für $(x_{1},...,x_{n})$ alle Werte innerhalb des Stichprobenraumes berücksichtigt werden müssen.

Bemerkung:

Für geraffte Parameter $\lambda =\tau (\theta )$ gilt ebenfalls

$\begin{displaymath} \textrm{I}_{\bigcup _{\underline{x}:\xi (\underline{x})=1}\k... ...lambda )\leq \psi (\lambda )\qquad \forall \lambda \in \Lambda \end{displaymath}$

mit $\underline{x}=(x_{1},...,x_{n})$ und $\kappa (\underline{x})=\kappa (x_{1},...,x_{n})$ .

Beispiel 2.2:

Ist $X$ eine normalverteilte, stochastische Größe und $x_{1}^{*},...,x^{*}_{n}$ eine unscharfe Stichprobe von $X$ , so soll ein verallgemeinertes Konfidenzintervall für $\tau (\mu ,\sigma ^{2})=\mu$ berechnet werden.
Ist $\xi (\cdot ,...,\cdot )$ die vektorcharakterisierende Funktion des unscharfen kombinierten Stichprobenelements, so wird die charakterisierende Funktion $\psi (\cdot )$ des verallgemeinerten Konfidenzintervalles für $\mu$ mittels eines klassischen Konfidenzintervalles $\kappa (x_{1},...,x_{n})$ für $\mu$ basierend auf den exakten Daten $x_{1},...,x_{n}$ berechnet. Für eine Überdeckungswahrscheinlichkeit von $1-\delta$ gilt

$\begin{displaymath} \kappa (x_{1},...,x_{n})=[\overline{x}_{n}-\frac{s_{n}}{\sqr... ...}_{n}+\frac{s_{n}}{\sqrt{n}}\cdot t_{n-1;1-\frac{\delta }{2}}].\end{displaymath}$

Die charakterisierende Funktion $\psi (\cdot )$ des verallgemeinerten unscharfen Konfidenzintervalles basierend auf den unscharfen Daten ist gegeben durch

$\begin{displaymath} \psi (\mu )=\sup \{\xi (\underline{x}):\mu \in [\overline{x}... ..._{n}+\frac{s_{n}}{\sqrt{n}}\cdot t_{n-1;1-\frac{\delta }{2}}]\}\end{displaymath}$

In Abbildung

ist eine unscharfe Stichprobe einer Normalverteilung und das entsprechende unscharfe Konfidenzintervall für $\mu$ dargestellt.

**Abbildung:** Unscharfe Stichprobe einer Normalverteilung und entsprechendes unscharfes Konfidenzintervall für den Parameter $\mu$ .
$\includegraphics {Abbildung2.2.eps}$

Nichtparametrische Schätzung

Die wichtigste nichtparametrische Schätzung der Verteilungsfunktion einer eindimensionalen stochastischen Größe $X$ basierend auf einer Stichprobe $X_{1},...,X_{n}$ ist die empirische Verteilungsfunktion $\hat{F}_{n}(\cdot )$ gegeben durch:

$\begin{displaymath} \hat{F}_{n}(x)=\frac{1}{n}\sum _{i=1}^{n}I_{(-\infty ,x]}(X_{i})\qquad \forall x\in \mathbb {R}\end{displaymath}$

Für unscharfe Beobachtungen $x_{1}^{*},...,x_{n}^{*}$ von $X$ sind mehrere Verallgemeinerungen möglich.

Geglättete empirische Verteilungsfunktion

Die klassische empirische Verteilungsfunktion ist eine Treppenfunktion. Um stetige Verteilungen zu schätzen, wäre eine stetige Schätzung der Verteilungsfunktion von Vorteil.

Für unscharfe Daten $x_{1}^{*},...,x_{n}^{*}$ mit charakterisierenden Funktionen $\xi _{1}(\cdot ),...,\xi _{n}(\cdot )$ ist eine stetige Schätzung der Verteilung gegeben durch

$\begin{displaymath} F_{n}^{*}(x)=\frac{1}{n}\sum _{i=1}^{n}\frac{\int _{-\infty ... ...}{\int _{-\infty }^{\infty }\xi _{i}(t)dt}\qquad \forall x\in R\end{displaymath}$

Die geglättete empirische Verteilungsfunktion ist nur dann definiert, wenn alle Beobachtungen unscharf sind.

In Abbildung ist eine unscharfe Stichprobe und die entsprechende Schätzung $F_{n}^{*}(\cdot )$ dargestellt.

**Abbildung:** Unscharfe Beobachtungen und die entsprechende geglättete empirische Verteilungsfunktion $F_{n}^{*}(\cdot )$ : Man betrachte den Bereich um die dritte Beobachtung. In den Bereichen, wo kein Träger einer Beobachtungen vorhanden ist, steigt die g.e.V. nicht an. Steigt/fällt die charakterisierende Funktion einer Beobachtung an, so krümmt sich die g.e.V. nach links/rechts, d.h. sie steigt immer stärker/weniger an. Ändert sich der Wert der charakterisierenden Funktion nicht, bleibt der Anstieg der g.e.V. konstant.
$\includegraphics {Abbildung3.1.eps}$

Intervallwertige empirische Verteilungsfunktion

Für Intervalldaten ist eine verallgemeinerte empirische Verteilungsfunktion gegeben durch

$F_{n}(x\vert x_{1}^{*},...,x_{n}^{*})=\left[ \underline{F}_{n}(x),\overline{F}_{n}(x)\right]$ mit $\underline{F}_{n}(x)\leq \overline{F}_{n}(x)\qquad \forall x\in R$

Für allgemeine unscharfe Beobachtungen $x_{1}^{*},...,x_{n}^{*}$ mit charakterisierenden Funktionen $\xi _{1}(\cdot ),...,\xi _{n}(\cdot )$ sind die Funktionen $\underline{F}_{n}(\cdot )$ und $\overline{F}_{n}(\cdot )$ auf folgende Weise definiert:

Im Fall von paarweise disjunkten Trägern $\mathrm{supp}(\xi _{i}(\cdot ))$ können die charakterisierenden Funktionen der Größe nach geordnet und als $\xi _{(i)}(\cdot ),\, i=1(1)n$ angeschrieben werden.

Im Intervall $\mathrm{supp}(\xi _{(i)}(\cdot ))\, ,\forall i$ sind die Funktionen $\underline{F}_{n}(\cdot )$ und $\overline{F}_{n}(\cdot )$ gegeben durch

$\begin{eqnarray*} \overline{F}_{n}(x) & = & \left\{ \begin{array}{cll} \frac{i-1... ...}{n} & \forall x: & \xi _{(i)}(x)\downarrow \end{array}\right. \end{eqnarray*}$

Abbildung zeigt einen Ausschnitt dieser beiden Funktionen im Intervall $\mathrm{supp}(\xi _{(i)}(\cdot ))$ einer Beobachtung sowie für eine Stichprobe mit vier unscharfen Beobachtungen die gesamte intervallwertige empirische Verteilungsfunktion $\hat{F}_{4}(\cdot \vert x_{1}^{*},...,x_{4}^{*})$ .

**Abbildung:** Intervallwertige empirische Verteilungsfunktion: Im oberen Bild sieht man die charakterisierende Funktion der i-ten Beobachtung sowie den entsprechenden Ausschnitt der i.e.V. Beide begrenzenden Funktionen beginnen auf dem Niveau $(i-1)/n\protect$ und enden auf $i/n\protect$ . Die obere begrenzende Funktion $\overline{F}_{n}(x)\protect$ steigt an, sobald die charakterisierende Funktion der Beobachtung ansteigt und zwar in der gleichen Form, allerdings gestaucht auf die Höhe $i/n\protect$ . Sobald die charakterisierende Funktion den Wert 1 erreicht hat, befindet sich $\overline{F}_{n}(x)\protect$ auf $i/n\protect$ und bleibt auf diesem Niveau. Analoges gilt für die untere begrenzende Funktion $\underline{F}_{n}(x)\protect$ , nur das diese Funktion ansteigt, wenn die charakterisierende Funktion fällt und der Anstieg gespiegelt zum Abfallen der charakterisierenden Funktion verläuft, wiederum gestaucht auf die Höhe $i/n\protect$ . Im unteren Bild sieht man eine vollständige intervallwertige empirische Verteilungsfunktion für vier Beobachtungen.
$\includegraphics {Abbildung3.2.eps}$

Bemerkung:

Für unscharfen Daten mit sich überschneidenden Trägern wird eine Überlagerung der Funktionen $\underline{F}_{n}(\cdot )$ und $\overline{F}_{n}(\cdot )$ erzeugt. Ein Beispiel dafür zeigt Abbildung

**Abbildung:** Intervallwertige empirische Verteilungsfunktion für überschneidende Träger: Die begrenzenden Funktionen werden hier analog zu Abbildung ermittelt, nur werden die Änderungen der begrenzenden Funktionen aufsummiert.
$\includegraphics {Abbildung3.3.eps}$

Anwendung der Fortpflanzung der Unschärfe

Für eine Stichprobe von $n$ unscharfen Beobachtungen einer eindimensionalen stochastischen Größe $X$ ist $\xi (\cdot ,...,\cdot )$ die vektorcharakterisierende Funktion des unscharfen kombinierten Stichprobenelements.

Die klassische empirische Verteilungsfunktion $\hat{F}_{n}(\cdot )$ , gegeben durch

$\begin{displaymath} \hat{F}_{n}(x)=\frac{1}{n}\sum _{i=1}^{n}I_{(-\infty ,x]}(x_{i})\end{displaymath}$

kann nicht direkt verwendet werden, um eine verallgemeinerte empirische Verteilungsfunktion zu konstruieren, da sie nicht stetig ist.

Eine Verallgemeinerung ist aber mittels der invertierten empirischen Verteilungsfunktion möglich:

$\begin{displaymath} \hat{F}^{-1}(k,x_{1},...,x_{n}):=inf\left\{ z\in \mathbb {R}:\hat{F}_{n}(z)=\frac{k}{n}\right\} \end{displaymath}$

Diese Funktion ist stetig in den Beobachtungen $x_{1},...,x_{n}$ . Daher erhält man für die unscharfen Daten $x_{1}^{*},...,x_{n}^{*}$ die Funktion

$\begin{displaymath} \left( \hat{F}^{-1}\right) ^{*}(k,x_{1},...,x_{n}).\end{displaymath}$

Die verallgemeinerte invertierte unscharfe empirische Verteilungsfunktion ist definiert durch ihre unscharfen Werte $\left( \hat{F}^{-1}\right) ^{*}(k)$ mit der charakterisierenden Funktion $\varphi _{\left( \hat{F}^{-1}\right) ^{*}(k)}(\cdot )$ gegeben durch

$\varphi _{\left( \hat{F}^{-1}\right) ^{*}(k)}(z)=\sup _{\underline{x}\in M^{n}}\left\{ \xi (\underline{x}):\hat{F}^{-1}(k,\underline{x})=z\right\}$ mit $k=1(1)n\qquad \forall z\in \mathbb {R}$

Die $\alpha \protect$ -Niveaukurven dieser verallgemeinerten empirischen Verteilungsfunktion sind gegeben durch

$\begin{array}{l} \left( \hat{F}^{-1}\right) ^{U}_{\alpha }(k)=\max _{\underli... ...}\in B_{\alpha }(\underline{x}^{*})}\hat{F}^{-1}(k,\underline{x}) \end{array}$ mit $k=1(1)n$

Bemerkung:

Falls die Minimum-Kombinationsregel verwendet wird, kann die verallgemeinerte korrespondierende empirische Verteilungsfunktion durch ihre oberen und unteren $\alpha \protect$ -Niveaukurven $\hat{F}^{U}_{\alpha }(\cdot )$ und $\hat{F}_{\alpha }^{L}(\cdot )$ dargestellt werden:

$\begin{displaymath} \hat{F}_{\alpha }^{U}(z)=\frac{1}{n}\sum _{i=1}^{n}I_{(-\infty ,z]}\left( \underline{B}_{\alpha }(x_{i}^{*})\right) \end{displaymath}$

$\begin{displaymath} \hat{F}_{\alpha }^{L}(z)=\frac{1}{n}\sum _{i=1}^{n}I_{(-\infty ,z]}\left( \overline{B}_{\alpha }(x_{i}^{*})\right) \end{displaymath}$

Dabei bezeichnet $B_{\alpha }(x_{i}^{*})=\left[ \underline{B}_{\alpha }(x_{i}^{*}),\overline{B}_{\alpha }(x_{i}^{*})\right]$ die $\alpha \protect$ -Schnitte der Beobachtungen $x_{i}^{*}$ . Ein Beispiel zeigt Abbildung

**Abbildung:** $\alpha \protect$ -Niveaukurven der verallgemeinerten empirischen Verteilungsfunktion, konstruiert mittels Fortpflanzung der Unschärfe
$\includegraphics {Abbildung3.4.eps}$

Graphische Verallgemeinerung der empirischen Verteilungsfunktion

Für unscharfe Beobachtungen $x_{1}^{*},...,x_{n}^{*}$ einer eindimensionalen stochastischen Größe $X$ kann eine graphische Verallgemeinerung der empirischen Verteilungsfunktion auf folgende Weise erstellt werden.

Sind $\xi _{1}(\cdot ),...,\xi _{n}(\cdot )$ die charakterisierenden Funktionen der unscharfen Beobachtungen $x_{1}^{*},...,x_{n}^{*}$ , so kann durch Ordnen der Funktionen $\xi _{1}(\cdot ),...,\xi _{n}(\cdot )$ nach den linken Grenze ihrer Träger $\textrm{supp}\{\xi (\cdot )\}$ und Bezeichnung der geordneten Menge mit $\xi _{(1)}(\cdot ),...,\xi _{(n)}(\cdot )$ eine Verallgemeinerung der klassischen empirischen Verteilungsfunktion $\hat{F}_{n}(\cdot )$ erstellt werden. Abbildung stellt dies dar.

Bemerkung:: Im Fall, dass alle charakterisierenden Funktionen $\xi _{i}(\cdot )$ die gleiche Form aufweisen, d.h. sie können als Transformation untereinander aufgefaßt werden, besitzen die $\alpha \protect$ -Niveaukurven der graphischen Verallgemeinerung $F_{n}^{*}(\cdot \vert\xi _{1}(\cdot ),...,\xi _{n}(\cdot ))$ die Form von klassischen empirischen Verteilungsfunktionen.

**Abbildung:** Graphische Verallgemeinerung der empirischen Verteilungsfunktion: Vereinfacht ausgedrückt kann man sagen, dass jeder charakterisierenden Funktion eine Tiefe von $1/n\protect$ zugeordnet wird und diese dann hintereinander angeordnet werden. Vergleich: Man blicke von oben auf die $(x,y)\protect$ -Ebene und vergleiche mit Abbildung .
$\includegraphics {Abbildung3.5.eps}$

Empirischer Korrelationskoeffizient für unscharfe Beobachtungen

Der klassische empirische Korrelationskoeffizient $r_{x,y}$ für genaue Beobachtungen $(x_{i},y_{i}),\, i=1,...,n$ , gegeben durch

$\begin{displaymath} r_{x,y}=\frac{\sum _{i=1}^{n}(x_{i}-\overline{x}_{n})(y_{i}-... ...t \left[ \sum _{i=1}^{n}(y_{i}-\overline{y}_{n})^{2}\right] }},\end{displaymath}$

kann für unscharfe Daten auf folgende Weise verallgemeinert werden:

Insgesamt $n$ unscharfe zweidimensionale Beobachtungen $(x_{i},y_{i}),\, i=1,...,n$ mit korrespondierenden charakterisierenden Funktionen

$\xi _{i}(x,y)$ mit $(x,y)\in \mathbb {R}^{2}$

werden zu einem unscharfen Element des Stichprobenraumes $\mathbb {R}^{2n}$ zusammengefaßt. Die vektorcharakterisierende Funktion dieses Elements ist gegeben durch

$\begin{displaymath} \varphi \left( \underline{\left( x,y\right) }\right) =\varphi (x_{1},y_{1},x_{2},y_{2},...,x_{n},y_{n})\end{displaymath}$

und kann durch eine entsprechende Kombination der charakterisierenden Funktionen $\xi _{i}(x,y)$ ermittelt werden.

Mögliche Kombinationen sind

$\begin{displaymath} \varphi \left( \underline{\left( x,y\right) }\right) :=\min _{i=1(1)n}\xi _{i}(x_{i},y_{i})\end{displaymath}$

und

$\begin{displaymath} \varphi \left( \underline{\left( x,y\right) }\right) :=\prod _{i=1}^{n}\xi _{i}(x_{i},y_{i}).\end{displaymath}$

Der verallgemeinerte empirische Korrelationskoeffizient ist dann die unscharfe Zahl $r^{*}$ , bezeichnet als unscharfer Korrelationskoeffizient, basierend auf einer unscharfen Stichprobe $(x_{i},y_{i})^{*},i=1(1)n$ , definiert durch seine charakterisierende Funktion $\psi _{r^{*}}(\cdot )$

$\begin{displaymath} \psi _{r^{*}}(r)=\sup \{\varphi \left( \underline{\left( x,y\right) }\right) :r_{x,y}=r\}.\end{displaymath}$

**Abbildung:** Unscharfe zweidimensionale Beobachtungen und die charakterisierende Funktion des unscharfen Korrelationskoeffizienten.
$\resizebox* {1\textwidth}{!}{\includegraphics{Abbildung3.6.eps}}$

Ergänzende Beispiele

Beispiel 3.1:

Es ist der Unterschied zwischen der geglätteten empirischen Verteilungsfunktion und der Summenkurve zu erklären.
Dazu betrachtet man zuerst die Definition der Summenkurve:

$\begin{displaymath} s_{n}(x):=\frac{\sum _{i=1}^{n}\int _{-\infty }^{x}\xi _{i}(t)dt}{\sum _{i=1}^{n}\int _{-\infty }^{\infty }\xi _{i}(t)dt}\end{displaymath}$

Diese summiert die Flächen unterhalb der charakterisierenden Funktionen bis zum Punkt $x$ auf und dividiert dann durch die Gesamtfläche unterhalb aller charakterisierenden Funktionen. Das heißt, es wird die Gesamtfläche unterhalb aller charakterisierenden Funktionen zur Normierung herangezogen.
Nun betrachtet man die Definition der geglätteten empirischen Verteilungsfunktion:

$\begin{displaymath} F_{n}^{*}(x):=\frac{1}{n}\sum _{i=1}^{n}\frac{\int _{-\infty }^{x}\xi _{i}(t)dt}{\int _{-\infty }^{\infty }\xi _{i}(t)dt}\end{displaymath}$

Diese normiert die Fläche unter jeder einzelnen charakterisierenden Funktion auf eins. Deshalb muß man abschließend noch durch die Anzahl der Beobachtungen dividieren. Dadurch erklärt sich auch, warum die geglättete empirische Verteilungsfunktion nur für unscharfe Werte definiert ist. Wäre eine Beobachtung exakt, würde es zu einer Division durch Null kommen.
Abbildung

zeigt die Unterschiede auf.

**Abbildung:** Vergleich zwischen geglätteter empirischer Verteilungsfunktion und Summenkurve: Der Anstieg der Summenkurve (dicke Linie) bei jeder Beobachtung ist abhängig von der Fläche unterhalb der charakterisierenden Funktion dieser Beobachtung. Je größer, d.h. je unschärfer diese ist, desto größer ist der Anstieg, der durch diese Beobachtung verursacht wird. Die geglättete empirische Verteilungsfunktion hingegen steigt bei jeder Beobachtung um $1/n\protect$ an.
$\resizebox* {!}{0.6\textheight}{\includegraphics{Beispiel3A.eps}}$

Beispiel 3.2:

Es ist der Zusammenhang zwischen der verallgemeinerten empirischen Verteilungsfunktion für Intervalldaten und der intervallwertigen empirischen Verteilungsfunktion zu zeigen.
Die intervallwertige empirische Verteilungsfunktion ist definiert als

$\begin{eqnarray*} \overline{F}_{n}(x) & = & \left\{ \begin{array}{cll} \frac{i-1... ...}{n} & \forall x: & \xi _{(i)}(x)\downarrow \end{array}\right. \end{eqnarray*}$

Da bei Intervalldaten die charakterisierende Funktion nur die Werte $0$ oder $1$ annehmen kann, läßt sich der Ausdruck vereinfachen zu:

$\begin{eqnarray*} \overline{F}_{n}(x)= & i/n & \forall x:\xi _{(i)}=1\\ \underline{F}_{n}(x)= & (i-1)/n & \forall x:\xi _{(i)}=1 \end{eqnarray*}$

Dies entspricht der empirischen Verteilungsfunktion für Intervalldaten.

Statistische Tests bei unscharfen Daten

Bei klassischen Signifikanztests basierend auf exakten Beobachtungen $x_{1},...,x_{n}$ einer stochastischen Größe $X\sim F_{\theta },\theta \in \Theta$ und Beobachtungsraum $M_{X}$ , ist die Entscheidung abhängig vom Wert einer Teststatistik $T=\tau (X_{1},...,X_{n})$ basierend auf einer Stichprobe $X_{1},...,X_{n}$ von $X$ .

Für unscharfe Beobachtungen $x_{1}^{*},...,x_{n}^{*}$ mit unscharfem kombinierten Stichprobenelement $\underline{x}^{*}$ und entsprechender vektorcharakterisierender Funktion $\xi (\cdot ,...,\cdot )$ wird der Wert der Teststatistik unscharf. Die charakterisierende Funktion $\psi (\cdot )$ dieses unscharfen Wertes $t^{*}$ der Teststatistik $T=\tau (x_{1},...,x_{n})$ ist gegeben durch

$\begin{displaymath} \psi (t)=\sup _{\underline{x}\in M_{X}^{n}}\left\{ \xi (x_{1},...,x_{n}):\tau (x_{1},...,x_{n})=t\right\} .\end{displaymath}$

Beispiel 4.1:

Für eine Stichprobe $X_{1},...,X_{n}$ einer normalverteilten stochastischen Größe $X\sim N(\mu ,\sigma ^{2})$ ist eine Teststatistik für die Hypothese $H_{0}:\mu =\mu _{0}$ gegeben durch

$\begin{displaymath} T=\tau (X_{1},...,X_{n})=\frac{\overline{X}_{n}-\mu _{0}}{S_{n}/\sqrt{n}}\end{displaymath}$

mit Annahmeraum A und Wahrscheinlichkeit $\delta$ für einen Fehler 1. Art

$\begin{displaymath} A=\left\{ t\in R:\vert t\vert=\left\vert \frac{\overline{x}_... .../\sqrt{n}}\right\vert \geq t_{n-1;1-\frac{\delta }{2}}\right\} \end{displaymath}$

wobei $t_{n-1;1-\frac{\delta }{2}}$ das $\left( 1-\frac{\delta }{2}\right)$ -Fraktile der t-Verteilung mit $n-1$ Freiheitsgraden darstellt.

Für unscharfe Daten $x_{1}^{*},...,x_{n}^{*}$ wird der Wert der Teststatistik unscharf.

In Abbildung sind zwei mögliche charakterisierende Funktionen des unscharfen Wertes $t^{*}$ dargestellt.

**Abbildung:** Unscharfe Werte $t^{*}$ einer Teststatistik: Der Träger des Wertes der oberen Teststatistik liegt vollständig innerhalb des Annahmeraumes. Die korrespondierende Hypothese kann daher angenommen werden. Im unteren Fall liegt der Träger teilweise im Annahmeraum und teilweise außerhalb. Daher kann in diesem Fall keine Entscheidung getroffen werden.
$\includegraphics {Abbildung4.1.eps}$

Falls der Träger von $t^{*}$ eine Teilmenge von $A$ oder eine Teilmenge von $A^{c}$ ist, dann ist eine Entscheidung über Annahme oder Verwerfung genau wie für exakte Daten möglich.

Für den Fall, dass der Träger von $t^{*}$ nichtleere Schnittmengen mit $A$ und $A^{c}$ hat, ist eine einfache Entscheidung nicht möglich. In diesem Fall sind z.B. mehr Beobachtungen notwendig.

Literatur

1: R. Viertl: Statistical Methods for Non-Precise Data, CRC Press, Boca Raton, Florida, 1996.

Über dieses Dokument ...

Seminararbeit aus Angewandter Statistik
Klassische schließende Statistik für unscharfe Daten

This document was generated using the LaTeX2HTML translator Version 99.1 release (March 30, 1999)

The command line arguments were:
latex2html -split 0 -local_icons -no_footnode -no_navigation -html_version 4.0 -dir ./html FuzzySeminar.tex

The translation was initiated by on 2000-01-21

Fußnoten

... Supremum

In dieser Arbeit wird zur Vereinfachung davon ausgegangen, dass das Supremum der leeren Menge gleich $0$ ist. Um formal korrekte Ausdrücke zu erhalten, muß ein Ausdruck der Form $v(p)=\sup \{\xi (\underline{x}):s(\underline{x})=p\}$ umgeschrieben werden als

$\begin{displaymath} v(p)=\left\{ \begin{array}{ll} \sup \{\xi (\underline{x}):s(... ...t \exists \underline{x}:s(\underline{x})=p \end{array}\right. .\end{displaymath}$

Seminararbeit aus Angewandter Statistik Klassische schließende Statistik für unscharfe Daten

Fußnoten

Seminararbeit aus Angewandter Statistik
Klassische schließende Statistik für unscharfe Daten