Seminararbeit aus Angewandter Statistik
Klassische schließende Statistik für unscharfe Daten
Inhalt
- Inhalt
- Punktschätzung für Parameter
- Konfidenzbereiche für Parameter
- Nichtparametrische Schätzung
- Statistische Tests bei unscharfen Daten
- Literatur
Punktschätzung für Parameter
Dieser Abschnitt befaßt sich mit einer Verallgemeinerung der Punktschätzung
für den Parameter
eines stochastischen Modells
mit dem Parameter
und Beobachtungsraum
für
für unscharfe Daten.
Die Schätzfunktion
für den
Parameter
ist eine meßbare Funktion, die den Stichprobenraum
in
abbildet, d.h.
Für Funktionen
des Parameters
mit
kann eine Verallgemeinerung der Schätzfunktion für unscharfe Daten gegeben werden.
In diesem Fall sind die Schätzfunktionen
von der
Form
- Beispiel 1.1:
- Für eine Normalverteilung
gilt
Eine wichtige, zu schätzende Funktion
des Parameters
ist
mit
und

Punktschätzung bei unscharfen Daten
Ist
eine Schätzfunktion eines gerafften Parameters
basierend auf einer Stichprobe
einer stochastischen Größe
, so erhält man für die beobachteten Werte
einen Schätzwert
Für unscharfe Beobachtungen
muß eine brauchbare
Verallgemeinerung einer Schätzfunktion zu einem unscharfen Schätzwert
für
führen.
Um einen unscharfen Schätzwert zu ermitteln, verwendet man die charakterisierenden
Funktionen
der Beobachtungen
.
Diese werden mit einer passenden Regel kombiniert um so das unscharfe kombinierte
Stichprobenelement
des Stichprobenraumes
zu erhalten. Dieses unscharfe kombinierte Stichprobenelement ist ein unscharfer
Vektor mit der vektorcharakterisierenden Funktion
gegeben durch
Das unscharfe kombinierte Stichprobenelement ist die Basis für die Konstruktion einer unscharfen Verallgemeinerung von Schätzfunktionen für
- Definition 1.1:
- Ist
eine Schätzfunktion
für den Parameter
eines stochastischen Modells
basierend auf einer Stichprobe
von
, so ist für
die unscharfen Beobachtungen
ein unscharfer Schätzwert
für
basierend auf dem unscharfen
kombinierten Stichprobenelement
gegeben durch ein unscharfes
Element
des Parameterraumes mit der charakterisierenden
Funktion
, für die gilt
Um das Supremum
zu ermitteln, müssen alle Elemente
des Stichprobenraumes
berücksichtigt werden, die die Bedingung erfüllen. Verwendet man die Bezeichnung
, kann man anschreiben:
- Bemerkung:
- In der Stichprobe kann auch eine genaue Beobachtung
enthalten sein. In diesem Fall ist die entsprechende charakterisierende Funktion
.
erklärt das Prinzip
für eine Stichprobe mit
|
- Beispiel 1.2:
- Für das stochastische Modell
,
d.h. für die Exponentialverteilung mit Dichtefunktion
ist eine optimale Schätzfunktion (bezüglich Unverzerrtheit, Effizienz, Konsistenz und Plausibilität) für
basierend auf einer exakten Stichprobe
von
gegeben durch das Stichprobenmittel
Für unscharfe Beobachtungen
von
mit
dem unscharfen kombinierten Stichprobenelement
und
entsprechender vektorcharakterisierender Funktion
ist die charakterisierende Funktion
des unscharfen Schätzwertes
für
gegeben durch
wobei das Supremum über dem Stichprobenraum
ermittelt werden muß.
Abbildung
zeigt eine unscharfe Stichprobe
sowie die charakterisierenden Funktionen von zwei möglichen unscharfen Schätzwerten,
ermittelt mit verschiedenen Kombinationsregeln. -
Abbildung: Unscharfe Stichprobe einer Exponentialverteilung und die charakterisierenden Funktionen der Schätzwerte für den Mittelwert: Ausgehend von sechs gleichgestaltigen Beobachtungen wird ein Schätzwert für den Mittelwert berechnet. Im mittleren Bild ist das Ergebnis dargestellt, falls zur Kombination der einzelnen charakterisierenden Funktionen die Minimum-Kombinationsregel verwendet wird. Im unteren Bild wurde die Produkt-Kombinationsregel verwendet. Zu beachten ist, daß die Träger sowie die Bereiche für
=1
übereinstimmen.
Punktschätzung für geraffte Parameter bei unscharfen Daten
Für Funktionen
der Parameter eines stochastischen Modells
können durch Modifikation von Definition 1.1 unscharfe Schätzwerte gewonnen
werden.
- Defintion 1.2:
- Unter den Annahmen von Definition 1.1 sei
eine Schätzfunktion für
. Für unscharfe Beobachtungen
von
mit dem unscharfen kombinierten
Stichprobenelement
und der entsprechenden vektorcharakterisierenden
Funktion
ist der unscharfe Schätzwert
gegeben
durch seine charakterisierende Funktion 
- Beispiel 1.3:
- Für
und einer unscharfen Stichprobe
ist die charakterisierende
Funktion des unscharfen Schätzwertes
gegeben durch
Ergänzende Beispiele
- Beispiel 1.4:
- Es ist zu zeigen, dass die gegebenen Definitionen bei exakten
Daten zur Indikatorfunktion des exakten Punktschätzers führen.
Dazu betrachtet man zuerst eine der Bedingungen, die eine gültige Kombinationsregel erfüllen muß:
Wenn man nun die Indikatorfunktionen für exakte Daten verwendet, erhält man für die vektorcharakterisierende Funktion
Für den Schätzwert ergibt sich daher
Mit
läßt sich dies
noch vereinfachen zu
- Beispiel 1.5:
- Es ist zu zeigen, dass sich für Intervalldaten unabhängig von
der verwendeten Kombinationsregel derselbe unscharfe Schätzwert ergibt.
Die Kombinationsregeln sind wie folgt definiert:
Ausgehend von der charakterisierenden Funktion für Intervalldaten
betrachtet man die Ergebnisse der Minimum- bzw. Produkt-Kombinationsregel für
zwei Beobachtungen in nachfolgender Tabelle.
Man erkennt, dass die Ergebnisse für beide Kombinationsregeln übereinstimmen, d.h. es ergibt sich die gleiche vektorcharakterisierende Funktion. Da bei der Berechnung des unscharfen Schätzwertes mit der vektorcharakterisierenden Funktion weitergerechnet wird, die verwendete Kombinationsregel aber keinerlei Berücksichtigung findet, ist auch das Endergebnis unabhängig von der verwendeten Kombinationsregel. Diese Schlußfolgerung läßt sich für beliebig viele Beobachtungen anwenden.
|
|
|
Min. | Prod. |
| 0 | 0 | 0 | 0 |
| 0 | 1 | 0 | 0 |
| 1 | 0 | 0 | 0 |
| 1 | 1 | 1 | 1 |
Konfidenzbereiche für Parameter
Bezeichnet
die Potenzmenge und ist
eine Konfidenzfunktion mit Überdeckungswahrscheinlichkeit
für
den Parameter
basierend auf einer Stichprobe
der stochastischen Größe
, d.h.
so muß gelten
Für eine konkrete beobachtete Stichprobe erhält man eine Teilmenge
von
.
Konfidenzbereiche bei unscharfen Daten
Im Fall von unscharfen Daten
erhält man durch
eine Verallgemeinerung der Konfidenzbereiche eine unscharfe Teilmenge
des Parameterraumes auf folgende Art:
- Definition 2.1:
- Ist
die vektorcharakterisierende
Funktion des unscharfen kombinierten Stichprobenelements und
eine Konfidenzfunktion, so ist die charakterisierende Funktion
des verallgemeinerten Konfidenzbereiches gegeben durch
wobei
über den Stichprobenraum
von
variiert wird. - Bemerkung:
- Für diesen verallgemeinerten Konfidenzbereich gilt im Fall von exakten
Daten und dem klassischen Konfidenzbereich
:
Allgemein gilt
d.h die Indikatorfunktion der Vereinigung auf der rechten Seite ist immer unterhalb der charakterisierenden Funktion
des unscharfen Konfidenzintervalles.
Mit der Abkürzung
kann man schreiben
Das erkennt man am einfachsten durch:
- Beispiel 2.1:
- Ein unscharfer Konfidenzbereich für den Parameter
einer Normalverteilung basierend auf unscharfen Daten ist in Abbildung
zu sehen.
Konfidenzbereiche für geraffte Parameter bei unscharfen Daten
Für Funktionen
des Parameters
eines stochastischen Modells
mit
gerafftem Parameterraum
kann das Konzept der Konfidenzbereiche ebenfalls verallgemeinert werden.
- Definition 2.2:
- Ist
eine unscharfe Stichprobe,
dessen unscharfes kombiniertes Stichprobenelement
die
vektorcharakterisierende Funktion
aufweist, so
ist für eine Konfidenzfunktion
für geraffte
Parameter
ein verallgemeinerter Konfidenzbereich
für
eine unscharfe Teilmenge
von
, deren charakterisierende Funktion
gegeben ist durch
wobei für
alle Werte innerhalb des Stichprobenraumes
berücksichtigt werden müssen. - Bemerkung:
- Für geraffte Parameter
gilt ebenfalls
mit
und
. - Beispiel 2.2:
- Ist
eine normalverteilte, stochastische Größe und
eine unscharfe Stichprobe von
, so soll ein verallgemeinertes Konfidenzintervall
für
berechnet werden.
Ist
die vektorcharakterisierende Funktion des
unscharfen kombinierten Stichprobenelements, so wird die charakterisierende
Funktion
des verallgemeinerten Konfidenzintervalles für
mittels eines klassischen Konfidenzintervalles
für
basierend auf den exakten Daten
berechnet.
Für eine Überdeckungswahrscheinlichkeit von
gilt
Die charakterisierende Funktion
des verallgemeinerten unscharfen
Konfidenzintervalles basierend auf den unscharfen Daten ist gegeben durch
In Abbildung
ist eine unscharfe Stichprobe einer
Normalverteilung und das entsprechende unscharfe Konfidenzintervall für
dargestellt.
Nichtparametrische Schätzung
Die wichtigste nichtparametrische Schätzung der Verteilungsfunktion einer eindimensionalen
stochastischen Größe
basierend auf einer Stichprobe
ist die empirische Verteilungsfunktion
gegeben durch:
Für unscharfe Beobachtungen
von
sind
mehrere Verallgemeinerungen möglich.
Geglättete empirische Verteilungsfunktion
Die klassische empirische Verteilungsfunktion ist eine Treppenfunktion. Um stetige Verteilungen zu schätzen, wäre eine stetige Schätzung der Verteilungsfunktion von Vorteil.
Für unscharfe Daten
mit charakterisierenden Funktionen
ist eine stetige Schätzung der
Verteilung gegeben durch
Die geglättete empirische Verteilungsfunktion ist nur dann definiert, wenn alle Beobachtungen unscharf sind.
In Abbildung
ist eine unscharfe
Stichprobe und die entsprechende Schätzung
dargestellt.
|
Intervallwertige empirische Verteilungsfunktion
Für Intervalldaten ist eine verallgemeinerte empirische Verteilungsfunktion gegeben durch
Für allgemeine unscharfe Beobachtungen
mit charakterisierenden
Funktionen
sind die Funktionen
und
auf folgende
Weise definiert:
Im Fall von paarweise disjunkten Trägern
können die charakterisierenden Funktionen der Größe nach geordnet und als
angeschrieben werden.
Im Intervall
sind die
Funktionen
und
gegeben durch

Abbildung
zeigt einen
Ausschnitt dieser beiden Funktionen im Intervall
einer Beobachtung sowie für eine Stichprobe mit vier unscharfen Beobachtungen
die gesamte intervallwertige empirische Verteilungsfunktion
.
|
- Bemerkung:
- Für unscharfen Daten mit sich überschneidenden Trägern wird eine
Überlagerung der Funktionen
und
erzeugt. Ein Beispiel dafür zeigt Abbildung
.
Anwendung der Fortpflanzung der Unschärfe
Für eine Stichprobe von
unscharfen Beobachtungen einer eindimensionalen
stochastischen Größe
ist
die vektorcharakterisierende
Funktion des unscharfen kombinierten Stichprobenelements.
Die klassische empirische Verteilungsfunktion
, gegeben
durch
kann nicht direkt verwendet werden, um eine verallgemeinerte empirische Verteilungsfunktion zu konstruieren, da sie nicht stetig ist.
Eine Verallgemeinerung ist aber mittels der invertierten empirischen Verteilungsfunktion möglich:
Diese Funktion ist stetig in den Beobachtungen
. Daher
erhält man für die unscharfen Daten
die Funktion
Die verallgemeinerte invertierte unscharfe empirische Verteilungsfunktion ist
definiert durch ihre unscharfen Werte
mit der charakterisierenden Funktion
gegeben durch
mit
Die
-Niveaukurven dieser verallgemeinerten empirischen Verteilungsfunktion
sind gegeben durch
mit
- Bemerkung:
- Falls die Minimum-Kombinationsregel verwendet wird, kann die verallgemeinerte
korrespondierende empirische Verteilungsfunktion durch ihre oberen und unteren
-Niveaukurven
und
dargestellt werden:
Dabei bezeichnet
die
-Schnitte der Beobachtungen
. Ein Beispiel
zeigt Abbildung
.
Graphische Verallgemeinerung der empirischen Verteilungsfunktion
Für unscharfe Beobachtungen
einer eindimensionalen
stochastischen Größe
kann eine graphische Verallgemeinerung der empirischen
Verteilungsfunktion auf folgende Weise erstellt werden.
Sind
die charakterisierenden Funktionen
der unscharfen Beobachtungen
, so kann durch Ordnen
der Funktionen
nach den linken
Grenze ihrer Träger
und Bezeichnung der
geordneten Menge mit
eine Verallgemeinerung
der klassischen empirischen Verteilungsfunktion
erstellt
werden. Abbildung
stellt dies dar.
- Bemerkung:
- Im Fall, dass alle charakterisierenden Funktionen
die gleiche Form aufweisen, d.h. sie können als Transformation untereinander
aufgefaßt werden, besitzen die
-Niveaukurven der graphischen Verallgemeinerung
die Form von
klassischen empirischen Verteilungsfunktionen.
Empirischer Korrelationskoeffizient für unscharfe Beobachtungen
Der klassische empirische Korrelationskoeffizient
für genaue
Beobachtungen
, gegeben durch
kann für unscharfe Daten auf folgende Weise verallgemeinert werden:
Insgesamt
unscharfe zweidimensionale Beobachtungen
mit korrespondierenden charakterisierenden Funktionen
werden zu einem unscharfen Element des Stichprobenraumes
zusammengefaßt. Die vektorcharakterisierende Funktion dieses Elements ist gegeben
durch
und kann durch eine entsprechende Kombination der charakterisierenden Funktionen
ermittelt werden.
Mögliche Kombinationen sind
und
Der verallgemeinerte empirische Korrelationskoeffizient ist dann die unscharfe
Zahl
, bezeichnet als unscharfer Korrelationskoeffizient,
basierend auf einer unscharfen Stichprobe
,
definiert durch seine charakterisierende Funktion
|
Ergänzende Beispiele
- Beispiel 3.1:
- Es ist der Unterschied zwischen der geglätteten empirischen Verteilungsfunktion
und der Summenkurve zu erklären.
Dazu betrachtet man zuerst die Definition der Summenkurve:
Diese summiert die Flächen unterhalb der charakterisierenden Funktionen bis zum Punkt
auf und dividiert dann durch die Gesamtfläche unterhalb aller
charakterisierenden Funktionen. Das heißt, es wird die Gesamtfläche unterhalb
aller charakterisierenden Funktionen zur Normierung herangezogen.
Nun betrachtet man die Definition der geglätteten empirischen Verteilungsfunktion:
Diese normiert die Fläche unter jeder einzelnen charakterisierenden Funktion auf eins. Deshalb muß man abschließend noch durch die Anzahl der Beobachtungen dividieren. Dadurch erklärt sich auch, warum die geglättete empirische Verteilungsfunktion nur für unscharfe Werte definiert ist. Wäre eine Beobachtung exakt, würde es zu einer Division durch Null kommen.
Abbildung
zeigt die Unterschiede auf. -
Abbildung: Vergleich zwischen geglätteter empirischer Verteilungsfunktion und Summenkurve: Der Anstieg der Summenkurve (dicke Linie) bei jeder Beobachtung ist abhängig von der Fläche unterhalb der charakterisierenden Funktion dieser Beobachtung. Je größer, d.h. je unschärfer diese ist, desto größer ist der Anstieg, der durch diese Beobachtung verursacht wird. Die geglättete empirische Verteilungsfunktion hingegen steigt bei jeder Beobachtung um
an.
- Beispiel 3.2:
- Es ist der Zusammenhang zwischen der verallgemeinerten empirischen
Verteilungsfunktion für Intervalldaten und der intervallwertigen empirischen
Verteilungsfunktion zu zeigen.
Die intervallwertige empirische Verteilungsfunktion ist definiert als

Da bei Intervalldaten die charakterisierende Funktion nur die Werte
oder
annehmen kann, läßt sich der Ausdruck vereinfachen zu:

Dies entspricht der empirischen Verteilungsfunktion für Intervalldaten.
Statistische Tests bei unscharfen Daten
Bei klassischen Signifikanztests basierend auf exakten Beobachtungen
einer stochastischen Größe
und Beobachtungsraum
, ist die Entscheidung abhängig vom Wert einer Teststatistik
basierend auf einer Stichprobe
von
.
Für unscharfe Beobachtungen
mit unscharfem kombinierten
Stichprobenelement
und entsprechender vektorcharakterisierender
Funktion
wird der Wert der Teststatistik unscharf.
Die charakterisierende Funktion
dieses unscharfen Wertes
der Teststatistik
ist gegeben durch
- Beispiel 4.1:
- Für eine Stichprobe
einer normalverteilten
stochastischen Größe
ist eine Teststatistik
für die Hypothese
gegeben durch
mit Annahmeraum A und Wahrscheinlichkeit
für einen Fehler 1.
Art
wobei
das
-Fraktile
der t-Verteilung mit
Freiheitsgraden darstellt.
In Abbildung
sind zwei mögliche charakterisierende
Funktionen des unscharfen Wertes
dargestellt.
|
Falls der Träger von
eine Teilmenge von
oder eine Teilmenge
von
ist, dann ist eine Entscheidung über Annahme oder Verwerfung
genau wie für exakte Daten möglich.
Für den Fall, dass der Träger von
nichtleere Schnittmengen mit
und
hat, ist eine einfache Entscheidung nicht möglich.
In diesem Fall sind z.B. mehr Beobachtungen notwendig.
Literatur
- 1
- R. Viertl: Statistical Methods for Non-Precise Data, CRC Press, Boca Raton, Florida, 1996.
Über dieses Dokument ...
Seminararbeit aus Angewandter StatistikKlassische schließende Statistik für unscharfe Daten
This document was generated using the LaTeX2HTML translator Version 99.1 release (March 30, 1999)
Copyright © 1993, 1994, 1995, 1996,
Nikos Drakos,
Computer Based Learning Unit, University of Leeds.
Copyright © 1997, 1998, 1999,
Ross Moore,
Mathematics Department, Macquarie University, Sydney.
The command line arguments were:
latex2html -split 0 -local_icons -no_footnode -no_navigation -html_version 4.0 -dir ./html FuzzySeminar.tex
The translation was initiated by on 2000-01-21
Fußnoten
- ... Supremum
- In dieser Arbeit wird zur Vereinfachung davon ausgegangen, dass das Supremum
der leeren Menge gleich
ist. Um formal korrekte Ausdrücke zu erhalten,
muß ein Ausdruck der Form
umgeschrieben werden als