Seminararbeit aus Angewandter Statistik
Klassische schließende Statistik für unscharfe Daten
Inhalt
- Inhalt
- Punktschätzung für Parameter
- Konfidenzbereiche für Parameter
- Nichtparametrische Schätzung
- Statistische Tests bei unscharfen Daten
- Literatur
Punktschätzung für Parameter
Dieser Abschnitt befaßt sich mit einer Verallgemeinerung der Punktschätzung für den Parameter eines stochastischen Modells mit dem Parameter und Beobachtungsraum für für unscharfe Daten.
Die Schätzfunktion für den Parameter ist eine meßbare Funktion, die den Stichprobenraum in abbildet, d.h.
Für Funktionen des Parameters mit
kann eine Verallgemeinerung der Schätzfunktion für unscharfe Daten gegeben werden. In diesem Fall sind die Schätzfunktionen von der Form
- Beispiel 1.1:
- Für eine Normalverteilung
gilt
Eine wichtige, zu schätzende Funktion des Parameters ist
mit und
Punktschätzung bei unscharfen Daten
Ist eine Schätzfunktion eines gerafften Parameters basierend auf einer Stichprobe einer stochastischen Größe , so erhält man für die beobachteten Werte einen Schätzwert
Für unscharfe Beobachtungen muß eine brauchbare Verallgemeinerung einer Schätzfunktion zu einem unscharfen Schätzwert für führen.
Um einen unscharfen Schätzwert zu ermitteln, verwendet man die charakterisierenden Funktionen der Beobachtungen . Diese werden mit einer passenden Regel kombiniert um so das unscharfe kombinierte Stichprobenelement des Stichprobenraumes zu erhalten. Dieses unscharfe kombinierte Stichprobenelement ist ein unscharfer Vektor mit der vektorcharakterisierenden Funktion gegeben durch
Das unscharfe kombinierte Stichprobenelement ist die Basis für die Konstruktion einer unscharfen Verallgemeinerung von Schätzfunktionen für bzw. .
- Definition 1.1:
- Ist
eine Schätzfunktion
für den Parameter eines stochastischen Modells
basierend auf einer Stichprobe
von , so ist für
die unscharfen Beobachtungen
ein unscharfer Schätzwert
für basierend auf dem unscharfen
kombinierten Stichprobenelement
gegeben durch ein unscharfes
Element
des Parameterraumes mit der charakterisierenden
Funktion , für die gilt
Um das Supremum zu ermitteln, müssen alle Elemente des Stichprobenraumes berücksichtigt werden, die die Bedingung erfüllen. Verwendet man die Bezeichnung , kann man anschreiben:
- Bemerkung:
- In der Stichprobe kann auch eine genaue Beobachtung enthalten sein. In diesem Fall ist die entsprechende charakterisierende Funktion .
- Beispiel 1.2:
- Für das stochastische Modell
,
d.h. für die Exponentialverteilung mit Dichtefunktion
ist eine optimale Schätzfunktion (bezüglich Unverzerrtheit, Effizienz, Konsistenz und Plausibilität) für basierend auf einer exakten Stichprobe von gegeben durch das Stichprobenmittel
Für unscharfe Beobachtungen von mit dem unscharfen kombinierten Stichprobenelement und entsprechender vektorcharakterisierender Funktion ist die charakterisierende Funktion des unscharfen Schätzwertes für gegeben durch
wobei das Supremum über dem Stichprobenraum ermittelt werden muß.
Abbildung zeigt eine unscharfe Stichprobe sowie die charakterisierenden Funktionen von zwei möglichen unscharfen Schätzwerten, ermittelt mit verschiedenen Kombinationsregeln. -
Abbildung: Unscharfe Stichprobe einer Exponentialverteilung und die charakterisierenden Funktionen der Schätzwerte für den Mittelwert: Ausgehend von sechs gleichgestaltigen Beobachtungen wird ein Schätzwert für den Mittelwert berechnet. Im mittleren Bild ist das Ergebnis dargestellt, falls zur Kombination der einzelnen charakterisierenden Funktionen die Minimum-Kombinationsregel verwendet wird. Im unteren Bild wurde die Produkt-Kombinationsregel verwendet. Zu beachten ist, daß die Träger sowie die Bereiche für =1 übereinstimmen.
Punktschätzung für geraffte Parameter bei unscharfen Daten
Für Funktionen der Parameter eines stochastischen Modells können durch Modifikation von Definition 1.1 unscharfe Schätzwerte gewonnen werden.
- Defintion 1.2:
- Unter den Annahmen von Definition 1.1 sei eine Schätzfunktion für . Für unscharfe Beobachtungen von mit dem unscharfen kombinierten Stichprobenelement und der entsprechenden vektorcharakterisierenden Funktion ist der unscharfe Schätzwert gegeben durch seine charakterisierende Funktion
- Beispiel 1.3:
- Für
und einer unscharfen Stichprobe
ist die charakterisierende
Funktion des unscharfen Schätzwertes
gegeben durch
Ergänzende Beispiele
- Beispiel 1.4:
- Es ist zu zeigen, dass die gegebenen Definitionen bei exakten
Daten zur Indikatorfunktion des exakten Punktschätzers führen.
Dazu betrachtet man zuerst eine der Bedingungen, die eine gültige Kombinationsregel erfüllen muß:
Wenn man nun die Indikatorfunktionen für exakte Daten verwendet, erhält man für die vektorcharakterisierende Funktion
Für den Schätzwert ergibt sich daher
Mit läßt sich dies noch vereinfachen zu
- Beispiel 1.5:
- Es ist zu zeigen, dass sich für Intervalldaten unabhängig von
der verwendeten Kombinationsregel derselbe unscharfe Schätzwert ergibt.
Die Kombinationsregeln sind wie folgt definiert:
Ausgehend von der charakterisierenden Funktion für Intervalldaten betrachtet man die Ergebnisse der Minimum- bzw. Produkt-Kombinationsregel für zwei Beobachtungen in nachfolgender Tabelle.
Man erkennt, dass die Ergebnisse für beide Kombinationsregeln übereinstimmen, d.h. es ergibt sich die gleiche vektorcharakterisierende Funktion. Da bei der Berechnung des unscharfen Schätzwertes mit der vektorcharakterisierenden Funktion weitergerechnet wird, die verwendete Kombinationsregel aber keinerlei Berücksichtigung findet, ist auch das Endergebnis unabhängig von der verwendeten Kombinationsregel. Diese Schlußfolgerung läßt sich für beliebig viele Beobachtungen anwenden.
Min. | Prod. | ||
0 | 0 | 0 | 0 |
0 | 1 | 0 | 0 |
1 | 0 | 0 | 0 |
1 | 1 | 1 | 1 |
Konfidenzbereiche für Parameter
Bezeichnet die Potenzmenge und ist eine Konfidenzfunktion mit Überdeckungswahrscheinlichkeit für den Parameter basierend auf einer Stichprobe der stochastischen Größe , d.h.
so muß gelten
Für eine konkrete beobachtete Stichprobe erhält man eine Teilmenge von .
Konfidenzbereiche bei unscharfen Daten
Im Fall von unscharfen Daten erhält man durch eine Verallgemeinerung der Konfidenzbereiche eine unscharfe Teilmenge des Parameterraumes auf folgende Art:
- Definition 2.1:
- Ist
die vektorcharakterisierende
Funktion des unscharfen kombinierten Stichprobenelements und
eine Konfidenzfunktion, so ist die charakterisierende Funktion
des verallgemeinerten Konfidenzbereiches gegeben durch
wobei über den Stichprobenraum von variiert wird. - Bemerkung:
- Für diesen verallgemeinerten Konfidenzbereich gilt im Fall von exakten
Daten und dem klassischen Konfidenzbereich
:
Allgemein gilt
d.h die Indikatorfunktion der Vereinigung auf der rechten Seite ist immer unterhalb der charakterisierenden Funktion des unscharfen Konfidenzintervalles. Mit der Abkürzung kann man schreiben
Das erkennt man am einfachsten durch:
- Beispiel 2.1:
- Ein unscharfer Konfidenzbereich für den Parameter einer Normalverteilung basierend auf unscharfen Daten ist in Abbildung zu sehen.
Konfidenzbereiche für geraffte Parameter bei unscharfen Daten
Für Funktionen des Parameters eines stochastischen Modells mit gerafftem Parameterraum kann das Konzept der Konfidenzbereiche ebenfalls verallgemeinert werden.
- Definition 2.2:
- Ist
eine unscharfe Stichprobe,
dessen unscharfes kombiniertes Stichprobenelement
die
vektorcharakterisierende Funktion
aufweist, so
ist für eine Konfidenzfunktion
für geraffte
Parameter
ein verallgemeinerter Konfidenzbereich
für
eine unscharfe Teilmenge
von , deren charakterisierende Funktion
gegeben ist durch
wobei für alle Werte innerhalb des Stichprobenraumes berücksichtigt werden müssen. - Bemerkung:
- Für geraffte Parameter
gilt ebenfalls
mit und . - Beispiel 2.2:
- Ist eine normalverteilte, stochastische Größe und
eine unscharfe Stichprobe von , so soll ein verallgemeinertes Konfidenzintervall
für
berechnet werden.
Ist die vektorcharakterisierende Funktion des unscharfen kombinierten Stichprobenelements, so wird die charakterisierende Funktion des verallgemeinerten Konfidenzintervalles für mittels eines klassischen Konfidenzintervalles für basierend auf den exakten Daten berechnet. Für eine Überdeckungswahrscheinlichkeit von gilt
Die charakterisierende Funktion des verallgemeinerten unscharfen Konfidenzintervalles basierend auf den unscharfen Daten ist gegeben durch
In Abbildung ist eine unscharfe Stichprobe einer Normalverteilung und das entsprechende unscharfe Konfidenzintervall für dargestellt.
Nichtparametrische Schätzung
Die wichtigste nichtparametrische Schätzung der Verteilungsfunktion einer eindimensionalen stochastischen Größe basierend auf einer Stichprobe ist die empirische Verteilungsfunktion gegeben durch:
Für unscharfe Beobachtungen von sind mehrere Verallgemeinerungen möglich.
Geglättete empirische Verteilungsfunktion
Die klassische empirische Verteilungsfunktion ist eine Treppenfunktion. Um stetige Verteilungen zu schätzen, wäre eine stetige Schätzung der Verteilungsfunktion von Vorteil.
Für unscharfe Daten mit charakterisierenden Funktionen ist eine stetige Schätzung der Verteilung gegeben durch
Die geglättete empirische Verteilungsfunktion ist nur dann definiert, wenn alle Beobachtungen unscharf sind.
In Abbildung ist eine unscharfe Stichprobe und die entsprechende Schätzung dargestellt.
Intervallwertige empirische Verteilungsfunktion
Für Intervalldaten ist eine verallgemeinerte empirische Verteilungsfunktion gegeben durch
Für allgemeine unscharfe Beobachtungen mit charakterisierenden Funktionen sind die Funktionen und auf folgende Weise definiert:
Im Fall von paarweise disjunkten Trägern können die charakterisierenden Funktionen der Größe nach geordnet und als angeschrieben werden.
Im Intervall sind die Funktionen und gegeben durch
Abbildung zeigt einen Ausschnitt dieser beiden Funktionen im Intervall einer Beobachtung sowie für eine Stichprobe mit vier unscharfen Beobachtungen die gesamte intervallwertige empirische Verteilungsfunktion .
- Bemerkung:
- Für unscharfen Daten mit sich überschneidenden Trägern wird eine Überlagerung der Funktionen und erzeugt. Ein Beispiel dafür zeigt Abbildung .
Anwendung der Fortpflanzung der Unschärfe
Für eine Stichprobe von unscharfen Beobachtungen einer eindimensionalen stochastischen Größe ist die vektorcharakterisierende Funktion des unscharfen kombinierten Stichprobenelements.
Die klassische empirische Verteilungsfunktion , gegeben durch
kann nicht direkt verwendet werden, um eine verallgemeinerte empirische Verteilungsfunktion zu konstruieren, da sie nicht stetig ist.
Eine Verallgemeinerung ist aber mittels der invertierten empirischen Verteilungsfunktion möglich:
Diese Funktion ist stetig in den Beobachtungen . Daher erhält man für die unscharfen Daten die Funktion
Die verallgemeinerte invertierte unscharfe empirische Verteilungsfunktion ist definiert durch ihre unscharfen Werte mit der charakterisierenden Funktion gegeben durch
Die -Niveaukurven dieser verallgemeinerten empirischen Verteilungsfunktion sind gegeben durch
- Bemerkung:
- Falls die Minimum-Kombinationsregel verwendet wird, kann die verallgemeinerte
korrespondierende empirische Verteilungsfunktion durch ihre oberen und unteren
-Niveaukurven
und
dargestellt werden:
Dabei bezeichnet die -Schnitte der Beobachtungen . Ein Beispiel zeigt Abbildung .
Graphische Verallgemeinerung der empirischen Verteilungsfunktion
Für unscharfe Beobachtungen einer eindimensionalen stochastischen Größe kann eine graphische Verallgemeinerung der empirischen Verteilungsfunktion auf folgende Weise erstellt werden.
Sind die charakterisierenden Funktionen der unscharfen Beobachtungen , so kann durch Ordnen der Funktionen nach den linken Grenze ihrer Träger und Bezeichnung der geordneten Menge mit eine Verallgemeinerung der klassischen empirischen Verteilungsfunktion erstellt werden. Abbildung stellt dies dar.
- Bemerkung:
- Im Fall, dass alle charakterisierenden Funktionen die gleiche Form aufweisen, d.h. sie können als Transformation untereinander aufgefaßt werden, besitzen die -Niveaukurven der graphischen Verallgemeinerung die Form von klassischen empirischen Verteilungsfunktionen.
Empirischer Korrelationskoeffizient für unscharfe Beobachtungen
Der klassische empirische Korrelationskoeffizient für genaue Beobachtungen , gegeben durch
kann für unscharfe Daten auf folgende Weise verallgemeinert werden:
Insgesamt unscharfe zweidimensionale Beobachtungen mit korrespondierenden charakterisierenden Funktionen
werden zu einem unscharfen Element des Stichprobenraumes zusammengefaßt. Die vektorcharakterisierende Funktion dieses Elements ist gegeben durch
und kann durch eine entsprechende Kombination der charakterisierenden Funktionen ermittelt werden.
Mögliche Kombinationen sind
und
Der verallgemeinerte empirische Korrelationskoeffizient ist dann die unscharfe Zahl , bezeichnet als unscharfer Korrelationskoeffizient, basierend auf einer unscharfen Stichprobe , definiert durch seine charakterisierende Funktion
Ergänzende Beispiele
- Beispiel 3.1:
- Es ist der Unterschied zwischen der geglätteten empirischen Verteilungsfunktion
und der Summenkurve zu erklären.
Dazu betrachtet man zuerst die Definition der Summenkurve:
Diese summiert die Flächen unterhalb der charakterisierenden Funktionen bis zum Punkt auf und dividiert dann durch die Gesamtfläche unterhalb aller charakterisierenden Funktionen. Das heißt, es wird die Gesamtfläche unterhalb aller charakterisierenden Funktionen zur Normierung herangezogen.
Nun betrachtet man die Definition der geglätteten empirischen Verteilungsfunktion:
Diese normiert die Fläche unter jeder einzelnen charakterisierenden Funktion auf eins. Deshalb muß man abschließend noch durch die Anzahl der Beobachtungen dividieren. Dadurch erklärt sich auch, warum die geglättete empirische Verteilungsfunktion nur für unscharfe Werte definiert ist. Wäre eine Beobachtung exakt, würde es zu einer Division durch Null kommen.
Abbildung zeigt die Unterschiede auf. -
Abbildung: Vergleich zwischen geglätteter empirischer Verteilungsfunktion und Summenkurve: Der Anstieg der Summenkurve (dicke Linie) bei jeder Beobachtung ist abhängig von der Fläche unterhalb der charakterisierenden Funktion dieser Beobachtung. Je größer, d.h. je unschärfer diese ist, desto größer ist der Anstieg, der durch diese Beobachtung verursacht wird. Die geglättete empirische Verteilungsfunktion hingegen steigt bei jeder Beobachtung um an. - Beispiel 3.2:
- Es ist der Zusammenhang zwischen der verallgemeinerten empirischen
Verteilungsfunktion für Intervalldaten und der intervallwertigen empirischen
Verteilungsfunktion zu zeigen.
Die intervallwertige empirische Verteilungsfunktion ist definiert als
Da bei Intervalldaten die charakterisierende Funktion nur die Werte oder annehmen kann, läßt sich der Ausdruck vereinfachen zu:
Dies entspricht der empirischen Verteilungsfunktion für Intervalldaten.
Statistische Tests bei unscharfen Daten
Bei klassischen Signifikanztests basierend auf exakten Beobachtungen einer stochastischen Größe und Beobachtungsraum , ist die Entscheidung abhängig vom Wert einer Teststatistik basierend auf einer Stichprobe von .
Für unscharfe Beobachtungen mit unscharfem kombinierten Stichprobenelement und entsprechender vektorcharakterisierender Funktion wird der Wert der Teststatistik unscharf. Die charakterisierende Funktion dieses unscharfen Wertes der Teststatistik ist gegeben durch
- Beispiel 4.1:
- Für eine Stichprobe
einer normalverteilten
stochastischen Größe
ist eine Teststatistik
für die Hypothese
gegeben durch
mit Annahmeraum A und Wahrscheinlichkeit für einen Fehler 1. Art
wobei das -Fraktile der t-Verteilung mit Freiheitsgraden darstellt.
In Abbildung sind zwei mögliche charakterisierende Funktionen des unscharfen Wertes dargestellt.
Falls der Träger von eine Teilmenge von oder eine Teilmenge von ist, dann ist eine Entscheidung über Annahme oder Verwerfung genau wie für exakte Daten möglich.
Für den Fall, dass der Träger von nichtleere Schnittmengen mit und hat, ist eine einfache Entscheidung nicht möglich. In diesem Fall sind z.B. mehr Beobachtungen notwendig.
Literatur
- 1
- R. Viertl: Statistical Methods for Non-Precise Data, CRC Press, Boca Raton, Florida, 1996.
Über dieses Dokument ...
Seminararbeit aus Angewandter StatistikKlassische schließende Statistik für unscharfe Daten
This document was generated using the LaTeX2HTML translator Version 99.1 release (March 30, 1999)
Copyright © 1993, 1994, 1995, 1996,
Nikos Drakos,
Computer Based Learning Unit, University of Leeds.
Copyright © 1997, 1998, 1999,
Ross Moore,
Mathematics Department, Macquarie University, Sydney.
The command line arguments were:
latex2html -split 0 -local_icons -no_footnode -no_navigation -html_version 4.0 -dir ./html FuzzySeminar.tex
The translation was initiated by on 2000-01-21
Fußnoten
- ... Supremum
- In dieser Arbeit wird zur Vereinfachung davon ausgegangen, dass das Supremum
der leeren Menge gleich ist. Um formal korrekte Ausdrücke zu erhalten,
muß ein Ausdruck der Form
umgeschrieben werden als