Die Daten
Author: Hans Lohninger
Basis aller statistischen Analysen sind Daten. Der zu analysierende Datensatz
sollte eine oder mehrere Charakteristiken des beobachteten Objekts beschreiben.
Wenn wir Daten analysieren, sollten wir uns der Datenquelle immer bewusst sein
und folgende Punkte im Gedächtnis behalten:
- Die Art der Datenerfassung (manuell, automatisch, Frequenz- und
Amplitudenauflösung, Probennahmeplan, etc.) kann das Ergebnis beträchtlich
beeinflussen und verschiedene Methoden der Interpretation nötig machen.
- Sind die gemessenen Daten eine Grundgesamtheit oder eine
Stichprobe? Verschiedene Formeln und die Präzision der Resultate hängen
davon ab.
- Wie präzise sind die Messungen? Dieses
Wissen ist notwendig, um eine zu große Zahl von Dezimalstellen zu vermeiden.
Es kann irreführend sein, wenn zum Beispiel die Ergebnisse einer Hochrechnung
während einer Wahl als "23.41% für die Partei XY" präsentiert werden, obwohl
die Unsicherheit ungefähr bei 2 % liegt. Eine korrekte Angabe wäre 23 +/- 2 %.
- Ist die beobachtete Variable wirklich signifikant für das Problem,
das gelöst werden soll? In manchen Fällen ist die Wahl der
signifikanten Variablen nicht von Anfang an klar.
- Was genau ist das Problem, das gelöst werden
soll? Die Verwendung einer Menge an statistischen Methoden mittels
"trial and error" (nur weil der Computer das alles kann) erhöht speziell bei Teststatistiken die
Wahrscheinlichkeit, bestimmte (falsche) Schlüsse zu ziehen.
|