Nachfolgende Tabelle enthält eine Zusammenfassung aller für diverse Übungen benötigten Datensätze. Die meisten Datensätze sind reale Daten aus verschiedenen Quellen (Referenzangaben am Ende dieser Seite). Einige Datensätze enthalten jedoch künstlich erzeugte Daten, die aus ganz bestimmten Gründen erzeugt wurden. Die simulierten Daten sind in durch das Symbol in der rechten Spalte gekennzeichnet. Alle simulierten Datensätze wurden mit Hilfe von DataLab erzeugt.
Dateiname |
Beschreibung |
Referenz |
ALCOHOL |
Teilmenge des Datensatzes WINE mit den Alkoholgehalten von zwei Weinsorten. |
Mit freundlicher Genehmigung von M. Forina. |
BANANAS |
Eigenschaften von 38 Bananen. Die Bananen wurden vom Autor gewogen, vermessen, gegessen und für gut befunden. |
|
BENZ500 |
Spektroskopiedaten (NMR) verschiedener Benzinmarken und die dazugehörigen relativen Oktanzahlen. |
Mit freundlicher Genehmigung von R. Meusinger. |
BODYFAT |
Prozentsatz an Körperfett, Alter, Gewicht, Größe und zehn andere Körpermaße von 252 Männern. Das Körperfett, ein Maß für die Gesundheit, wird durch Unterwasserwägetechniken abgeschätzt. Passt man das Körperfett an andere Messungen durch multiple Regression an, erhält man eine Möglichkeit, das Körperfett von Männern nur mit einer Waage und einem Maßband abzuschätzen. |
Mit freundlicher Genehmigung von G. Fisher. |
BOILPTS |
Siedepunkte und topologische Deskriptoren von 185 chemischen Substanzen. |
|
CANCER |
Zahl der Darmkrebsfälle in Westdeutschland zwischen 1955 und 1995. |
|
CIGART |
Künstlicher Datensatz für Klassifikationen, die von INSPECT kreiert wurden. Die Datenpunkte sind so angelegt, dass nur nicht lineare Systeme in der Lage sind, die Daten richtig zu klassifizieren. |
|
COINS |
Gewicht von 114 Münzen (österreichische 1-Schilling-Münzen) verschiedenen Alters. |
Die Münzen wurden gesammelt und gewogen von H. Lohninger und A. Satzinger, Technische Universität Wien, Österreich |
ETHANOL |
NOx-Konzentration in den Abgasen eines experimentellen Ethanolmotors. |
|
EXMPL-A |
Künstlicher Datensatz, der einige einfache Beziehungen zwischen Variablen zeigt. |
|
FISH1SPECIES |
Teilmenge des Datensatzes FISHCATCH, die die Beziehung zwischen Gewicht und Größe von Fischen zeigt. |
|
FISHCATCH |
Körpermaße verschiedener Flussbarscharten. |
|
FLURIEDW |
Dieser Datensatz enthält geometrische Messungen von 100 echten und 100 gefälschten Banknoten. |
Mit freundlicher Genehmigung von H. Riedwyl, Bern, Schweiz. |
FREEFALL |
Simulierte Daten, um Variabilitäten in Datensätzen aufzuzeigen. Eine Stahlkugel wurde aus verschiedenen Höhen fallen gelassen; für jede Höhe wurde das Experiment 100 Mal wiederholt. |
|
HENRYSEM |
Henry-Konstante chemischer Substanzen zusammen mit molekularen Deskriptoren. Die physikalischen Daten wurden aus Hine et al. entnommen, die molekularen Deskriptoren durch Berechnungen mit TOPIX. |
|
HUMIDIT2 |
Durchschnittliche relative Luftfeuchtigkeit von 264 Städten in den USA. Der Datensatz enthält die Daten von Juni und September, die am Vormittag und am Nachmittag gemessen wurden. Zusätzlich sind die jährlichen Durchschnitte in den letzten zwei Spalten angegeben. |
|
IRIS |
Drei Irisarten: Die Pflanzen werden durch vier Variablen beschrieben. |
|
METHANE |
Dieser Datensatz enthält die Konzentrationen von atmosphärischem Methan, die monatlich über einen Zeitraum von September 1980 bis September 1988 gemessen wurden. |
|
MINWATER |
Chemische Analyse verschiedener Mineralwassersorten. |
|
MINWATER2 |
Teilmenge von MINWATER. |
|
MOTE9603 |
Klimatische Daten der Wetterstation Mote in Florida, USA. Der Datensatz enthält Messungen von 9 meteorologischen Variablen über einen Zeitraum von 10 Tagen, die im März 1996 aufgezeichnet wurden. |
Die Daten wurden freundlicherweise von Don Hayward zur Verfügung gestellt.
|
MOTETIDES |
Wasserstand bei der Wetterstation Mote in Florida, USA, gemessen im Juli 1998. Die Daten wurden alle 15 Minuten gemessen. |
|
MULTIEST |
Künstliche Daten, die in einem interaktiven Beispiel verwendet werden. |
|
POLYFIT |
Künstliche Daten, die eine polynomische Beziehung dritter Ordnung aufweisen. |
|
PRECIPITATION |
Monatlicher Niederschlag (in Zoll), gemessen von 1961-1990. |
|
REACTTEST |
Die Reaktionszeit von 9 Personen auf visuelle Stimulation. Das Experiment wurde an zwei Tagen wiederholt; eine Serie wurde vor einem zweistündigen Vortrag, die andere Serie danach erhoben. |
|
STRONTIUM |
Simulierte Daten, um den Zwei-Stichproben-t-Test zu zeigen. |
|
SUNSPOTS |
Durchschnittliche monatliche Zahl der Sonnenflecken zwischen 1874 und 1998. |
Die Daten wurden freundlicherweise von David H. Hathaway zur Verfügung gestellt. |
TRAIN |
Simulierte Daten, die eine schiefe Verteilung zeigen. |
|
TWOCLASS |
Künstliche Daten mit zwei Klassen von Messwerten. |
|
WATERRESID |
Teilmenge von MINWATER. |
|
WINE |
Chemische Analyse von drei italienischen Rotweinen (Barolo, Grignolino, Barbera). |
Daten mit freundlicher Genehmigung von M. Forina |
WINEGER |
Chemische Analyse verschiedener deutscher Weine. |
Die Daten wurden freundlicherweise von Klaus Danzer, Friedrich-Schiller-Universität Jena, Deutschland, zur Verfügung gestellt. |
WORLDPOP |
Demografische, soziologische und ökonomische Daten der Länder der Welt (1988). |
Die Daten stammen aus einer Reihe von Quellen wie den Vereinten Nationen, der Weltbank und der CIA |