Die Abbildungen sind lediglich grob den Originalen aus der Klausur nachempfunden. Die Aufgabenstellungen waren in der Klausur ähnlich ausschweifend wie in den Übungsblättern und sind hier gekürzt. ==== Aufgabe 1 ==== Die Definition von Data Mining befasst sich mit „Interessantheit“ von Daten. Welche Eigenschaften machen „Interessantheit“ aus? ==== Aufgabe 2 ==== Beschreiben Sie kurz die Funktion folgender R-Funktionen. * ''abline'' * ''ecdf'' * ''ifelse'' * ''merge'' * ''outer'' * ''reshape'' * ''with'' * ''table'' ==== Aufgabe 3 ==== In welche Anzahl von Gruppen sollten diese Fälle unterteilt werden? Entscheiden Sie aufgrund des folgenden Dendrogramms und geben Sie für jede Gruppe die zugehörigen Fälle an. Hier wurde ein __agglomeratives__ Verfahren mit __complete-linkage__ gewählt. Was bedeuten diese zwei Begriffe? {{:pruefungen:nebenfach:data_mining_dendrogramm_ss17.png?nolink&300|}} ==== Aufgabe 4 ==== Welches Problem ergibt sich, wenn man die Funktion „lm“ auf den folgenden Daten ausführt? Welches alternative Vorhersagemodell eignet sich hier besser? Wie lautet die entsprechende R-Funktion? {{:pruefungen:nebenfach:data_mining_r_daten_ausschnitt.png?nolink&300|}} ==== Aufgabe 5 ==== Bennen Sie die folgenden Diagramme! Diese Diagramme stellen entweder kategorische __oder__ metrische Merkmale und einzelne __oder__ mehrere Merkmale dar. Tragen sie für jeden Diagrammtyp die passenden Eigenschaften für die Merkmale ein. {{:pruefungen:nebenfach:data_mining_diagrams.png?nolink|}} ==== Aufgabe 6 ==== Manche Prädiktionsmodelle liefern Ereigniswahrscheinlichkeiten. Mithilfe von __Kalibrierung__ und __Trennung__ lassen sich diese Eintrittswahrscheinlichkeiten bewerten. Geben Sie jeweils die Definition und ein Beispiel für einen Test oder eine Grafik dafür an. ==== Aufgabe 7 ==== Erklären Sie (ggf. anhand einer Zeichnung) wie die Fakten und Dimensionen des Star-Schemas in einem Datawarehouse aufgebaut sind. ==== Aufgabe 8 ==== Wie kann Bootstrapping in Verbindung mit einem Prädiktionsmodell genutzt werden? Welche Vorteile und welche Nachteile entstehen hierbei? ==== Aufgabe 9 ==== Berechnen Sie Sensitivität und Spezifität. {{:pruefungen:nebenfach:data_mining_table1.png?nolink&300|}} ==== Aufgabe 10 ==== Berechnen sie jeweils ein Häufigkeitsmaß und Assoziationsmaß. Schützt nach diesen Erkenntnissen die Einnahme des Präparats vor einem erneuten Herzinfarkt? {{:pruefungen:nebenfach:data_mining_diagram2.png?nolink&300|}} ==== Aufgabe 11 ==== Beim mittleren Arteriellen Druck werden auch Schwankungen miteinberechnet. Welche statistischen oder grafischen Verfahren gibt es, die jeweils kurzfristige Schwankungen und Dauer eines zu niedrigen Blutdrucks feststellen?