Du befindest dich hier: FSI Informatik » Prüfungsfragen und Altklausuren » Hauptstudiumsprüfungen » Lehrstuhl 6 » Prüfungsprotokoll KDDDW Sommersemester 2012   (Übersicht)

Dies ist eine alte Version des Dokuments!


Prüfungsprotokoll KDDDW Sommersemester 2012

DW

Pruefer: Prof. Ruf Art: 60 Minuten Klausur (2,5 ECTS)

(leider nicht vollstaendig)

- Definition nach Immon nennen und jeweils kurz erklaeren - Unterschiede zwischen RDBs und DWHs anhand Fokus, Anfrageunterstuetzung usw. Tabelle aus dem Skript - Wieso gibt es in DWHs so viele Nullwerte? - Was ist fuer kleine Datenmengen besser: ROLAP oder MOLAP? - Je zwei Beispiele fuer STOCK, FLOW und VALUE-PER-UNIT nennen und erklaeren, wieso STOCK Probleme beim Aggregieren macht - Vorteile und Nachteile von MOLAP

KDD

Pruefer: Prof. Meyer-Wegener Art: 30 Minuten muendlich (2,5 ECTS)

1. Outlier - Was sind Outlier? Welche Typen gibt es da? - Wie kann ich diese entdecken? Methoden aufzaehlen, also supervised - unsupervised - semi-supervised und cluster - proximity - statistical

2. Clustering -Welche Methoden gibt es da grob? Partitioning: k-means erklaeren, Hierarchical: AGNES (Dendrogram!) und DIANA erklaeren, Density: DBSCAN erklaeren (density reachable)

3. Distanzmasze - Welche gibt es fuer welche Attributtypen? - Was ist der Unterschied zwischen Euklid und Manhattan?

4. Classification - Welche Methoden haben wir da so kennengelernt? Decision tree erklaeren: wie erstelle ich den Baum, wie waehle ich ein Attribut, wann stoppe ich

5. Association Rules - Was ist das? - Wie kriegen wir die? Frequent itemsets und Apriori erklaeren - Wie kriegen wir aus den frequent itemsets jetzt die Regeln?