Du befindest dich hier: FSI Informatik » Prüfungsfragen und Altklausuren » Hauptstudiumsprüfungen » Lehrstuhl 6 » Prüfungsprotokoll KDDDW Sommersemester 2012 (Übersicht)
Dies ist eine alte Version des Dokuments!
Inhaltsverzeichnis
Prüfungsprotokoll KDDDW Sommersemester 2012
DW
Pruefer: Prof. Ruf
Art: 60 Minuten Klausur (2,5 ECTS)
(leider nicht vollstaendig)
- Definition nach Immon nennen und jeweils kurz erklaeren
- Unterschiede zwischen RDBs und DWHs anhand Fokus, Anfrageunterstuetzung usw.
→ Tabelle aus dem Skript
- Wieso gibt es in DWHs so viele Nullwerte?
- Was ist fuer kleine Datenmengen besser: ROLAP oder MOLAP?
- Je zwei Beispiele fuer STOCK, FLOW und VALUE-PER-UNIT nennen und erklaeren, wieso STOCK Probleme beim Aggregieren macht
- Vorteile und Nachteile von MOLAP
KDD
Pruefer: Prof. Meyer-Wegener
Art: 30 Minuten muendlich (2,5 ECTS)
1. Outlier
- Was sind Outlier? Welche Typen gibt es da?
- Wie kann ich diese entdecken?
→ Methoden aufzaehlen, also supervised - unsupervised - semi-supervised und cluster - proximity - statistical
2. Clustering
-Welche Methoden gibt es da grob?
→ Partitioning: k-means erklaeren, Hierarchical: AGNES (Dendrogram!) und DIANA erklaeren, Density: DBSCAN erklaeren (density reachable)
3. Distanzmasze
- Welche gibt es fuer welche Attributtypen?
- Was ist der Unterschied zwischen Euklid und Manhattan?
4. Classification
- Welche Methoden haben wir da so kennengelernt?
→ Decision tree erklaeren: wie erstelle ich den Baum, wie waehle ich ein Attribut, wann stoppe ich
5. Association Rules
- Was ist das?
- Wie kriegen wir die?
→ Frequent itemsets und Apriori erklaeren
- Wie kriegen wir aus den frequent itemsets jetzt die Regeln?