Du befindest dich hier: FSI Informatik » Prüfungsfragen und Altklausuren » Hauptstudiumsprüfungen » Lehrstuhl 6 » Prüfungsprotokoll KDDDW Sommersemester 2012 (Übersicht)
Dies ist eine alte Version des Dokuments!
Inhaltsverzeichnis
Prüfungsprotokoll KDDDW Sommersemester 2012
DW
Pruefer: Prof. Ruf Art: 60 Minuten Klausur (2,5 ECTS)
(leider nicht vollstaendig)
- Definition nach Immon nennen und jeweils kurz erklaeren - Unterschiede zwischen RDBs und DWHs anhand Fokus, Anfrageunterstuetzung usw. Tabelle aus dem Skript - Wieso gibt es in DWHs so viele Nullwerte? - Was ist fuer kleine Datenmengen besser: ROLAP oder MOLAP? - Je zwei Beispiele fuer STOCK, FLOW und VALUE-PER-UNIT nennen und erklaeren, wieso STOCK Probleme beim Aggregieren macht - Vorteile und Nachteile von MOLAP
KDD
Pruefer: Prof. Meyer-Wegener Art: 30 Minuten muendlich (2,5 ECTS)
1. Outlier - Was sind Outlier? Welche Typen gibt es da? - Wie kann ich diese entdecken? Methoden aufzaehlen, also supervised - unsupervised - semi-supervised und cluster - proximity - statistical
2. Clustering -Welche Methoden gibt es da grob? Partitioning: k-means erklaeren, Hierarchical: AGNES (Dendrogram!) und DIANA erklaeren, Density: DBSCAN erklaeren (density reachable)
3. Distanzmasze - Welche gibt es fuer welche Attributtypen? - Was ist der Unterschied zwischen Euklid und Manhattan?
4. Classification - Welche Methoden haben wir da so kennengelernt? Decision tree erklaeren: wie erstelle ich den Baum, wie waehle ich ein Attribut, wann stoppe ich
5. Association Rules - Was ist das? - Wie kriegen wir die? Frequent itemsets und Apriori erklaeren - Wie kriegen wir aus den frequent itemsets jetzt die Regeln?