Du befindest dich hier: FSI Informatik » Prüfungsfragen und Altklausuren » Hauptstudiumsprüfungen » Lehrstuhl 6 » Prüfungsprotokoll KDDDW Sommersemester 2012   (Übersicht)

Dies ist eine alte Version des Dokuments!


Prüfungsprotokoll KDDDW Sommersemester 2012

DW

Pruefer: Prof. Ruf

Art: 60 Minuten Klausur (2,5 ECTS)


(leider nicht vollstaendig)

- Definition nach Immon nennen und jeweils kurz erklaeren

- Unterschiede zwischen RDBs und DWHs anhand Fokus, Anfrageunterstuetzung usw.

→ Tabelle aus dem Skript

- Wieso gibt es in DWHs so viele Nullwerte?

- Was ist fuer kleine Datenmengen besser: ROLAP oder MOLAP?

- Je zwei Beispiele fuer STOCK, FLOW und VALUE-PER-UNIT nennen und erklaeren, wieso STOCK Probleme beim Aggregieren macht

- Vorteile und Nachteile von MOLAP

KDD

Pruefer: Prof. Meyer-Wegener

Art: 30 Minuten muendlich (2,5 ECTS)


1. Outlier

- Was sind Outlier? Welche Typen gibt es da?

- Wie kann ich diese entdecken?

→ Methoden aufzaehlen, also supervised - unsupervised - semi-supervised und cluster - proximity - statistical

2. Clustering

-Welche Methoden gibt es da grob?

→ Partitioning: k-means erklaeren, Hierarchical: AGNES (Dendrogram!) und DIANA erklaeren, Density: DBSCAN erklaeren (density reachable)

3. Distanzmasze

- Welche gibt es fuer welche Attributtypen?

- Was ist der Unterschied zwischen Euklid und Manhattan?

4. Classification

- Welche Methoden haben wir da so kennengelernt?

→ Decision tree erklaeren: wie erstelle ich den Baum, wie waehle ich ein Attribut, wann stoppe ich

5. Association Rules

- Was ist das?

- Wie kriegen wir die?

→ Frequent itemsets und Apriori erklaeren

- Wie kriegen wir aus den frequent itemsets jetzt die Regeln?