Sie befinden sich hier: Termine » Prüfungsfragen und Altklausuren » Hauptstudiumsprüfungen » Lehrstuhl 6 » Prüfungsprotokoll KDDDW Sommersemester 2012   (Übersicht)

Prüfungsprotokoll KDDDW Sommersemester 2012

DW

Pruefer: Prof. Ruf

Art: 60 Minuten Klausur (2,5 ECTS)


(leider nicht vollstaendig)

- Definition nach Immon nennen und jeweils kurz erklaeren

- Unterschiede zwischen RDBs und DWHs anhand Fokus, Anfrageunterstuetzung usw.

→ Tabelle aus dem Skript

- Wieso gibt es in DWHs so viele Nullwerte?

- Was ist fuer kleine Datenmengen besser: ROLAP oder MOLAP?

- Je zwei Beispiele fuer STOCK, FLOW und VALUE-PER-UNIT nennen und erklaeren, wieso STOCK Probleme beim Aggregieren macht

- Vorteile und Nachteile von MOLAP

KDD

Pruefer: Prof. Meyer-Wegener

Art: 30 Minuten muendlich (2,5 ECTS)


1. Outlier

- Was sind Outlier? Welche Typen gibt es da?

- Wie kann ich diese entdecken?

→ Methoden aufzaehlen, also supervised - unsupervised - semi-supervised und cluster - proximity - statistical

2. Clustering

-Welche Methoden gibt es da grob?

→ Partitioning: k-means erklaeren, Hierarchical: AGNES (Dendrogram!) und DIANA erklaeren, Density: DBSCAN erklaeren (density reachable)

3. Distanzmasze

- Welche gibt es fuer welche Attributtypen?

- Was ist der Unterschied zwischen Euklid und Manhattan?

4. Classification

- Welche Methoden haben wir da so kennengelernt?

→ Decision tree erklaeren: wie erstelle ich den Baum, wie waehle ich ein Attribut, wann stoppe ich

5. Association Rules

- Was ist das?

- Wie kriegen wir die?

→ Frequent itemsets und Apriori erklaeren

- Wie kriegen wir aus den frequent itemsets jetzt die Regeln?

Prüfung WS 2016/17:

Was genau ist KDD? Was ist der Unterschied im Vergleich zu normalen Datenbanken? (Generalization, Association, Cluster, Outlier, Classification)

Data preprocessing erklären (Cleaning, Integration, Reduction, Transformation).

Alles zu Cluster(Was ist ein Cluster, Worauf ist zu achten)

K-means erklären

Association Rules erklären/definieren (support/confidence)