Du befindest dich hier: FSI Informatik » Prüfungsfragen und Altklausuren » Hauptstudiumsprüfungen » Lehrstuhl 6 » Prüfungsprotokoll KDDDW Sommersemester 2012   (Übersicht)

Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen der Seite angezeigt.

Link zu der Vergleichsansicht

Nächste Überarbeitung
Vorherige Überarbeitung
pruefungen:hauptstudium:ls6:kdd_dw_ss12 [31.07.2012 14:30] – angelegt iblubbpruefungen:hauptstudium:ls6:kdd_dw_ss12 [22.02.2017 08:02] (aktuell) Hawara
Zeile 3: Zeile 3:
 ==== DW ==== ==== DW ====
 //Pruefer:// Prof. Ruf //Pruefer:// Prof. Ruf
 +
 //Art:// 60 Minuten Klausur (2,5 ECTS) //Art:// 60 Minuten Klausur (2,5 ECTS)
 +
 +----
  
 (leider nicht vollstaendig) (leider nicht vollstaendig)
 +
  
 - Definition nach Immon nennen und jeweils kurz erklaeren - Definition nach Immon nennen und jeweils kurz erklaeren
 +
 - Unterschiede zwischen RDBs und DWHs anhand Fokus, Anfrageunterstuetzung usw. - Unterschiede zwischen RDBs und DWHs anhand Fokus, Anfrageunterstuetzung usw.
-//Tabelle aus dem Skript//+ 
 +//-> Tabelle aus dem Skript// 
 - Wieso gibt es in DWHs so viele Nullwerte? - Wieso gibt es in DWHs so viele Nullwerte?
 +
 - Was ist fuer kleine Datenmengen besser: ROLAP oder MOLAP? - Was ist fuer kleine Datenmengen besser: ROLAP oder MOLAP?
 +
 - Je zwei Beispiele fuer STOCK, FLOW und VALUE-PER-UNIT nennen und erklaeren, wieso STOCK Probleme beim Aggregieren macht  - Je zwei Beispiele fuer STOCK, FLOW und VALUE-PER-UNIT nennen und erklaeren, wieso STOCK Probleme beim Aggregieren macht 
 +
 - Vorteile und Nachteile von MOLAP - Vorteile und Nachteile von MOLAP
 +
 +
 ==== KDD ==== ==== KDD ====
 +
 //Pruefer:// Prof. Meyer-Wegener //Pruefer:// Prof. Meyer-Wegener
 +
 //Art:// 30 Minuten muendlich (2,5 ECTS) //Art:// 30 Minuten muendlich (2,5 ECTS)
 +
 +----
  
 1. Outlier 1. Outlier
 +
 - Was sind Outlier? Welche Typen gibt es da? - Was sind Outlier? Welche Typen gibt es da?
 +
 - Wie kann ich diese entdecken?  - Wie kann ich diese entdecken? 
-//Methoden aufzaehlen, also supervised - unsupervised - semi-supervised und cluster - proximity - statistical//+ 
 +//-> Methoden aufzaehlen, also supervised - unsupervised - semi-supervised und cluster - proximity - statistical//
  
 2. Clustering 2. Clustering
 +
 -Welche Methoden gibt es da grob? -Welche Methoden gibt es da grob?
-//Partitioning: k-means erklaeren, Hierarchical: AGNES (Dendrogram!) und DIANA erklaeren, Density: DBSCAN erklaeren (density reachable)//+ 
 +//-> Partitioning: k-means erklaeren, Hierarchical: AGNES (Dendrogram!) und DIANA erklaeren, Density: DBSCAN erklaeren (density reachable)//
  
 3. Distanzmasze 3. Distanzmasze
 +
 - Welche gibt es fuer welche Attributtypen? - Welche gibt es fuer welche Attributtypen?
 +
 - Was ist der Unterschied zwischen Euklid und Manhattan? - Was ist der Unterschied zwischen Euklid und Manhattan?
  
 4. Classification 4. Classification
 +
 - Welche Methoden haben wir da so kennengelernt? - Welche Methoden haben wir da so kennengelernt?
-//Decision tree erklaeren: wie erstelle ich den Baum, wie waehle ich ein Attribut, wann stoppe ich//+ 
 +//-> Decision tree erklaeren: wie erstelle ich den Baum, wie waehle ich ein Attribut, wann stoppe ich//
  
 5. Association Rules 5. Association Rules
 +
 - Was ist das? - Was ist das?
 +
 - Wie kriegen wir die? - Wie kriegen wir die?
-//Frequent itemsets und Apriori erklaeren//+ 
 +//-> Frequent itemsets und Apriori erklaeren// 
 - Wie kriegen wir aus den frequent itemsets jetzt die Regeln? - Wie kriegen wir aus den frequent itemsets jetzt die Regeln?
  
  
 +//Prüfung WS 2016/17:// 
 +
 +Was genau ist KDD? Was ist der Unterschied im Vergleich zu normalen Datenbanken? (Generalization, Association, Cluster, Outlier, Classification)
 +
 +Data preprocessing erklären (Cleaning, Integration, Reduction, Transformation).
 +
 +Alles zu Cluster(Was ist ein Cluster, Worauf ist zu achten)
  
 +K-means erklären
  
 +Association Rules erklären/definieren (support/confidence)