Du befindest dich hier: FSI Informatik » Prüfungsfragen und Altklausuren » Hauptstudiumsprüfungen » AudioLabs » Vorbereitung   (Übersicht)

Pruefung: MPA
Datum: 25.01.2016
Pruefer: Prof. Dr. Meinard Müller
Beisitzer: Stefan Balke
Ergebnis: sehr gut

Vorbereitung

  • Alle Folien haendisch zusammengefasst
  • Spezialkapitel (das, das ich zusammengefasst habe, (Tempo & Beat Tracking)) extra genau angeguckt
  • Unklarheiten nochmal im Buch nachgelesen, auf Verstaendnis gelernt
  • Aber auch eine DIN-A4 Seite Formeln auswendig.
    • Insbesondere: Fmidi, Fourier transf/repr/shorttime kontinuierlich, pitch-klassen, dtw formalismus

Pruefung

Atmosphaere war ziemlich entspannt, ich hab aber auch die meiste Zeit geredet. Teilweise war er ein bisschen kleinlich. D.h. wenn man etwas hinschreibt, sollte man auch sicher sein, dass es stimmt, weil er springt nicht ueber kleinere Fehler hinweg. *Kleinere* unschaerfen, was die mathematische Formulierung angeht, werden jedoch akzeptiert. Davon war ich ziemlich positiv ueberrascht. Der Beisitzer hat sich gar nicht eingemischt.

  • Einstieg ueber das zusammengefasste Kapitel (Tempo & Beat Tracking). Das habe ich frei vorgetragen, wurde jeweils nach 2 Onset-Detection Methoden (Energy, Spectral) und einem Beat-Tracking Algorithmus (PLP) wurde ich abgebrochen
  • Dann Fourier: Soll Fourier-Transformation formal definieren, habe mich fuer kontinuierlich entschieden. Hier hat er gefragt, ob ich den periodischen oder nichtperiodischen Fall skizzieren und ich hatte keine Ahnung (ich hab den nichtperiodischen Fall gemacht, d.h. ueber ganz R integriert). Hab da gleich noch die Fourier-Repraesentation angefuegt und dargelegt wie Fourier- Transformation intuitiv funktioniert wie man die Umkehrung macht. Dass man einen komplexen Wert rauskriegt und was dieser aussagt (Magnitude und Phase). Und was die Formel-Stuecke (f(t), exp(-2ωπit)) da bedeuten und warum sie da sind.
  • Wie sampling funktioniert? ⇒ x(n) = f(nT), was ist eine SamplingFrequenz ⇒ 1/T ? Was sind typische Frequenzen zB bei CD, warum? 44,1kHz, weil Mensch bis etwa 22,05kHz hoeren kann
  • Dann musste ich den k-ten Bin χ(k) eines DT-Vektors erklaeren, d.h. zu welcher Frequenz er gehoert. Gegeben waren: N= 4000, T = 40k
  • Sprung zu DTW: Formal skizzieren ⇒ Zwei Vektoren X=(x1…xN), Y=(y1…yN); ein warping-path P=(p1…pL) mit pl = (xn, ym) und xn und ym sind Indizes in X und Y. Nach Boundary conditions hat er als „Eigenschaften des Warping Paths“ gefragt, das hat mich ein bisschen verwirrt. Die habe ich dann jedenfalls auch noch hingeschrieben, monotonicity sollte ich ueberspringen.
  • Jetzt war nicht mehr viel Zeit. Ich sollte noch kurz auf Fingerprinting eingehen, insb. was es kann und was nicht (Aufnahmen identifizieren, nicht Lieder, insb. keine Live-Aufnahmen Liedern zuordnen). Dann noch, weil ich Informatiker sei, wie Shazam das mit den Hashes macht. Da hab ich zunaechst kurz skizziert, wie die Maxima gebildet werden, dann das Tuple von Frequenzen und Abstaende in einem Fenster, nicht nur einzelne Frequenzen, gehasht werden, um die Anzahl der Hashes erhoehen zu koennen. Denn der Speed-Up haengt davon ab, wie viele Hashes man hat (vorausgesetzt die Maxima sind gleichverteilt). Das hab ich dann noch begruendet (man muss alle Eintraege, auf die ein Hash verweist durchgehen) und was die Nachteile des Verfahrens sind (ein maximum, das nicht erkannt wurde zieht das ganze Tupel in den Abgrund). Er wollte dann noch hoeren, dass man dadurch auch mehr Eintraege in den Listen kriegt und sich aber ausrechnen kann, dass man trotzdem noch einen Speed-Up hat. Aber da war die Zeit auch schon rum.