Du befindest dich hier: FSI Informatik » Prüfungsfragen und Altklausuren » Hauptstudiumsprüfungen » AudioLabs » mpa_9_2_2015_1   (Übersicht)

  • Prüfungszeit: 30min
  • Datum: 9.2.2015
  • Prüfer: Prof. Dr. Meinard Müller
  • Beisitzer: ? (kannte ich nicht.)
  • Note: 1.0

Professor Müller vermittelt einen entspannten Eindruck während der Prüfung, hat aber eine gewisse Erwartungshaltung.

Mit DTW und Fourier sollte man immer rechnen. In der Vorlesung wir eindrücklich vermittelt, dass man formal die Fourier Transformation und die Definition eines N-M-Warping Paths der Länge L kennen muss ⇒ also sind diese Themengebiete automatisch Teil der Prüfung.

Die Prüfung beginnt mit einem Thema, dass man selbst wählen kann. Dieses Thema bekommt das meiste Gewicht. Ich habe mich Beat Tracking entschieden:

  • Grundsätzliche Problemstellungen bei der Takt-Verfolgung
  • Darstellung des Beats durch eine Novelty Function
  • Energie-basiertes Verfahren
    1. Summierung der Quadrate der gefensterten Funktion
    2. Differenzbildung
    3. Halbwellengleichrichtung
    4. Mögliche Verbesserung durch Logarithmieren
    5. eignet sich gut für perkussive Beats
    6. eignet sich schlecht für Takterkennung bei Instrumenten mit weichem Anschlag
  • Spektral-basiertes Verfahren
    1. Logarithmische Kompression für die meisten Signale essentiell
    2. Erkennung der Magnituden-Zunahme über Halbwellengleichrichtung der Differenzen der einzelnen Frequenz-Bins
    3. Summation der Bins gibt erste Form der Novelty Function
    4. Bildung eines lokalen Durchschnitts
    5. Differenz zwischen der ursprünglichen Novelty Function und des lokalen Durchschnitts
    6. Neue verbesserte Novelty Function über Halbwellengleichrichtung dieser Differenz
  • Tempogramme
    1. Fourier Tempogramm
      1. Eignung fürs Tatum und Tactus Niveau
      2. Hervorhebung der Verfachen des Haupttempos (Tempo Harmonics)
    2. Short-Time Autocorrelation Tempogramm
      1. Eignung fuers Tactus und Takt Niveau
      2. Hervorhebung der Teile des Haupttempos (Tempo Subharmonics)

Der Prüfer nimmt das Fourier Tempogramm als Übergang zur Fourier-Theorie:

  • Prüfer fordert auf, formal die Grundzüge zu skizzieren (fuer CT-Signale):
    1. Fourier Repräsentation
    2. Fourier Koeffizienten (komplex)
  • Spektrogramm
    1. Beispiel: Sinus mit 2Hz + Sinus mit 20Hz + Zwei Impulse
    2. Spektrogramm skizzieren
    3. Einfluss Fensterbreite
    4. Formal Äquidistantes Sampling definieren
    5. Zusammenhang Sampling Frequenz und Abstand der Samples
    6. Was ist die Sampling Frequenz einer CD: 44.1 kHz
    7. Dieser Wert wurde gewählt weil der Mensch bis zu 22.05 kHz hören kann.
    8. Nyquist Frequenz
    9. Aliasing
    10. welche physikalische Bedeutung hat der k-te Koeffizient einer DFT mit Länge N
    11. Welche Töne sind problematisch: tiefe Töne, wegen der wenigen Bins

Nun wird die DFT verwendet um Features für das Dynamic Time Warping zu generieren.

  • Beispiel:

aaabbbbb abaacccbbb

Kostenfunktion ist bei Ungleichheit 1, sonst 0

  • Was ist die DTW. Verwenden sie nicht den Algorithmus sondern einen „Educated Guess“
  • /me kritzelt ein wenig rum und komm in ~10 Sekunden auf ein viel versprechendes Ergebnis
  • Jetzt kann man noch zeigen, dass dieses Ergebnis optimal ist
  • Durch Ausschlussverfahren zeige ich das durch den Versuch eine Ungleichheit „auszumerzen“, immer zwingend mehr als eine neue Ungleichheit erzeugt wird
  • Somit ist die Lösung optimal

Es geht nun zum Thema Shazam. Das Thema wird nur sehr oberflächlich behandelt; die Zeit ist auch fast um (gefühlt):

  • Welches Problem soll gelöst werden?
  • Wie generiert Shazam seine Hashes
  • Warum wird es so gemacht