AMER II

Disclaimer: Dieser Thread wurde aus dem alten Forum importiert. Daher werden eventuell nicht alle Formatierungen richtig angezeigt. Der ursprüngliche Thread beginnt im zweiten Post dieses Threads.

AMER II
Sollte man eigentlich bei den ganzen Algorithmen z.B. EM Algoritmus die ganzen Formeln und Berechnungen wissen oder reicht es wenn man das Prinzip des Algorithmus versteht?


auf jeden fall ist es wichtig das prinzip erklären zu können. wurde so in dem repetitorium gesagt.
wenn dann noch die formeln einfach so aus einem raussprudeln und man die auch noch erklären kann, dann ists perfekt.
ob jetzt natürlich das erklären der algorithmen ausreicht um zu bestehen, das weis ich leider nicht. (so war wahrscheinlich die frage gemeint, oder?)


ich war nicht im repetitorium weil ich davon nichts wusste. wurde da der stoff irgendwie eingegrenzt?


ne, nicht das ich wüsste.
nur das wir den em-algorithmus nicht perfekt runterleihern können müssen, aber zumindest verstanden haben und erklären können sollten.


irgendwie tue ich mich schwer mit diesem EM Algo. im Skript steht irgendwas mit Wahrscheinlichkeiten drinnen und im netz heisst es, es gehe dabei um zuordunng von Punkten zu Clustern nach bestimmten kriterien.


soweit ich weiss, stimmt beides, der EM algorithmus bestimmt die cluster zugehörigkeit mit hilfe der wahrscheinlichkeit…


kurz gesagt kann der em-algo folgendes.

  1. für unvollständige merkmalsvektoren (man kann vielleicht irgend was nicht berechnen) kann er mit hilfe der marginalisierung (also man integriert über die fehlende eigenschaft) trotzdem klassifizieren.

  2. er kann eine noch nicht klassifizierte menge von merkmalsvektoren klassifizieren


kann mir jemand mal die MEL Skala mal erklären


… bzw die MEL Datenbank


irgendjemand aus dem höheren symester hat mal gemeint das man für die AMER prüfung 2 stunden lernen muss allerdings halte ich das für ein gerücht


naja ich kann mir schon vorstellen, dass wenn man von der materie etwas ahnung hat , dass das recht schnell geht, derweil ich jetzt auch nimmer weiss, was ich noch lernen soll… vielleicht noch ein paar formeln…

man muss ja auch immer dran denken, es ist ja “nur” ein nebenfach, wie hart kann das werden…

also du meinst doch den Dreiecksfilter? oder? der ist dazu da, die MEL Koeffizienten , die man für nen merkmalsvektor braucht, zu bekommen…
und die ist halt ans menschliche gehör angelehnt… da man niedrigere frequenzen besser hört als hohe…darum werden da auch mehrere berechnet… also mehr dreiecke…

eine standard merkmalsvektor findest du im skript 4 glaub ich recht weit unten…

bestehend aus:

Kurzeit Energie,
1 Ableitung und 2 Ableitung von 12 Mel Koeffizienten


Die Mel-Skala macht denk ich folgendes:
Sie versucht, das Signal so zu modifizieren, wie es das menschliche Gehör tut. Das hört nämlich nicht überall gleich gut. Bis 1000Hz kann das Gehör Frequenzen mit linearer Genauigkeit unterscheiden. Über 1000 Hz wird die Unterscheidung schlechter (logarithmisch).
Steht in den Präsentationsfolien vom Gastvortrag.

Auch wenn 2 Stunden reichen sollten, lern ich lieber ein paar mehr und freu mich dann, wenn die Prüfung gut gelaufen ist. Außerdem lernen wir ja fürs Leben und nicht für die Uni :finger: :smiley:


dienen dann die Merkmalsvektoren nach der Melskala zur Unterscheidung von Tönen? denn Laute oder Buchstaben werden durch ihre Grundfrequenz und Frequenzverformungen in den jeweiligen Resonanzräumen bestimmt. soweit ich das sehe braucht man zur Buchstabenerkennung keine MEL Skala.


ich schätz mal in der Melskala geht es besser, weil man da mit einer geringeren Auflösung auskommt. Das wichtigste spielt sich ja unterhalb der 1000 Hz ab. Darüber sind hauptsächlich die Harmonischen, die man nicht unbedingt zur Erkennung braucht. Damit kann man dann allenfalls verschiedene Stimmen voneinander unterscheiden.


muss man eigentlich genau wissen, wie die sprache aus anatomischer sicht entsteht? wir sind ja schließlich keine mediziner


ja


so, Schluss für heute. Viel Glück morgen. Ich schau mal, dass ich ne Zusammenfassung von meiner Prüfung hier rein stell. Vielleicht bringts dem ein oder anderen ja noch was und wenn’s nur das ist, dass er in Panik gerät g


ok, hier die Zusammenfassung meiner Pruefung:
Pruefer: Jochen Schmidt
Themen:
Abtastung und Quantisierung
Spektrogramme (aufmalen und Skalen erklaeren)
Fenstern (typische Werte, Grund, Schmalband, Breitband)
Merkmalsgewinnung (Mel-Cepstrum - wie entsteht es, wie bildet man die Ableitung)
Worterkennung (Probleme mit Dehnung, Prinzip des dynamic time warping erklaeren, Optimalitaetsprinzip…)
Klassifikation (neuronale Netze, Aufbau und Funktionsweise, Training mit Backpropagation)

Man muss oefter mal ein paar Grafiken aufmalen, und dann erklaeren. Formeln wurde ich keine gefragt und auch genau Funktionsweise der Algorithmen kam nicht dran. Man sollte aber verstanden haben, welche Idee dahinter steckt und wozu sie gut sind.

Was etwas schwierig war: Wenn man unsicher war, hat man kaum eine Bestaetigung bekommen, wenn man etwas richtiges gesagt hatte. Manchmal wusste ich wirklich nicht, ob ich in eine total falsche Richtung renn. Aber vielleicht lag es auch daran, dass ich grossteils richtig lag.

Nach einiger Unschluessigkeit haben sie mir dann doch die 1,3 gegeben.

Fazit: leichter als gedacht. 2 Stunden haetten aber nicht gereicht.

Viel Glueck allen, die noch dran kommen!


ok . nun mein fazit.

sie fragen einen alles mögliche. bis die zeit rum ist.

bei mir fings an mit erzeugung der sparche. dann cepstrum und mel cepstrum, Spektrogramm , fensterung des signals und neuronales netz.

im großen und ganzen bringen sie einen oft dazu sachen die man anfangs nicht weiss schritt für schritt herzuleiten.

z.b. warum verwendet man die signuidfunktion bei neuronalen nätzen.

insgesamt aber ohne probleme machbar.