Evaluierung

Disclaimer: Dieser Thread wurde aus dem alten Forum importiert. Daher werden eventuell nicht alle Formatierungen richtig angezeigt. Der ursprüngliche Thread beginnt im zweiten Post dieses Threads.

Evaluierung
Hallo,

ich habe es endlich geschafft die Alogithmen zum laufen zu bekommen (noch 2x2), leider verstehe ich nicht so recht,
wie ich diese gegeneinander evaluieren kann, also welches Ergebnis besser oder schlechter ist.
Gibts da irgendwelche Infos zu? Also Stichwörter die ich mal Suchen kann um mich schlau zu machen,
oder Infos die mir dabei weiterhelfen?

Danke im voraus


naja check mal die policy ab die ausgerechnet wurde. die sagt dir fuer jeden state die optimale action. das kannst du dann mit dem trainingsset mal ausprobieren, dafuer braucht man zb ne klasse warehouse die ein array mit 4 plaetzen hat die kannst du dann mit dem testset ausprobieren und die wege addieren die der roboter macht. das kann man dann gegen die gefahrene distanz von einen greedy roboter der alles auf den ersten freien platz legt vergleichen zum beispiel