Funktion um am test set zu testen

Disclaimer: Dieser Thread wurde aus dem alten Forum importiert. Daher werden eventuell nicht alle Formatierungen richtig angezeigt. Der ursprüngliche Thread beginnt im zweiten Post dieses Threads.

Funktion um am test set zu testen
Hallo,

gibt es eine Funktion um die policy auf das Testset anzuwenden oder muss man die selbst schreiben?

Grüße

Schließe mich der Frage an und…
… wäre es möglich, den Output der PolicyIteration und ValueIteration mal zur Verfügung zu stellen, sodass man die eigene Policy mit der “Musterpolicy” vergleichen kann?


Wie seid ihr denn für eine 2x3 Matrix auf Ergebnisse bei der Policy Iteration gekommen ohne dass euer Arbeitsspeicher vollgelaufen ist?


Trotz Sparse-Matrix funktioniert bei mir leider auch nur die ValueIteration. Gibt es einen Kniff :wink: wie es möglich ist, auf 3x2 die PolicyIteration ohne Memory Error auf Colab laufen zu lassen auf?