Frage zum Algorithm

Disclaimer: Dieser Thread wurde aus dem alten Forum importiert. Daher werden eventuell nicht alle Formatierungen richtig angezeigt. Der ursprüngliche Thread beginnt im zweiten Post dieses Threads.

Frage zum Algorithm
Hallo,

Meine Frage ist konkret nach den Schleifen, in denen man das Code implementieren soll. Erst mal habe ich versucht die Implementierungsschritte im trade() einfach ohne Wiederholung(Schleife) auszuführen, angenommen ist, dass im stock_exchange.run() auf ganze stock data iteriert wird. Aber das hat nicht geklappt, das Training hat nur ca. 5 Minuten gedauert und das Netz hat nichts gelernt.
Danach habe ich versucht im trade() noch mal auf die stock data zu iterieren und das hat sehr lang gedauert(mehr als zwei stelle). Kann jemand mir erklären, was an dieser Stell gemacht werden muss und wie das Netz im Allgemein lernen soll.


du brauchst idR keine einzige schleife im trade aufruf…
wenn du mehrere male self.model.fit aufrufen willst (mit mehreren eingabe, ausgabe daten) zb beim replay von alten erinnerung hingegen kann man das machen.
wenn dein NN nichts lernt, hast du vermutlich da was falsch gemacht.


Bitte schau dir die Main-Methode in der deep_q_learning_trader.py an.
Dort findest du die von dir gesuchte Schleife, mit welcher das neuronale Netz des DQL Traders trainiert wird.

In der trade() Methode benötigst du keine Schleife.