loss wird zu NaN

Disclaimer: Dieser Thread wurde aus dem alten Forum importiert. Daher werden eventuell nicht alle Formatierungen richtig angezeigt. Der ursprüngliche Thread beginnt im zweiten Post dieses Threads.

loss wird zu NaN
Nach längerem trainieren springt meine loss function plötzlich auf NaN. Hat jemand ein ähnliches Problem oder einen Lösungsansatz?
Als reward function habe ich einfach die Differenz zwischen den letzten zwei portfolio werten genommen.


Hatte ich auch mal. Bei mir trat das auf, wenn ich keinen fixen schlechten Reward hatte, also ähnlich wie bei dir. Aktuell habe ich einen festen negativen Reward, falls der alte Portfolio einen höheren Wert hatte. Falls der alte schlechter war, habe ich einen fixen positiven Reward, der mit dem Quotient aus neuem Value und altem Value multipliziert wird. Also bei neuem Wert 100 und altem Wert 80 z. B. Fixer Wert * (100/80) - das hat bei mir geklappt und nach mehrmaligem Testen trat seitdem das NaN Problem nicht mehr auf.


Das klingt seltsam.
Schau dir mal die zwei Portfolios an, bei denen das passiert: Sind die existent? Wie sehen sie aus?