refactor(ReforceXY): align methods signature

author Jérôme Benoit <jerome.benoit@piment-noir.org>

Wed, 24 Dec 2025 21:15:55 +0000 (22:15 +0100)

committer Jérôme Benoit <jerome.benoit@piment-noir.org>

Wed, 24 Dec 2025 21:15:55 +0000 (22:15 +0100)
author Jérôme Benoit <jerome.benoit@piment-noir.org>
Wed, 24 Dec 2025 21:15:55 +0000 (22:15 +0100)
committer Jérôme Benoit <jerome.benoit@piment-noir.org>
Wed, 24 Dec 2025 21:15:55 +0000 (22:15 +0100)
diff --git a/ReforceXY/user_data/freqaimodels/ReforceXY.py b/ReforceXY/user_data/freqaimodels/ReforceXY.py

index e88efb62397e4329f949cc1ec4d607b689d3e525..1e55c476271d5c670739e9e825684c7ea3bf508b 100644 (file)
--- a/ReforceXY/user_data/freqaimodels/ReforceXY.py
+++ b/ReforceXY/user_data/freqaimodels/ReforceXY.py
@@ -2012,9 +2012,9 @@ class MyRLEnv(Base5ActionRLEnv):
      def _compute_hold_potential(
          self,
          position: Positions,
-        duration_ratio: float,
          pnl: float,
          pnl_target: float,
+        duration_ratio: float,
          scale: float,
      ) -> float:
          """Compute PBRS potential Φ(s) for position holding states.
@@ -2432,9 +2432,9 @@ class MyRLEnv(Base5ActionRLEnv):
              if self._hold_potential_enabled:
                  next_potential = self._compute_hold_potential(
                      next_position,
-                    next_duration_ratio,
                      next_pnl,
                      pnl_target,
+                    next_duration_ratio,
                      hold_potential_scale,
                  )
                  reward_shaping = gamma * next_potential - prev_potential
author	Jérôme Benoit <jerome.benoit@piment-noir.org>
	Wed, 24 Dec 2025 21:15:55 +0000 (22:15 +0100)
committer	Jérôme Benoit <jerome.benoit@piment-noir.org>
	Wed, 24 Dec 2025 21:15:55 +0000 (22:15 +0100)