refactor(ReforceXY): cleanup variables namespace

author Jérôme Benoit <jerome.benoit@piment-noir.org>

Mon, 22 Dec 2025 18:54:52 +0000 (19:54 +0100)

committer Jérôme Benoit <jerome.benoit@piment-noir.org>

Mon, 22 Dec 2025 18:54:52 +0000 (19:54 +0100)
author Jérôme Benoit <jerome.benoit@piment-noir.org>
Mon, 22 Dec 2025 18:54:52 +0000 (19:54 +0100)
committer Jérôme Benoit <jerome.benoit@piment-noir.org>
Mon, 22 Dec 2025 18:54:52 +0000 (19:54 +0100)
diff --git a/ReforceXY/reward_space_analysis/reward_space_analysis.py b/ReforceXY/reward_space_analysis/reward_space_analysis.py

index 4e6273f0f56e8d19ade7a6d51a5b26949cff42f2..49a99b1e72a495c1ea61f7cec1290894a84acaff 100644 (file)
--- a/ReforceXY/reward_space_analysis/reward_space_analysis.py
+++ b/ReforceXY/reward_space_analysis/reward_space_analysis.py
@@ -1368,9 +1368,9 @@ def calculate_reward(
          breakdown.total = total_reward
          return breakdown
  
-    prev_potential_safe = float(prev_potential) if np.isfinite(prev_potential) else 0.0
-    breakdown.prev_potential = prev_potential_safe
-    breakdown.next_potential = prev_potential_safe
+    prev_potential = float(prev_potential) if np.isfinite(prev_potential) else 0.0
+    breakdown.prev_potential = prev_potential
+    breakdown.next_potential = prev_potential
      breakdown.total = base_reward
  
      return breakdown
author	Jérôme Benoit <jerome.benoit@piment-noir.org>
	Mon, 22 Dec 2025 18:54:52 +0000 (19:54 +0100)
committer	Jérôme Benoit <jerome.benoit@piment-noir.org>
	Mon, 22 Dec 2025 18:54:52 +0000 (19:54 +0100)