docs(reforcexy): refine README.md

author Jérôme Benoit <jerome.benoit@piment-noir.org>

Thu, 9 Oct 2025 21:46:09 +0000 (23:46 +0200)

committer Jérôme Benoit <jerome.benoit@piment-noir.org>

Thu, 9 Oct 2025 21:46:09 +0000 (23:46 +0200)
author Jérôme Benoit <jerome.benoit@piment-noir.org>
Thu, 9 Oct 2025 21:46:09 +0000 (23:46 +0200)
committer Jérôme Benoit <jerome.benoit@piment-noir.org>
Thu, 9 Oct 2025 21:46:09 +0000 (23:46 +0200)
diff --git a/ReforceXY/reward_space_analysis/README.md b/ReforceXY/reward_space_analysis/README.md

index 093331f2a9a2abf5cd19800911cc0039543d87a8..d63d4a359c4ed2949535828553659992b0a53a24 100644 (file)
--- a/ReforceXY/reward_space_analysis/README.md
+++ b/ReforceXY/reward_space_analysis/README.md
@@ -476,14 +476,10 @@ python reward_space_analysis.py \
  
  For production validation, compare synthetic analysis with real trading episodes:
  
-1. **Enable logging** in your ReforceXY config
-2. **Run training** to collect real episodes
-3. **Compare distributions** using `--real_episodes`
-
  ```shell
  python reward_space_analysis.py \
      --num_samples 100000 \
-    --real_episodes ../user_data/models/ReforceXY-PPO/sub_train_BTCUSDT_20231201/episode_rewards.pkl \
+    --real_episodes ../user_data/transitions/episode_rewards.pkl \
      --output real_vs_synthetic
  ```
author	Jérôme Benoit <jerome.benoit@piment-noir.org>
	Thu, 9 Oct 2025 21:46:09 +0000 (23:46 +0200)
committer	Jérôme Benoit <jerome.benoit@piment-noir.org>
	Thu, 9 Oct 2025 21:46:09 +0000 (23:46 +0200)