From: Jérôme Benoit <jerome.benoit@piment-noir.org>
Date: Mon, 17 Feb 2025 11:39:54 +0000 (+0100)
Subject: feat(qav3): display and save stepped optuna best trials
X-Git-Url: https://git.piment-noir.org/?a=commitdiff_plain;h=286ff437edf1ee171fe827732804809566685fd0;p=freqai-strategies.git

feat(qav3): display and save stepped optuna best trials

Signed-off-by: Jérôme Benoit <jerome.benoit@piment-noir.org>
---

diff --git a/quickadapter/user_data/config-template.json b/quickadapter/user_data/config-template.json
index 389343d..c518f44 100644
--- a/quickadapter/user_data/config-template.json
+++ b/quickadapter/user_data/config-template.json
@@ -132,7 +132,8 @@
       "&s-minima_threshold": -2,
       "&s-maxima_threshold": 2,
       "label_period_candles": 100,
-      "rmse": 0
+      "hp_rmse": 0,
+      "period_rmse": 0
     },
     "feature_parameters": {
       "include_corr_pairlist": [
diff --git a/quickadapter/user_data/freqaimodels/LightGBMRegressorQuickAdapterV35.py b/quickadapter/user_data/freqaimodels/LightGBMRegressorQuickAdapterV35.py
index 69d50fb..0de8167 100644
--- a/quickadapter/user_data/freqaimodels/LightGBMRegressorQuickAdapterV35.py
+++ b/quickadapter/user_data/freqaimodels/LightGBMRegressorQuickAdapterV35.py
@@ -1,5 +1,7 @@
 import logging
+import json
 from typing import Any, Dict
+from pathlib import Path
 
 from lightgbm import LGBMRegressor
 import time
@@ -50,6 +52,8 @@ class LightGBMRegressorQuickAdapterV35(BaseRegressionModel):
             and self.__optuna_config.get("enabled", False)
             and self.data_split_parameters.get("test_size", TEST_SIZE) > 0
         )
+        self.__optuna_hp_rmse: dict[str, float | None] = {}
+        self.__optuna_period_rmse: dict[str, float | None] = {}
         self.__optuna_hp_params: dict[str, dict] = {}
         self.__optuna_period_params: dict[str, dict] = {}
 
@@ -74,7 +78,7 @@ class LightGBMRegressorQuickAdapterV35(BaseRegressionModel):
 
         start = time.time()
         if self.__optuna_hyperopt:
-            optuna_hp_params = self.optuna_hp_optimize(
+            optuna_hp_params, optuna_hp_rmse = self.optuna_hp_optimize(
                 dk, X, y, train_weights, X_test, y_test, test_weights
             )
             if optuna_hp_params:
@@ -85,8 +89,12 @@ class LightGBMRegressorQuickAdapterV35(BaseRegressionModel):
                     **model_training_parameters,
                     **self.__optuna_hp_params[dk.pair],
                 }
+            if optuna_hp_rmse:
+                if dk.pair not in self.__optuna_hp_rmse:
+                    self.__optuna_hp_rmse[dk.pair] = None
+                self.__optuna_hp_rmse[dk.pair] = optuna_hp_rmse
 
-            optuna_period_params = self.optuna_period_optimize(
+            optuna_period_params, optuna_period_rmse = self.optuna_period_optimize(
                 dk,
                 X,
                 y,
@@ -100,6 +108,10 @@ class LightGBMRegressorQuickAdapterV35(BaseRegressionModel):
                 if dk.pair not in self.__optuna_period_params:
                     self.__optuna_period_params[dk.pair] = {}
                 self.__optuna_period_params[dk.pair] = optuna_period_params
+            if optuna_period_rmse:
+                if dk.pair not in self.__optuna_period_rmse:
+                    self.__optuna_period_rmse[dk.pair] = None
+                self.__optuna_period_rmse[dk.pair] = optuna_period_rmse
 
             if self.__optuna_period_params.get(dk.pair):
                 train_window = self.__optuna_period_params[dk.pair].get(
@@ -216,9 +228,12 @@ class LightGBMRegressorQuickAdapterV35(BaseRegressionModel):
                 "label_period_candles", self.ft_params["label_period_candles"]
             )
         )
-        dk.data["extra_returns_per_train"]["rmse"] = self.__optuna_period_params.get(
+        dk.data["extra_returns_per_train"]["hp_rmse"] = self.__optuna_hp_rmse.get(
             pair, {}
-        ).get("rmse", 0)
+        )
+        dk.data["extra_returns_per_train"]["period_rmse"] = (
+            self.__optuna_period_rmse.get(pair, {})
+        )
 
     def eval_set_and_weights(self, X_test, y_test, test_weights):
         if self.data_split_parameters.get("test_size", TEST_SIZE) == 0:
@@ -277,7 +292,7 @@ class LightGBMRegressorQuickAdapterV35(BaseRegressionModel):
         X_test,
         y_test,
         test_weights,
-    ) -> dict | None:
+    ) -> tuple[dict | None, float | None]:
         study_name = f"hp-{dk.pair}"
         storage = self.optuna_storage(dk)
         pruner = optuna.pruners.HyperbandPruner()
@@ -316,15 +331,20 @@ class LightGBMRegressorQuickAdapterV35(BaseRegressionModel):
             )
         except Exception as e:
             logger.error(f"Optuna hp hyperopt failed: {e}", exc_info=True)
-            return None
+            return None, None
         time_spent = time.time() - start
         logger.info(f"Optuna hp hyperopt done ({time_spent:.2f} secs)")
 
+        hp_best_params_path = Path(
+            dk.full_path / f"{dk.pair.split('/')[0]}_optuna_hp_best_params.json"
+        )
+        with hp_best_params_path.open("w", encoding="utf-8") as write_file:
+            json.dump(study.best_params, write_file, indent=4)
         params = study.best_params
         # log params
         for key, value in {"rmse": study.best_value, **params}.items():
             logger.info(f"Optuna hp hyperopt | {key:>20s} : {value}")
-        return params
+        return params, study.best_value
 
     def optuna_period_optimize(
         self,
@@ -336,7 +356,7 @@ class LightGBMRegressorQuickAdapterV35(BaseRegressionModel):
         y_test,
         test_weights,
         model_training_parameters,
-    ) -> dict | None:
+    ) -> tuple[dict | None, float | None]:
         study_name = f"period-{dk.pair}"
         storage = self.optuna_storage(dk)
         pruner = optuna.pruners.HyperbandPruner()
@@ -354,9 +374,7 @@ class LightGBMRegressorQuickAdapterV35(BaseRegressionModel):
         if self.optuna_study_has_best_params(previous_study):
             study.enqueue_trial(previous_study.best_params)
         elif self.__optuna_period_params.get(dk.pair):
-            previous_best_params = self.__optuna_period_params[dk.pair].copy()
-            del previous_best_params["rmse"]
-            study.enqueue_trial(previous_best_params)
+            study.enqueue_trial(self.__optuna_period_params[dk.pair])
         start = time.time()
         try:
             study.optimize(
@@ -380,15 +398,20 @@ class LightGBMRegressorQuickAdapterV35(BaseRegressionModel):
             )
         except Exception as e:
             logger.error(f"Optuna period hyperopt failed: {e}", exc_info=True)
-            return None
+            return None, None
         time_spent = time.time() - start
         logger.info(f"Optuna period hyperopt done ({time_spent:.2f} secs)")
 
-        params = {"rmse": study.best_value, **study.best_params}
+        period_best_params_path = Path(
+            dk.full_path / f"{dk.pair.split('/')[0]}_optuna_period_best_params.json"
+        )
+        with period_best_params_path.open("w", encoding="utf-8") as write_file:
+            json.dump(study.best_params, write_file, indent=4)
+        params = study.best_params
         # log params
-        for key, value in params.items():
+        for key, value in {"rmse": study.best_value, **params}.items():
             logger.info(f"Optuna period hyperopt | {key:>20s} : {value}")
-        return params
+        return params, study.best_value
 
     def optuna_study_load_and_cleanup(
         self, study_name: str, storage
diff --git a/quickadapter/user_data/freqaimodels/XGBoostRegressorQuickAdapterV35.py b/quickadapter/user_data/freqaimodels/XGBoostRegressorQuickAdapterV35.py
index cdc6dce..6618be3 100644
--- a/quickadapter/user_data/freqaimodels/XGBoostRegressorQuickAdapterV35.py
+++ b/quickadapter/user_data/freqaimodels/XGBoostRegressorQuickAdapterV35.py
@@ -1,5 +1,7 @@
 import logging
+import json
 from typing import Any, Dict
+from pathlib import Path
 
 from xgboost import XGBRegressor
 import time
@@ -50,6 +52,8 @@ class XGBoostRegressorQuickAdapterV35(BaseRegressionModel):
             and self.__optuna_config.get("enabled", False)
             and self.data_split_parameters.get("test_size", TEST_SIZE) > 0
         )
+        self.__optuna_hp_rmse: dict[str, float | None] = {}
+        self.__optuna_period_rmse: dict[str, float | None] = {}
         self.__optuna_hp_params: dict[str, dict] = {}
         self.__optuna_period_params: dict[str, dict] = {}
 
@@ -74,7 +78,7 @@ class XGBoostRegressorQuickAdapterV35(BaseRegressionModel):
 
         start = time.time()
         if self.__optuna_hyperopt:
-            optuna_hp_params = self.optuna_hp_optimize(
+            optuna_hp_params, optuna_hp_rmse = self.optuna_hp_optimize(
                 dk, X, y, train_weights, X_test, y_test, test_weights
             )
             if optuna_hp_params:
@@ -85,8 +89,12 @@ class XGBoostRegressorQuickAdapterV35(BaseRegressionModel):
                     **model_training_parameters,
                     **self.__optuna_hp_params[dk.pair],
                 }
+            if optuna_hp_rmse:
+                if dk.pair not in self.__optuna_hp_rmse:
+                    self.__optuna_hp_rmse[dk.pair] = None
+                self.__optuna_hp_rmse[dk.pair] = optuna_hp_rmse
 
-            optuna_period_params = self.optuna_period_optimize(
+            optuna_period_params, optuna_period_rmse = self.optuna_period_optimize(
                 dk,
                 X,
                 y,
@@ -100,6 +108,10 @@ class XGBoostRegressorQuickAdapterV35(BaseRegressionModel):
                 if dk.pair not in self.__optuna_period_params:
                     self.__optuna_period_params[dk.pair] = {}
                 self.__optuna_period_params[dk.pair] = optuna_period_params
+            if optuna_period_rmse:
+                if dk.pair not in self.__optuna_period_rmse:
+                    self.__optuna_period_rmse[dk.pair] = None
+                self.__optuna_period_rmse[dk.pair] = optuna_period_rmse
 
             if self.__optuna_period_params.get(dk.pair):
                 train_window = self.__optuna_period_params[dk.pair].get(
@@ -217,9 +229,12 @@ class XGBoostRegressorQuickAdapterV35(BaseRegressionModel):
                 "label_period_candles", self.ft_params["label_period_candles"]
             )
         )
-        dk.data["extra_returns_per_train"]["rmse"] = self.__optuna_period_params.get(
+        dk.data["extra_returns_per_train"]["hp_rmse"] = self.__optuna_hp_rmse.get(
             pair, {}
-        ).get("rmse", 0)
+        )
+        dk.data["extra_returns_per_train"]["period_rmse"] = (
+            self.__optuna_period_rmse.get(pair, {})
+        )
 
     def eval_set_and_weights(self, X_test, y_test, test_weights):
         if self.data_split_parameters.get("test_size", TEST_SIZE) == 0:
@@ -278,7 +293,7 @@ class XGBoostRegressorQuickAdapterV35(BaseRegressionModel):
         X_test,
         y_test,
         test_weights,
-    ) -> dict | None:
+    ) -> tuple[dict | None, float | None]:
         study_name = f"hp-{dk.pair}"
         storage = self.optuna_storage(dk)
         pruner = optuna.pruners.HyperbandPruner()
@@ -317,15 +332,20 @@ class XGBoostRegressorQuickAdapterV35(BaseRegressionModel):
             )
         except Exception as e:
             logger.error(f"Optuna hp hyperopt failed: {e}", exc_info=True)
-            return None
+            return None, None
         time_spent = time.time() - start
         logger.info(f"Optuna hp hyperopt done ({time_spent:.2f} secs)")
 
+        hp_best_params_path = Path(
+            dk.full_path / f"{dk.pair.split('/')[0]}_optuna_hp_best_params.json"
+        )
+        with hp_best_params_path.open("w", encoding="utf-8") as write_file:
+            json.dump(study.best_params, write_file, indent=4)
         params = study.best_params
         # log params
         for key, value in {"rmse": study.best_value, **params}.items():
             logger.info(f"Optuna hp hyperopt | {key:>20s} : {value}")
-        return params
+        return params, study.best_value
 
     def optuna_period_optimize(
         self,
@@ -337,7 +357,7 @@ class XGBoostRegressorQuickAdapterV35(BaseRegressionModel):
         y_test,
         test_weights,
         model_training_parameters,
-    ) -> dict | None:
+    ) -> tuple[dict | None, float | None]:
         study_name = f"period-{dk.pair}"
         storage = self.optuna_storage(dk)
         pruner = optuna.pruners.HyperbandPruner()
@@ -355,9 +375,7 @@ class XGBoostRegressorQuickAdapterV35(BaseRegressionModel):
         if self.optuna_study_has_best_params(previous_study):
             study.enqueue_trial(previous_study.best_params)
         elif self.__optuna_period_params.get(dk.pair):
-            previous_best_params = self.__optuna_period_params[dk.pair].copy()
-            del previous_best_params["rmse"]
-            study.enqueue_trial(previous_best_params)
+            study.enqueue_trial(self.__optuna_period_params[dk.pair])
         start = time.time()
         try:
             study.optimize(
@@ -381,15 +399,20 @@ class XGBoostRegressorQuickAdapterV35(BaseRegressionModel):
             )
         except Exception as e:
             logger.error(f"Optuna period hyperopt failed: {e}", exc_info=True)
-            return None
+            return None, None
         time_spent = time.time() - start
         logger.info(f"Optuna period hyperopt done ({time_spent:.2f} secs)")
 
-        params = {"rmse": study.best_value, **study.best_params}
+        period_best_params_path = Path(
+            dk.full_path / f"{dk.pair.split('/')[0]}_optuna_period_best_params.json"
+        )
+        with period_best_params_path.open("w", encoding="utf-8") as write_file:
+            json.dump(study.best_params, write_file, indent=4)
+        params = study.best_params
         # log params
-        for key, value in params.items():
+        for key, value in {"rmse": study.best_value, **params}.items():
             logger.info(f"Optuna period hyperopt | {key:>20s} : {value}")
-        return params
+        return params, study.best_value
 
     def optuna_study_load_and_cleanup(
         self, study_name: str, storage
diff --git a/quickadapter/user_data/strategies/QuickAdapterV3.py b/quickadapter/user_data/strategies/QuickAdapterV3.py
index 9cfa1d9..f39ff5c 100644
--- a/quickadapter/user_data/strategies/QuickAdapterV3.py
+++ b/quickadapter/user_data/strategies/QuickAdapterV3.py
@@ -74,7 +74,10 @@ class QuickAdapterV3(IStrategy):
         return {
             "main_plot": {},
             "subplots": {
-                "accuracy": {"rmse": {"color": "#c28ce3", "type": "line"}},
+                "accuracy": {
+                    "hp_rmse": {"color": "#c28ce3", "type": "line"},
+                    "period_rmse": {"color": "#a3087a", "type": "line"},
+                },
                 "extrema": {
                     EXTREMA_COLUMN: {"color": "#f53580", "type": "line"},
                     MINIMA_THRESHOLD_COLUMN: {"color": "#4ae747", "type": "line"},