feat(qav3): display and save stepped optuna best trials

author Jérôme Benoit <jerome.benoit@piment-noir.org>

Mon, 17 Feb 2025 11:39:54 +0000 (12:39 +0100)

committer Jérôme Benoit <jerome.benoit@piment-noir.org>

Mon, 17 Feb 2025 11:39:54 +0000 (12:39 +0100)
author Jérôme Benoit <jerome.benoit@piment-noir.org>
Mon, 17 Feb 2025 11:39:54 +0000 (12:39 +0100)
committer Jérôme Benoit <jerome.benoit@piment-noir.org>
Mon, 17 Feb 2025 11:39:54 +0000 (12:39 +0100)
diff --git a/quickadapter/user_data/config-template.json b/quickadapter/user_data/config-template.json

index 389343de64686243ddbf1adf1c438f690aed7069..c518f44eecb549c881c757b8808f752ea05a7a70 100644 (file)
--- a/quickadapter/user_data/config-template.json
+++ b/quickadapter/user_data/config-template.json
@@ -132,7 +132,8 @@
        "&s-minima_threshold": -2,
        "&s-maxima_threshold": 2,
        "label_period_candles": 100,
-      "rmse": 0
+      "hp_rmse": 0,
+      "period_rmse": 0
      },
      "feature_parameters": {
        "include_corr_pairlist": [
diff --git a/quickadapter/user_data/freqaimodels/LightGBMRegressorQuickAdapterV35.py b/quickadapter/user_data/freqaimodels/LightGBMRegressorQuickAdapterV35.py

index 69d50fbbf518fdf02f38028553bcda2146d1952e..0de8167d75a09f79dc2630dcca5971a3958820de 100644 (file)
--- a/quickadapter/user_data/freqaimodels/LightGBMRegressorQuickAdapterV35.py
+++ b/quickadapter/user_data/freqaimodels/LightGBMRegressorQuickAdapterV35.py
@@ -1,5 +1,7 @@
  import logging
+import json
  from typing import Any, Dict
+from pathlib import Path
  
  from lightgbm import LGBMRegressor
  import time
@@ -50,6 +52,8 @@ class LightGBMRegressorQuickAdapterV35(BaseRegressionModel):
              and self.__optuna_config.get("enabled", False)
              and self.data_split_parameters.get("test_size", TEST_SIZE) > 0
          )
+        self.__optuna_hp_rmse: dict[str, float | None] = {}
+        self.__optuna_period_rmse: dict[str, float | None] = {}
          self.__optuna_hp_params: dict[str, dict] = {}
          self.__optuna_period_params: dict[str, dict] = {}
  
@@ -74,7 +78,7 @@ class LightGBMRegressorQuickAdapterV35(BaseRegressionModel):
  
          start = time.time()
          if self.__optuna_hyperopt:
-            optuna_hp_params = self.optuna_hp_optimize(
+            optuna_hp_params, optuna_hp_rmse = self.optuna_hp_optimize(
                  dk, X, y, train_weights, X_test, y_test, test_weights
              )
              if optuna_hp_params:
@@ -85,8 +89,12 @@ class LightGBMRegressorQuickAdapterV35(BaseRegressionModel):
                      **model_training_parameters,
                      **self.__optuna_hp_params[dk.pair],
                  }
+            if optuna_hp_rmse:
+                if dk.pair not in self.__optuna_hp_rmse:
+                    self.__optuna_hp_rmse[dk.pair] = None
+                self.__optuna_hp_rmse[dk.pair] = optuna_hp_rmse
  
-            optuna_period_params = self.optuna_period_optimize(
+            optuna_period_params, optuna_period_rmse = self.optuna_period_optimize(
                  dk,
                  X,
                  y,
@@ -100,6 +108,10 @@ class LightGBMRegressorQuickAdapterV35(BaseRegressionModel):
                  if dk.pair not in self.__optuna_period_params:
                      self.__optuna_period_params[dk.pair] = {}
                  self.__optuna_period_params[dk.pair] = optuna_period_params
+            if optuna_period_rmse:
+                if dk.pair not in self.__optuna_period_rmse:
+                    self.__optuna_period_rmse[dk.pair] = None
+                self.__optuna_period_rmse[dk.pair] = optuna_period_rmse
  
              if self.__optuna_period_params.get(dk.pair):
                  train_window = self.__optuna_period_params[dk.pair].get(
@@ -216,9 +228,12 @@ class LightGBMRegressorQuickAdapterV35(BaseRegressionModel):
                  "label_period_candles", self.ft_params["label_period_candles"]
              )
          )
-        dk.data["extra_returns_per_train"]["rmse"] = self.__optuna_period_params.get(
+        dk.data["extra_returns_per_train"]["hp_rmse"] = self.__optuna_hp_rmse.get(
              pair, {}
-        ).get("rmse", 0)
+        )
+        dk.data["extra_returns_per_train"]["period_rmse"] = (
+            self.__optuna_period_rmse.get(pair, {})
+        )
  
      def eval_set_and_weights(self, X_test, y_test, test_weights):
          if self.data_split_parameters.get("test_size", TEST_SIZE) == 0:
@@ -277,7 +292,7 @@ class LightGBMRegressorQuickAdapterV35(BaseRegressionModel):
          X_test,
          y_test,
          test_weights,
-    ) -> dict | None:
+    ) -> tuple[dict | None, float | None]:
          study_name = f"hp-{dk.pair}"
          storage = self.optuna_storage(dk)
          pruner = optuna.pruners.HyperbandPruner()
@@ -316,15 +331,20 @@ class LightGBMRegressorQuickAdapterV35(BaseRegressionModel):
              )
          except Exception as e:
              logger.error(f"Optuna hp hyperopt failed: {e}", exc_info=True)
-            return None
+            return None, None
          time_spent = time.time() - start
          logger.info(f"Optuna hp hyperopt done ({time_spent:.2f} secs)")
  
+        hp_best_params_path = Path(
+            dk.full_path / f"{dk.pair.split('/')[0]}_optuna_hp_best_params.json"
+        )
+        with hp_best_params_path.open("w", encoding="utf-8") as write_file:
+            json.dump(study.best_params, write_file, indent=4)
          params = study.best_params
          # log params
          for key, value in {"rmse": study.best_value, **params}.items():
              logger.info(f"Optuna hp hyperopt | {key:>20s} : {value}")
-        return params
+        return params, study.best_value
  
      def optuna_period_optimize(
          self,
@@ -336,7 +356,7 @@ class LightGBMRegressorQuickAdapterV35(BaseRegressionModel):
          y_test,
          test_weights,
          model_training_parameters,
-    ) -> dict | None:
+    ) -> tuple[dict | None, float | None]:
          study_name = f"period-{dk.pair}"
          storage = self.optuna_storage(dk)
          pruner = optuna.pruners.HyperbandPruner()
@@ -354,9 +374,7 @@ class LightGBMRegressorQuickAdapterV35(BaseRegressionModel):
          if self.optuna_study_has_best_params(previous_study):
              study.enqueue_trial(previous_study.best_params)
          elif self.__optuna_period_params.get(dk.pair):
-            previous_best_params = self.__optuna_period_params[dk.pair].copy()
-            del previous_best_params["rmse"]
-            study.enqueue_trial(previous_best_params)
+            study.enqueue_trial(self.__optuna_period_params[dk.pair])
          start = time.time()
          try:
              study.optimize(
@@ -380,15 +398,20 @@ class LightGBMRegressorQuickAdapterV35(BaseRegressionModel):
              )
          except Exception as e:
              logger.error(f"Optuna period hyperopt failed: {e}", exc_info=True)
-            return None
+            return None, None
          time_spent = time.time() - start
          logger.info(f"Optuna period hyperopt done ({time_spent:.2f} secs)")
  
-        params = {"rmse": study.best_value, **study.best_params}
+        period_best_params_path = Path(
+            dk.full_path / f"{dk.pair.split('/')[0]}_optuna_period_best_params.json"
+        )
+        with period_best_params_path.open("w", encoding="utf-8") as write_file:
+            json.dump(study.best_params, write_file, indent=4)
+        params = study.best_params
          # log params
-        for key, value in params.items():
+        for key, value in {"rmse": study.best_value, **params}.items():
              logger.info(f"Optuna period hyperopt | {key:>20s} : {value}")
-        return params
+        return params, study.best_value
  
      def optuna_study_load_and_cleanup(
          self, study_name: str, storage
diff --git a/quickadapter/user_data/freqaimodels/XGBoostRegressorQuickAdapterV35.py b/quickadapter/user_data/freqaimodels/XGBoostRegressorQuickAdapterV35.py

index cdc6dce0e07b5b9580d68e40089405e8964ebc54..6618be3b91503dacb494227ddd156c206a5e6c7e 100644 (file)
--- a/quickadapter/user_data/freqaimodels/XGBoostRegressorQuickAdapterV35.py
+++ b/quickadapter/user_data/freqaimodels/XGBoostRegressorQuickAdapterV35.py
@@ -1,5 +1,7 @@
  import logging
+import json
  from typing import Any, Dict
+from pathlib import Path
  
  from xgboost import XGBRegressor
  import time
@@ -50,6 +52,8 @@ class XGBoostRegressorQuickAdapterV35(BaseRegressionModel):
              and self.__optuna_config.get("enabled", False)
              and self.data_split_parameters.get("test_size", TEST_SIZE) > 0
          )
+        self.__optuna_hp_rmse: dict[str, float | None] = {}
+        self.__optuna_period_rmse: dict[str, float | None] = {}
          self.__optuna_hp_params: dict[str, dict] = {}
          self.__optuna_period_params: dict[str, dict] = {}
  
@@ -74,7 +78,7 @@ class XGBoostRegressorQuickAdapterV35(BaseRegressionModel):
  
          start = time.time()
          if self.__optuna_hyperopt:
-            optuna_hp_params = self.optuna_hp_optimize(
+            optuna_hp_params, optuna_hp_rmse = self.optuna_hp_optimize(
                  dk, X, y, train_weights, X_test, y_test, test_weights
              )
              if optuna_hp_params:
@@ -85,8 +89,12 @@ class XGBoostRegressorQuickAdapterV35(BaseRegressionModel):
                      **model_training_parameters,
                      **self.__optuna_hp_params[dk.pair],
                  }
+            if optuna_hp_rmse:
+                if dk.pair not in self.__optuna_hp_rmse:
+                    self.__optuna_hp_rmse[dk.pair] = None
+                self.__optuna_hp_rmse[dk.pair] = optuna_hp_rmse
  
-            optuna_period_params = self.optuna_period_optimize(
+            optuna_period_params, optuna_period_rmse = self.optuna_period_optimize(
                  dk,
                  X,
                  y,
@@ -100,6 +108,10 @@ class XGBoostRegressorQuickAdapterV35(BaseRegressionModel):
                  if dk.pair not in self.__optuna_period_params:
                      self.__optuna_period_params[dk.pair] = {}
                  self.__optuna_period_params[dk.pair] = optuna_period_params
+            if optuna_period_rmse:
+                if dk.pair not in self.__optuna_period_rmse:
+                    self.__optuna_period_rmse[dk.pair] = None
+                self.__optuna_period_rmse[dk.pair] = optuna_period_rmse
  
              if self.__optuna_period_params.get(dk.pair):
                  train_window = self.__optuna_period_params[dk.pair].get(
@@ -217,9 +229,12 @@ class XGBoostRegressorQuickAdapterV35(BaseRegressionModel):
                  "label_period_candles", self.ft_params["label_period_candles"]
              )
          )
-        dk.data["extra_returns_per_train"]["rmse"] = self.__optuna_period_params.get(
+        dk.data["extra_returns_per_train"]["hp_rmse"] = self.__optuna_hp_rmse.get(
              pair, {}
-        ).get("rmse", 0)
+        )
+        dk.data["extra_returns_per_train"]["period_rmse"] = (
+            self.__optuna_period_rmse.get(pair, {})
+        )
  
      def eval_set_and_weights(self, X_test, y_test, test_weights):
          if self.data_split_parameters.get("test_size", TEST_SIZE) == 0:
@@ -278,7 +293,7 @@ class XGBoostRegressorQuickAdapterV35(BaseRegressionModel):
          X_test,
          y_test,
          test_weights,
-    ) -> dict | None:
+    ) -> tuple[dict | None, float | None]:
          study_name = f"hp-{dk.pair}"
          storage = self.optuna_storage(dk)
          pruner = optuna.pruners.HyperbandPruner()
@@ -317,15 +332,20 @@ class XGBoostRegressorQuickAdapterV35(BaseRegressionModel):
              )
          except Exception as e:
              logger.error(f"Optuna hp hyperopt failed: {e}", exc_info=True)
-            return None
+            return None, None
          time_spent = time.time() - start
          logger.info(f"Optuna hp hyperopt done ({time_spent:.2f} secs)")
  
+        hp_best_params_path = Path(
+            dk.full_path / f"{dk.pair.split('/')[0]}_optuna_hp_best_params.json"
+        )
+        with hp_best_params_path.open("w", encoding="utf-8") as write_file:
+            json.dump(study.best_params, write_file, indent=4)
          params = study.best_params
          # log params
          for key, value in {"rmse": study.best_value, **params}.items():
              logger.info(f"Optuna hp hyperopt | {key:>20s} : {value}")
-        return params
+        return params, study.best_value
  
      def optuna_period_optimize(
          self,
@@ -337,7 +357,7 @@ class XGBoostRegressorQuickAdapterV35(BaseRegressionModel):
          y_test,
          test_weights,
          model_training_parameters,
-    ) -> dict | None:
+    ) -> tuple[dict | None, float | None]:
          study_name = f"period-{dk.pair}"
          storage = self.optuna_storage(dk)
          pruner = optuna.pruners.HyperbandPruner()
@@ -355,9 +375,7 @@ class XGBoostRegressorQuickAdapterV35(BaseRegressionModel):
          if self.optuna_study_has_best_params(previous_study):
              study.enqueue_trial(previous_study.best_params)
          elif self.__optuna_period_params.get(dk.pair):
-            previous_best_params = self.__optuna_period_params[dk.pair].copy()
-            del previous_best_params["rmse"]
-            study.enqueue_trial(previous_best_params)
+            study.enqueue_trial(self.__optuna_period_params[dk.pair])
          start = time.time()
          try:
              study.optimize(
@@ -381,15 +399,20 @@ class XGBoostRegressorQuickAdapterV35(BaseRegressionModel):
              )
          except Exception as e:
              logger.error(f"Optuna period hyperopt failed: {e}", exc_info=True)
-            return None
+            return None, None
          time_spent = time.time() - start
          logger.info(f"Optuna period hyperopt done ({time_spent:.2f} secs)")
  
-        params = {"rmse": study.best_value, **study.best_params}
+        period_best_params_path = Path(
+            dk.full_path / f"{dk.pair.split('/')[0]}_optuna_period_best_params.json"
+        )
+        with period_best_params_path.open("w", encoding="utf-8") as write_file:
+            json.dump(study.best_params, write_file, indent=4)
+        params = study.best_params
          # log params
-        for key, value in params.items():
+        for key, value in {"rmse": study.best_value, **params}.items():
              logger.info(f"Optuna period hyperopt | {key:>20s} : {value}")
-        return params
+        return params, study.best_value
  
      def optuna_study_load_and_cleanup(
          self, study_name: str, storage
diff --git a/quickadapter/user_data/strategies/QuickAdapterV3.py b/quickadapter/user_data/strategies/QuickAdapterV3.py

index 9cfa1d91686ba05d7b88aebeb859b651c39e2f48..f39ff5ca6e1a9dfbfd2102417ca455a5a49d8239 100644 (file)
--- a/quickadapter/user_data/strategies/QuickAdapterV3.py
+++ b/quickadapter/user_data/strategies/QuickAdapterV3.py
@@ -74,7 +74,10 @@ class QuickAdapterV3(IStrategy):
          return {
              "main_plot": {},
              "subplots": {
-                "accuracy": {"rmse": {"color": "#c28ce3", "type": "line"}},
+                "accuracy": {
+                    "hp_rmse": {"color": "#c28ce3", "type": "line"},
+                    "period_rmse": {"color": "#a3087a", "type": "line"},
+                },
                  "extrema": {
                      EXTREMA_COLUMN: {"color": "#f53580", "type": "line"},
                      MINIMA_THRESHOLD_COLUMN: {"color": "#4ae747", "type": "line"},
author	Jérôme Benoit <jerome.benoit@piment-noir.org>
	Mon, 17 Feb 2025 11:39:54 +0000 (12:39 +0100)
committer	Jérôme Benoit <jerome.benoit@piment-noir.org>
	Mon, 17 Feb 2025 11:39:54 +0000 (12:39 +0100)
quickadapter/user_data/config-template.json		patch \| blob \| blame \| history
quickadapter/user_data/freqaimodels/LightGBMRegressorQuickAdapterV35.py		patch \| blob \| blame \| history
quickadapter/user_data/freqaimodels/XGBoostRegressorQuickAdapterV35.py		patch \| blob \| blame \| history
quickadapter/user_data/strategies/QuickAdapterV3.py		patch \| blob \| blame \| history