feat: use XGBoost pruning call at training

author Jérôme Benoit <jerome.benoit@piment-noir.org>

Sat, 25 Jan 2025 12:52:51 +0000 (13:52 +0100)

committer Jérôme Benoit <jerome.benoit@piment-noir.org>

Sat, 25 Jan 2025 12:52:51 +0000 (13:52 +0100)
author Jérôme Benoit <jerome.benoit@piment-noir.org>
Sat, 25 Jan 2025 12:52:51 +0000 (13:52 +0100)
committer Jérôme Benoit <jerome.benoit@piment-noir.org>
Sat, 25 Jan 2025 12:52:51 +0000 (13:52 +0100)
diff --git a/quickadapter/docker/Dockerfile.custom b/quickadapter/docker/Dockerfile.custom

index acb8c94bf2d6aab7afc7cdccb566b8828f9f02a1..e632c2d1ce029401e2a9fdddd89abd97bc7c5d67 100644 (file)
--- a/quickadapter/docker/Dockerfile.custom
+++ b/quickadapter/docker/Dockerfile.custom
@@ -5,7 +5,7 @@ FROM freqtradeorg/freqtrade:stable_freqai
  # USER root
  
  # The below dependency - pyti - serves as an example. Please use whatever you need!
-RUN pip install --user optuna
+RUN pip install --user optuna optuna-integration[xgboost]
  
  # Switch back to user (only if you required root above)
-# USER ftuser
-\ No newline at end of file
+# USER ftuser
diff --git a/quickadapter/user_data/freqaimodels/XGBoostRegressorQuickAdapterV3.py b/quickadapter/user_data/freqaimodels/XGBoostRegressorQuickAdapterV3.py

index 8e476eb42daa2d1ab4f71e82491ee983710fadc3..99d8873c7ad19e76f9c5dbda061ad55a22535eb0 100644 (file)
--- a/quickadapter/user_data/freqaimodels/XGBoostRegressorQuickAdapterV3.py
+++ b/quickadapter/user_data/freqaimodels/XGBoostRegressorQuickAdapterV3.py
@@ -1,5 +1,5 @@
  import logging
-from typing import Any, Dict, Tuple
+from typing import Any, Dict
  
  from xgboost import XGBRegressor
  import time
@@ -7,9 +7,6 @@ from freqtrade.freqai.base_models.BaseRegressionModel import BaseRegressionModel
  from freqtrade.freqai.data_kitchen import FreqaiDataKitchen
  import pandas as pd
  import scipy as spy
-import numpy.typing as npt
-from pandas import DataFrame
-import numpy as np
  
  import warnings
  
@@ -144,7 +141,10 @@ class XGBoostRegressorQuickAdapterV3(BaseRegressionModel):
          dk.data["extra_returns_per_train"]["DI_cutoff"] = cutoff
  
      def eval_set_and_weights(self, X_test, y_test, test_weights):
-        if self.freqai_info.get("data_split_parameters", {}).get("test_size", 0.3) == 0:
+        if (
+            self.freqai_info.get("data_split_parameters", {}).get("test_size", 0.25)
+            == 0
+        ):
              eval_set = None
              eval_weights = None
          else:
diff --git a/quickadapter/user_data/freqaimodels/XGBoostRegressorQuickAdapterV35.py b/quickadapter/user_data/freqaimodels/XGBoostRegressorQuickAdapterV35.py

index efe82c90b70a7d686d6004d63c107e83c603e85a..d2e5b7586dff8359ea7e1c4b95e80c3e8f849c41 100644 (file)
--- a/quickadapter/user_data/freqaimodels/XGBoostRegressorQuickAdapterV35.py
+++ b/quickadapter/user_data/freqaimodels/XGBoostRegressorQuickAdapterV35.py
@@ -1,5 +1,5 @@
  import logging
-from typing import Any, Dict, Tuple
+from typing import Any, Dict
  
  from xgboost import XGBRegressor
  import time
@@ -9,10 +9,10 @@ import pandas as pd
  import scipy as spy
  import optuna
  import sklearn
+import warnings
  
  N_TRIALS = 26
-
-import warnings
+TEST_SIZE = 0.25
  
  warnings.simplefilter(action="ignore", category=FutureWarning)
  
@@ -57,12 +57,16 @@ class XGBoostRegressorQuickAdapterV35(BaseRegressionModel):
          xgb_model = self.get_init_model(dk.pair)
          start = time.time()
          hp = {}
-        if (
+        optuna_hyperopt: bool = (
              self.freqai_info.get("optuna_hyperopt", False)
-            and self.freqai_info.get("data_split_parameters", {}).get("test_size", 0.3)
+            and self.freqai_info.get("data_split_parameters", {}).get(
+                "test_size", TEST_SIZE
+            )
              > 0
-        ):
-            study = optuna.create_study(direction="minimize")
+        )
+        if optuna_hyperopt:
+            pruner = optuna.pruners.MedianPruner(n_warmup_steps=5)
+            study = optuna.create_study(pruner=pruner, direction="minimize")
              study.optimize(
                  lambda trial: objective(
                      trial,
@@ -77,11 +81,11 @@ class XGBoostRegressorQuickAdapterV35(BaseRegressionModel):
                  n_jobs=1,
              )
  
-            # display params
              hp = study.best_params
              # trial = study.best_trial
+            # log params
              for key, value in hp.items():
-                logger.debug(f"Optuna hyperopt {key:>20s} : {value}")
+                logger.info(f"Optuna hyperopt {key:>20s} : {value}")
              logger.info(
                  f"Optuna hyperopt {'best objective value':>20s} : {study.best_value}"
              )
@@ -90,7 +94,22 @@ class XGBoostRegressorQuickAdapterV35(BaseRegressionModel):
          X = X.tail(window)
          y = y.tail(window)
          sample_weight = sample_weight[-window:]
-        model = XGBRegressor(**self.model_training_parameters)
+        if optuna_hyperopt:
+            params = {
+                **self.model_training_parameters,
+                **{
+                    # "learning_rate": hp.get("learning_rate"),
+                    # "gamma": hp.get("gamma"),
+                    # "reg_alpha": hp.get("reg_alpha"),
+                    # "reg_lambda": hp.get("reg_lambda"),
+                },
+            }
+        else:
+            params = self.model_training_parameters
+
+        logger.info(f"Model training parameters : {self.model_training_parameters}")
+
+        model = XGBRegressor(**params)
  
          model.fit(
              X=X,
@@ -178,7 +197,12 @@ class XGBoostRegressorQuickAdapterV35(BaseRegressionModel):
          dk.data["extra_returns_per_train"]["DI_cutoff"] = cutoff
  
      def eval_set_and_weights(self, X_test, y_test, test_weights):
-        if self.freqai_info.get("data_split_parameters", {}).get("test_size", 0.3) == 0:
+        if (
+            self.freqai_info.get("data_split_parameters", {}).get(
+                "test_size", TEST_SIZE
+            )
+            == 0
+        ):
              eval_set = None
              eval_weights = None
          else:
@@ -189,16 +213,33 @@ class XGBoostRegressorQuickAdapterV35(BaseRegressionModel):
  
  
  def objective(trial, X, y, weights, X_test, y_test, params):
-    window = trial.suggest_int("train_period_candles", 1152, 17280, step=600)
+    study_params = {
+        "objective": "reg:squarederror",
+        "eval_metric": "rmse",
+        # "learning_rate": trial.suggest_loguniform("learning_rate", 1e-8, 1.0),
+        # "gamma": trial.suggest_loguniform("gamma", 1e-8, 1.0),
+        # "reg_alpha": trial.suggest_loguniform("reg_alpha", 1e-8, 1.0),
+        # "reg_lambda": trial.suggest_loguniform("reg_lambda", 1e-8, 1.0),
+        "callbacks": [
+            optuna.integration.XGBoostPruningCallback(trial, "validation_0-rmse")
+        ],
+    }
+    params = {**params, **study_params}
+    window = trial.suggest_int("train_period_candles", 1152, 17280, step=300)
  
      # Fit the model
      model = XGBRegressor(**params)
      X = X.tail(window)
      y = y.tail(window)
      weights = weights[-window:]
-    model.fit(X, y, sample_weight=weights, eval_set=[(X_test, y_test)])
+    model.fit(
+        X,
+        y,
+        sample_weight=weights,
+        eval_set=[(X_test, y_test)],
+    )
      y_pred = model.predict(X_test)
  
-    error = sklearn.metrics.mean_squared_error(y_test, y_pred)
+    error = sklearn.metrics.root_mean_squared_error(y_test, y_pred)
  
      return error
author	Jérôme Benoit <jerome.benoit@piment-noir.org>
	Sat, 25 Jan 2025 12:52:51 +0000 (13:52 +0100)
committer	Jérôme Benoit <jerome.benoit@piment-noir.org>
	Sat, 25 Jan 2025 12:52:51 +0000 (13:52 +0100)
quickadapter/docker/Dockerfile.custom		patch \| blob \| blame \| history
quickadapter/user_data/freqaimodels/XGBoostRegressorQuickAdapterV3.py		patch \| blob \| blame \| history
quickadapter/user_data/freqaimodels/XGBoostRegressorQuickAdapterV35.py		patch \| blob \| blame \| history