From: Jérôme Benoit <jerome.benoit@piment-noir.org>
Date: Sun, 4 Nov 2018 20:51:36 +0000 (+0100)
Subject: Add SQP algorithms.
X-Git-Url: https://git.piment-noir.org/?p=Projet_Recherche_Operationnelle.git;a=commitdiff_plain;h=e17152e0b05429858eeacdf123e34d354cc167d1

Add SQP algorithms.

Signed-off-by: Jérôme Benoit <jerome.benoit@piment-noir.org>
---

diff --git a/rapport/ProjetOptimRO.tex b/rapport/ProjetOptimRO.tex
index 809d31f..affb198 100644
--- a/rapport/ProjetOptimRO.tex
+++ b/rapport/ProjetOptimRO.tex
@@ -377,8 +377,7 @@ tions.
 \begin{proof}
  Elle s'effectue en utilisant le dÃ©veloppement de Taylor-Young de lâapplication $ t \longmapsto f(x_0 + td) $ Ã  lâordre 1.
 \end{proof}
-Cette derniÃ¨re inÃ©galitÃ© garantit une dÃ©croissance minimum de la fonction $ J $ dans la
-direction $ d $ et peut se traduire par : la dÃ©croissance de la fonction $ J $, en effectuant un pas de longueur $ t $ dans la direction $ d $ , est au moins Ã©gale Ã  la longueur du pas multipliÃ©e par une fraction de la pente. Le schÃ©ma gÃ©nÃ©ral dâun algorithme de descente est alors le suivant :
+Cette derniÃ¨re inÃ©galitÃ© garantit une dÃ©croissance minimum de la fonction $ J $ dans la direction $ d $ et peut se traduire par : la dÃ©croissance de la fonction $ J $, en effectuant un pas de longueur $ t $ dans la direction $ d $ , est au moins Ã©gale Ã  la longueur du pas multipliÃ©e par une fraction de la pente. Le schÃ©ma gÃ©nÃ©ral dâun algorithme de descente est alors le suivant :
 
 \hrulefill
 \newline
@@ -386,9 +385,9 @@ ALGORITHME DE DESCENTE MODÃLE.
 \newline
 \textit{EntrÃ©es}: $ J : \mathbb{R}^n \longrightarrow \mathbb{R} $ diffÃ©rentiable, $ x_0 \in \mathbb{R}^n $ point initial arbitraire.
 \newline
-\textit{Sortie}: une approximation de la solution du problÃ¨me : $ \displaystyle\min_{x \in \mathbb{R}^n} J(x) $.
+\textit{Sortie}: une approximation $ x_k $ de la solution $ x^\ast $ du problÃ¨me : $ \displaystyle\min_{x \in \mathbb{R}^n} J(x) $.
 \begin{enumerate}
- \item $ k := 0 $
+ \item $ k := 0 $.
  \item Tant que "test dâarrÃªt" non satisfait,
        \begin{enumerate}
         \item Trouver une direction de descente $ d_k $ telle que : $ \nabla J(x_k)^\top d_k < 0 $.
@@ -402,9 +401,7 @@ ALGORITHME DE DESCENTE MODÃLE.
 
 \subsection{Choix de la direction de descente}
 
-Une fois la thÃ©orie bien maÃ®trisÃ©e, calculer une direction de descente est relativement
-simple. Dans le cas diffÃ©rentiable, il existe deux grandes stratÃ©gies de choix de direction de
-descente :
+Une fois la thÃ©orie bien maÃ®trisÃ©e, calculer une direction de descente est relativement simple. Dans le cas diffÃ©rentiable, il existe deux grandes stratÃ©gies de choix de direction de descente :
 \begin{itemize}
  \item la stratÃ©gie de Cauchy : $ d_k = -\nabla J(x_k) $, conduisant aux \textit{algorithmes de gradient}.
  \item la stratÃ©gie de Newton : $ d_k = -H[J](x_k)^{-1} \nabla J(x_k) $, conduisant aux \textit{algorithmes Newtoniens}.
@@ -424,8 +421,7 @@ sans contrainte, on testera si
 $$ \norme{\nabla J(x_k)} < \varepsilon, $$
 auquel cas lâalgorithme sâarrÃªte et fournit lâitÃ©rÃ© courant $ x_k $ comme solution.
 
-En pratique, le test dâoptimalitÃ© nâest pas toujours satisfait et on devra faire appel Ã 
-dâautres critÃ¨res fondÃ©s sur lâexpÃ©rience du numÃ©rique :
+En pratique, le test dâoptimalitÃ© nâest pas toujours satisfait et on devra faire appel Ã  dâautres critÃ¨res fondÃ©s sur lâexpÃ©rience du numÃ©rique :
 \begin{itemize}
  \item Stagnation de la solution : $ \norme{x_{k+1} - x_k} < \varepsilon(1 + \norme{x_k}) $.
  \item Stagnation de la valeur courante : $ |J(x_{k+1}) - J(x_k)| < \varepsilon(1 + |J (x_k)|) $.
@@ -482,11 +478,9 @@ acceptables et ceux qui ne le sont pas.
 
 \subsubsection{Principe de dÃ©monstration de convergence}
 
-Une technique classique en optimisation pour obtenir des rÃ©sultats de convergence glo-
-bale consiste Ã  montrer que lâalgorithme de descente considÃ©rÃ© vÃ©rifie une inÃ©galitÃ© du
-type :
+Une technique classique en optimisation pour obtenir des rÃ©sultats de convergence globale consiste Ã  montrer que lâalgorithme de descente considÃ©rÃ© vÃ©rifie une inÃ©galitÃ© du type :
 $$ J(x_k) - J(x_{k+1}) \geq c\norme{\nabla J(x_k)}^2, $$
-oÃ¹ $ c $ est un constante rÃ©elle.
+oÃ¹ $ c $ est une constante rÃ©elle.
 \newline
 En sommant ces inÃ©galitÃ©s pour $ k $ variant de $ 0 $ Ã  $ N - 1 $, on obtient :
 $$ \forall N \in \mathbb{N} \ J(x_0) - J(x_N) \geq c \sum_{i=0}^{N-1}\norme{\nabla J(x_i)}^2 $$
@@ -496,9 +490,7 @@ L'Ã©tude plus dÃ©taillÃ©e de diffÃ©rents algorithmes de descente qui utilisent d
 
 \section{MÃ©thode Newtonienne}
 
-Les hypothÃ¨ses sur $ \mathcal{P} $ de la section prÃ©cÃ©dente restent les mÃªmes dans cette section. Lâalgorithme de Newton en optimisation est une application directe de lâalgorithme de
-Newton pour la rÃ©solution dâÃ©quations du type : $ F(x) = 0 $. En optimisation sans contrainte,
-lâalgorithme de Newton cherche les solutions de lâÃ©quation :
+Les hypothÃ¨ses sur $ \mathcal{P} $ de la section prÃ©cÃ©dente restent les mÃªmes dans cette section. Lâalgorithme de Newton en optimisation est une application directe de lâalgorithme de Newton pour la rÃ©solution dâÃ©quations du type : $ F(x) = 0 $. En optimisation sans contrainte, lâalgorithme de Newton cherche les solutions de lâÃ©quation :
 $$ \nabla J(x) = 0, $$
 autrement dit, les points critiques de la fonction $ J $ Ã  minimiser.
 \newline
@@ -506,10 +498,8 @@ En supposant $ J $ de classe $ \mathcal{C}^2 $ et la matrice hessienne $ H[J](x_
 $$ x_{k+1} = x_k - H[J](x_k)^{-1} \nabla J(x_k), $$
 oÃ¹ $ d_k = -H[J](x_k)^{-1} \nabla J(x_k) $ est appelÃ©e direction de Newton. La direction $ d_k $ est Ã©galement lâunique solution du problÃ¨me :
 $$ \underset{d \in \mathbb{R}^n}{\mathrm{argmin}} \ J(x_k) + \langle \nabla J(x_k),d \rangle + \frac{1}{2}\langle H[J](x_k)d,d \rangle $$
-Autrement dit, $ d_k $ est le point de minimum global de lâapproximation de second ordre de
-$ J $ au voisinage du point courant $ x_k $.
-A condition que la matrice $ H[J](x_k) $ soit dÃ©finie positive Ã  chaque itÃ©ration, la mÃ©thode
-de Newton est bien une mÃ©thode de descente Ã  pas fixe Ã©gal Ã  $ 1 $.
+Autrement dit, $ d_k $ est le point de minimum global de lâapproximation de second ordre de $ J $ au voisinage du point courant $ x_k $.
+A condition que la matrice $ H[J](x_k) $ soit dÃ©finie positive Ã  chaque itÃ©ration, la mÃ©thode de Newton est bien une mÃ©thode de descente Ã  pas fixe Ã©gal Ã  $ 1 $.
 \newline
 Les propriÃ©tÃ©s remarquables de cet algorithme sont :
 
@@ -547,8 +537,7 @@ Nous ne rÃ©pondrons pas Ã  ces questions qui sont hors du cadre de ce projet. Ce
 \section{MÃ©thode PQS (ou SQP)}
 
 Nous supposons les fonctions $ J,g,h $ Ã  valeurs rÃ©elles et de classe $ \mathcal{C}^1 $.
-Trouver une solution dâun problÃ¨me dâoptimisation sous contraintes fonctionnelles consiste
-Ã  dÃ©terminer un point optimal $ x^\ast $ et des multiplicateurs associÃ©s $ (\lambda^\ast,\mu^\ast) $. Deux grandes familles de mÃ©thodes peuvent Ãªtre dÃ©finies pour la rÃ©solution des problÃ¨mes dâoptimisation sous contraintes : les mÃ©thodes primales et les mÃ©thodes duales. Les approches primales se concentrent sur la dÃ©termination du point $ x^\ast $, les multiplicateurs $ (\lambda,\mu) $ ne servant souvent quâÃ  vÃ©rifier lâoptimalitÃ© de $ x^\ast $. Les mÃ©thodes duales quant Ã  elles mettent lâaccent sur la recherche dâun multiplicateur en travaillant sur un problÃ¨me dâoptimisation dÃ©duit du problÃ¨me initial par \textit{dualitÃ©}.
+Trouver une solution dâun problÃ¨me dâoptimisation sous contraintes fonctionnelles consiste Ã  dÃ©terminer un point optimal $ x^\ast $ et des multiplicateurs associÃ©s $ (\lambda^\ast,\mu^\ast) $. Deux grandes familles de mÃ©thodes peuvent Ãªtre dÃ©finies pour la rÃ©solution des problÃ¨mes dâoptimisation sous contraintes : les mÃ©thodes primales et les mÃ©thodes duales. Les approches primales se concentrent sur la dÃ©termination du point $ x^\ast $, les multiplicateurs $ (\lambda,\mu) $ ne servant souvent quâÃ  vÃ©rifier lâoptimalitÃ© de $ x^\ast $. Les mÃ©thodes duales quant Ã  elles mettent lâaccent sur la recherche dâun multiplicateur en travaillant sur un problÃ¨me dâoptimisation dÃ©duit du problÃ¨me initial par \textit{dualitÃ©}.
 
 \subsection{Algorithmes newtoniens}
 
@@ -593,7 +582,7 @@ $$ \begin{pmatrix}
   h(x_k)
  \end{pmatrix}  $$
 oÃ¹ $ D_h(x) $ dÃ©signe la matrice jacobienne de lâapplication $ h : \mathbb{R}^n \longrightarrow \mathbb{R}^q $ dÃ©finie par :
-$$ D_h(x)^\top = [\nabla h_1(x)\ldots\nabla h_q(x)] $$
+$$ D_h(x)^\top = \begin{bmatrix} \nabla h_1(x)\ldots\nabla h_q(x) \end{bmatrix} $$
 Posons : $ H_k = H_x[L](x_k,\lambda_k), \ d = x_{k+1} - x_k $ et $ \mu = \lambda_{k+1} $. L'itÃ©ration s'Ã©crit donc :
 $$ \begin{pmatrix}
   H_k      & D_h(x_k)^\top \\
@@ -619,7 +608,7 @@ $$
  \end{array}
  \right .
 $$
-Or $ \nabla_x L(x_k,\lambda_k) =  \nabla J(x_k) + \sum\limits_{i=1}^{q} \lambda_{k_i} \nabla h_i(x_k) $, d'oÃ¹ :
+Or $ \nabla_x L(x_k,\lambda_k) = \nabla J(x_k) + \sum\limits_{i=1}^{q} \lambda_{k_i} \nabla h_i(x_k) $, d'oÃ¹ :
 $$
  \left \{
  \begin{array}{r c l}
@@ -642,8 +631,84 @@ Le problÃ¨me $ \mathcal{PQ}_k $ peut Ãªtre vu comme la minimisation dâune appr
 \newline
 Comme son nom lâindique, la mÃ©thode PQS consiste Ã  remplacer le problÃ¨me initial par une suite de problÃ¨mes quadratiques sous contraintes linÃ©aires plus faciles Ã  rÃ©soudre. Lâalgorithme est le suivant :
 
+\hrulefill
+\newline
+ALGORITHME SQP AVEC CONSTRAINTES D'ÃGALITÃ.
+\newline
+\textit{EntrÃ©es}: $ J : \mathbb{R}^n \longrightarrow \mathbb{R} $, $ h : \mathbb{R}^n \longrightarrow \mathbb{R}^q $ diffÃ©rentiables, $ x_0 \in \mathbb{R}^n $ point initial arbitraire, $ \lambda_0 \in \mathbb{R}^q $ multiplicateur initial, $ \varepsilon > 0 $ prÃ©cision demandÃ©e.
+\newline
+\textit{Sortie}: une approximation $ x_k $ de la solution $ x^\ast $ du problÃ¨me $ \mathcal{P} $.
+\begin{enumerate}
+ \item $ k := 0 $.
+ \item Tant que $ \norme{\nabla L(x_k,\lambda_k)} > \varepsilon $,
+       \begin{enumerate}
+        \item RÃ©soudre le sous-problÃ¨me quadratique :
+              $$
+               \mathcal{PQ}_k \left \{
+               \begin{array}{l}
+                \displaystyle\min_{d \in \mathbb{R}^n} \nabla J(x_k)^\top d + \frac{1}{2}d^\top H_k d \\
+                h_i(x_k) + \nabla h_i(x_k)^\top d = 0, \ \forall i \in \{1,\ldots,q\}
+               \end{array}
+               \right .
+              $$
+              et obtenir la solution primale $ d_k $ et le multiplicateur $ \lambda^{\prime} $ associÃ© Ã  la contrainte dâÃ©galitÃ©.
+        \item $ x_{k+1} = x_k + d_k; \ \lambda_{k+1} = \lambda^{\prime}; \ k := k + 1 $.
+       \end{enumerate}
+ \item Retourner $ x_k $.
+\end{enumerate}
+
+\hrulefill
+
 \subsubsection{Contraintes dâinÃ©galitÃ©}
 
+IntÃ©ressons nous maintenant aux problÃ¨mes avec contraintes dâÃ©galitÃ© et dâinÃ©galitÃ© :
+$$
+ \mathcal{P} \left \{
+ \begin{array}{l}
+  \displaystyle\min_{x \in \mathbb{R}^n} J(x) \\
+  g(x) \leq 0                                 \\
+  h(x) = 0
+ \end{array}
+ \right .
+$$
+oÃ¹ $ J: \mathbb{R}^n \longrightarrow \mathbb{R} $, $g: \mathbb{R}^n \longrightarrow \mathbb{R}^p$ et $h: \mathbb{R}^n \longrightarrow \mathbb{R}^q$ sont supposÃ©es au moins diffÃ©rentiables.
+\newline
+Selon le mÃªme principe quâavec contraintes dâÃ©galitÃ© seules, on linÃ©arise les contraintes et on utilise une approximation quadratique du Lagrangien :
+$$ L(x,\lambda,\mu) = J(x) + \lambda^\top g(x) + \mu^\top h(x), \ \lambda \in \mathbb{R}_+^p \land \mu \in \mathbb{R}^q $$
+
+\hrulefill
+\newline
+ALGORITHME SQP AVEC CONSTRAINTES D'ÃGALITÃ ET D'INEGALITÃ.
+\newline
+\textit{EntrÃ©es}: $ J : \mathbb{R}^n \longrightarrow \mathbb{R} $, $g: \mathbb{R}^n \longrightarrow \mathbb{R}^p$, $ h : \mathbb{R}^n \longrightarrow \mathbb{R}^q $ diffÃ©rentiables, $ x_0 \in \mathbb{R}^n $ point initial arbitraire, $ \lambda_0 \in \mathbb{R}_+^p $ et $ \mu_0 \in \mathbb{R}_+^q $ multiplicateurs initiaux, $ \varepsilon > 0 $ prÃ©cision demandÃ©e.
+\newline
+\textit{Sortie}: une approximation $ x_k $ de la solution $ x^\ast $ du problÃ¨me $ \mathcal{P} $.
+\begin{enumerate}
+ \item $ k := 0 $.
+ \item Tant que $ \norme{\nabla L(x_k,\lambda_k,\mu_k)} > \varepsilon $,
+       \begin{enumerate}
+        \item RÃ©soudre le sous-problÃ¨me quadratique :
+              $$
+               \mathcal{PQ}_k \left \{
+               \begin{array}{l}
+                \displaystyle\min_{d \in \mathbb{R}^n} \nabla J(x_k)^\top d + \frac{1}{2}d^\top H_k d \\
+                g_j(x_k) + \nabla g_j(x_k)^\top d = 0, \ \forall j \in \{1,\ldots,p\}                 \\
+                h_i(x_k) + \nabla h_i(x_k)^\top d = 0, \ \forall i \in \{1,\ldots,q\}
+               \end{array}
+               \right .
+              $$
+              et obtenir la solution primale $ d_k $ et les multiplicateurs $ \lambda^{\prime} $ et $ \mu^{\prime} $ associÃ© aux contraintes dâinÃ©galitÃ© et dâÃ©galitÃ© respectivement.
+        \item $ x_{k+1} = x_k + d_k; \ \lambda_{k+1} = \lambda^{\prime}; \ \mu_{k+1} = \mu^{\prime}; \ k := k + 1 $.
+       \end{enumerate}
+ \item Retourner $ x_k $.
+\end{enumerate}
+
+\hrulefill
+\newline
+Afin que le sous-programme quadratique $ \mathcal{PQ}_k $ admette une unique solution, la plupart des implÃ©mentations actuelles de PQS utilisent une approximation du hessien $ H_k $ du Lagrangien qui soit dÃ©finie positive, en particulier celle fournie par les techniques quasi-newtonienne (BFGS) par exemple.
+\newline
+Etant une mÃ©thode newtonienne, lâalgorithme PQS converge localement quadratiquement pourvu que les points initiaux  $ (x_0,\lambda_0 ) $ (resp. $ (x_0,\lambda_0,\mu_0) $) soient dans un voisinage dâun point stationnaire $ \overline{x} $ et de ses multiplicateurs associÃ©s $ \overline{\lambda} $ (resp. $ (\overline{\lambda},\overline{\mu}) $). Bien entendu, il est possible de globaliser lâalgorithme en ajoutant une Ã©tape de recherche linÃ©aire.
+
 \bibliographystyle{plain}
 \bibliography{stdlib_sbphilo}