Recouvrement par jauge

Le recouvrement par jauge[1] est une technique d'optimisation mathématique, structurellement et intentionnellement semblable à la poursuite de base, qui étend cette dernière sur deux points :

  • l'espace sous-jacent est un espace euclidien général (au lieu de l'espace vectoriel R n {\displaystyle \mathbb {R} ^{n}} ),
  • le critère de sélection est une jauge polyédrique définie sur cet espace (au lieu de la norme ℓ1).

Cette généralisation permet d'appliquer cette technique de recouvrement de données codées, dans des contextes plus variés. Par exemple, on pourra s'intéresser au recouvrement d'objets représentés par des matrices et utiliser la norme nucléaire comme critère de sélection.

Nous renvoyons aux articles « Poursuite de base » et « Acquisition comprimée » pour des indications sur les problématiques pratiques conduisant à des problèmes de ce type. Voir aussi Chandrasekaran et al. 2012.

Connaissances supposées : le vocabulaire de l'optimisation mathématique et de l'algèbre linéaire.

Notations

  • Dans cet article, on supposera toujours que E {\displaystyle E} et F {\displaystyle F} sont deux espaces euclidiens, dont les produits scalaires sont tous deux notés , {\displaystyle \langle \cdot ,\cdot \rangle } .
  • L'image d'une application linéaire A {\displaystyle A} est notée Im ( A ) {\displaystyle \operatorname {Im} {(A)}} et son noyau est noté Ker ( A ) {\displaystyle \operatorname {Ker} {(A)}} .
  • L'opérateur adjoint d'un opérateur linéaire A : E F {\displaystyle A:E\to F} est noté A : F E {\displaystyle A^{*}:F\to E} .
  • L'enveloppe affine d'un convexe non vide C {\displaystyle C} de E {\displaystyle E} est notée aff C {\displaystyle \operatorname {aff} C} et son intérieur relatif est noté ir C {\displaystyle \operatorname {ir} C} .
  • Le polaire d'une partie P {\displaystyle P} de E {\displaystyle E} est noté P {\displaystyle P^{\circ }} .

Recouvrement par jauge polyédrique abstraite

Définition du problème

De manière plus précise, le problème s'écrit comme suit

( P f ) { inf f ( x ) A x = b , {\displaystyle (P_{f})\quad \left\{{\begin{array}{l}\inf \;f(x)\\Ax=b,\end{array}}\right.}

où l'inconnue est un vecteur x {\displaystyle x} de E {\displaystyle E} , f : E R { + } {\displaystyle f:E\to \mathbb {R} \cup \{+\infty \}} est une jauge polyédrique (c'est-à-dire dont l'épigraphe est un polyèdre convexe) pouvant donc prendre des valeurs infinies, A {\displaystyle A} est une application linéaire de E {\displaystyle E} dans F {\displaystyle F} et b F {\displaystyle b\in F} .

On note

B := { x E f ( x ) 1 } , {\displaystyle {\mathcal {B}}:=\{x\in E\mid f(x)\leqslant 1\},}

l'ensemble de sous-niveau 1 de la jauge f {\displaystyle f} , qui joue le rôle de boule-unité (c'est ce qu'il serait si le jauge était une norme). Comme f {\displaystyle f} est une jauge polyédrique, B {\displaystyle {\mathcal {B}}} est un polyèdre convexe contenant 0 {\displaystyle 0} . Il revient au même de se donner f {\displaystyle f} et d'en déduire B {\displaystyle {\mathcal {B}}} comme ci-dessus, ou de se donner un polyèdre convexe B {\displaystyle {\mathcal {B}}} contenant 0 {\displaystyle 0} et d'en déduire la jauge polyédrique f {\displaystyle f} par la formule de Minkowski :

x E f ( x ) = inf { t > 0 x t B } . {\displaystyle \forall \,x\in E\quad f(x)={\inf }\{t>0\mid x\in t\,{\mathcal {B}}\}.}

C'est ce qui sera fait dans la section suivante, avec une description plus précise de B {\displaystyle {\mathcal {B}}} .

Le sous-différentiel de la jauge f {\displaystyle f} en x {\displaystyle x} joue un rôle important dans les conditions d'existence et d'unicité de solution. Il est noté S ( x ) {\displaystyle {\mathcal {S}}(x)} et sa valeur est donnée par la formule

S ( x ) := argmax y B y , x . {\displaystyle {\mathcal {S}}(x):=\operatorname {argmax} _{y\in {\mathcal {B}}^{\circ }}\,\langle y,x\rangle .}

Contraintes polyédriques

Le modèle de problème ( P f ) {\displaystyle (P_{f})} peut prendre en compte des contraintes polyédriques, c'est-à-dire un problème de la forme

{ inf f 0 ( x ) x P , {\displaystyle \left\{{\begin{array}{l}\inf \;f_{0}(x)\\x\in P,\end{array}}\right.}

f 0 : E R { + } {\displaystyle f_{0}:E\to \mathbb {R} \cup \{+\infty \}} est la jauge d'un polyèdre convexe B 0 E {\displaystyle {\mathcal {B}}_{0}\subset E} contenant 0 {\displaystyle 0} , et P {\displaystyle P} est un autre polyèdre convexe de E {\displaystyle E} . Le polyèdre convexe P {\displaystyle P} peut toujours être écrit comme suit

P = { x E A x b } , {\displaystyle P=\{x\in E\mid Ax\leqslant b\},}

A : E R m {\displaystyle A:E\to \mathbb {R} ^{m}} est une application linéaire, b R m {\displaystyle b\in \mathbb {R} ^{m}} et l'inégalité agit composante par composante. Donc le problème s'écrit

{ inf ( x , s ) E × R m f 0 ( x ) A x + s = b s 0. {\displaystyle \left\{{\begin{array}{l}\inf _{(x,s)\in E\times \mathbb {R} ^{m}}\;f_{0}(x)\\Ax+s=b\\s\geqslant 0.\end{array}}\right.}

Ce dernier problème peut s'écrire sous la forme d'un problème de recouvrement par jauge sous la forme standard ( P f ) {\displaystyle (P_{f})} , à savoir

{ inf ( x , s ) E × R m f ( x , s ) A x + s = b , {\displaystyle \left\{{\begin{array}{l}\inf _{(x,s)\in E\times \mathbb {R} ^{m}}\;f(x,s)\\Ax+s=b,\end{array}}\right.}

en prenant pour f {\displaystyle f} la jauge du polyèdre convexe contenant 0 {\displaystyle 0} suivant :

B 0 × cone { e 1 , , e m } = B 0 × R + m E × R m , {\displaystyle {\mathcal {B}}_{0}\times \operatorname {cone} \{e_{1},\ldots ,e_{m}\}={\mathcal {B}}_{0}\times \mathbb {R} _{+}^{m}\subset E\times \mathbb {R} ^{m},}

e i {\displaystyle e_{i}} désigne le i {\displaystyle i} -ème vecteur de la base canonique de R m {\displaystyle \mathbb {R} ^{m}} . L'équivalence entre ces problèmes repose sur le fait que f ( x , s ) = f 0 ( x ) {\displaystyle f(x,s)=f_{0}(x)} si s 0 {\displaystyle s\geqslant 0} , et f ( x , s ) = + {\displaystyle f(x,s)=+\infty } si s ⩾̸ 0 {\displaystyle s\not \geqslant 0} . C'est en réalité sa polyédricité qui permet d'obtenir la condition nécessaire et suffisante de solution de la proposition suivante, comme en optimisation linéaire.

Existence de solution I — Soit f {\displaystyle f} une jauge polyédrique. Alors l'ensemble des solutions de ( P f ) {\displaystyle (P_{f})} est un polyèdre convexe ; celui-ci est non vide si, et seulement si, b {\displaystyle b} est dans l'image de A {\displaystyle A} .

Ce résultat ne dit rien sur la valeur optimale de ( P f ) {\displaystyle (P_{f})} et celle-ci peut très bien valoir + {\displaystyle +\infty } alors que le problème a une solution. Il en sera ainsi si, et seulement si, b {\displaystyle b} est dans l'image de A {\displaystyle A} (ce qui assure l'existence d'une solution par la proposition) et l'ensemble admissible ne rencontre pas le domaine de f {\displaystyle f} . Une telle situation (sans intérêt) ne se rencontre pas en optimisation linéaire, car le critère ne prend alors que des valeurs finies.

Des conditions nécessaires et suffisantes assurant l'existence et l'unicité de la solution de ( P f ) {\displaystyle (P_{f})} sont moins aisées à déterminer. On notera que celles présentées ci-dessous[2] dépendent du point x ¯ {\displaystyle {\bar {x}}} considéré comme candidat-solution ; elles s'apparentent donc à des conditions d'optimalité d'un point x ¯ R n {\displaystyle {\bar {x}}\in \mathbb {R} ^{n}} donné : la première condition, celle caractérisant x ¯ {\displaystyle {\bar {x}}} comme solution, traduit d'ailleurs l'appartenance de zéro au sous-différentiel de f + I X {\displaystyle f+{\mathcal {I}}_{\mathcal {X}}} en x ¯ {\displaystyle {\bar {x}}} ( I X {\displaystyle {\mathcal {I}}_{\mathcal {X}}} est l'indicatrice de l'ensemble admissible X {\displaystyle {\mathcal {X}}} ) et le vecteur y ¯ {\displaystyle {\bar {y}}} apparaissant dans toutes les conditions est une solution du problème dual (voir la section « Dualité lagrangienne »).

Dans le résultat ci-dessous, on note Sol ( P f ) {\displaystyle \operatorname {Sol} (P_{f})} l'ensemble des solutions du problème ( P f ) {\displaystyle (P_{f})} .

Existence de solution II — Soient f {\displaystyle f} une jauge polyédrique dont le domaine intersecte X {\displaystyle {\mathcal {X}}} et x ¯ X {\displaystyle {\bar {x}}\in {\mathcal {X}}} . Alors

x ¯ Sol ( P f ) y ¯ F A y ¯ S ( x ¯ ) , x ¯ ir ( Sol ( P f ) ) y ¯ F A y ¯ ir S ( x ¯ ) . {\displaystyle {\begin{aligned}{\bar {x}}\in \operatorname {Sol} (P_{f})&\qquad \Longleftrightarrow \qquad \exists {\bar {y}}\in F\quad A^{*}{\bar {y}}\in {\mathcal {S}}({\bar {x}}),\\{\bar {x}}\in \operatorname {ir} (\operatorname {Sol} (P_{f}))&\qquad \Longleftrightarrow \qquad \exists {\bar {y}}\in F\quad A^{*}{\bar {y}}\in \operatorname {ir} {\mathcal {S}}({\bar {x}}).\end{aligned}}}

Existence et unicité de solution

Existence et unicité de solution — Soient f {\displaystyle f} une jauge polyédrique dont le domaine intersecte X {\displaystyle {\mathcal {X}}} et x ¯ X {\displaystyle {\bar {x}}\in {\mathcal {X}}} . Alors Sol ( P f ) = { x ¯ } {\displaystyle \operatorname {Sol} (P_{f})=\{{\bar {x}}\}} si, et seulement si,

y ¯ F A y ¯ ir S ( x ¯ ) , aff S ( x ¯ ) + Im ( A ) = E . {\displaystyle {\begin{array}{c}\exists {\bar {y}}\in F\quad A^{*}{\bar {y}}\in \operatorname {ir} {\mathcal {S}}({\bar {x}}),\\\operatorname {aff} {\mathcal {S}}({\bar {x}})+\operatorname {Im} {(A^{*})}=E.\end{array}}}

Dualité lagrangienne

Le problème dual lagrangien de ( P f ) {\displaystyle (P_{f})} s'écrit comme le problème en y F {\displaystyle y\in F} suivant :

( D f ) { sup y b , y A y B . {\displaystyle (D_{f})\quad \left\{{\begin{array}{l}\sup _{y}\;\langle b,y\rangle \\A^{*}y\in {\mathcal {B}}^{\circ }.\end{array}}\right.}

Pas de saut de dualité — Si f {\displaystyle f} est une jauge polyédrique, alors val ( P f ) = val ( D f ) {\displaystyle \operatorname {val} (P_{f})=\operatorname {val} (D_{f})} (qui peut valoir + {\displaystyle +\infty } ).

Recouvrement par jauge polyédrique sous description primale

Cette section donne les détails du problème de recouvrement par jauge polyédrique lorsque celle-ci est vue comme jauge d'un polyèdre convexe B {\displaystyle {\mathcal {B}}} , lequel est décrit comme une enveloppe convexe de points plus une enveloppe conique de directions (description primale ou interne d'un polyèdre convexe).

Définition du problème

Le problème considéré s'écrit comme dans le cas abstrait, à savoir

( P f ) { inf f ( x ) A x = b , {\displaystyle (P_{f})\quad \left\{{\begin{array}{l}\inf \;f(x)\\Ax=b,\end{array}}\right.}

mais la jauge polyédrique f {\displaystyle f} est définie comme jauge d'un polyèdre convexe B {\displaystyle {\mathcal {B}}} par la formule

x E f ( x ) = inf { t > 0 x t B } . {\displaystyle \forall x\in E\quad f(x)={\inf }\{t>0\mid x\in t\,{\mathcal {B}}\}.}

Le polyèdre convexe B {\displaystyle {\mathcal {B}}} est décrit comme suit :

B = co { c i i I } + cone { d j j J } , {\displaystyle {\mathcal {B}}=\operatorname {co} \{c_{i}\mid i\in I\}+\operatorname {cone} \{d_{j}\mid j\in J\},}

où les points c i {\displaystyle c_{i}} sont dans E {\displaystyle E} et en nombre fini ( I {\displaystyle I} est fini) et les directions d j {\displaystyle d_{j}} sont dans E {\displaystyle E} et en nombre fini ( J {\displaystyle J} est fini). Tout polyèdre convexe peut s'écrire de cette manière. On doit supposer que

0 B {\displaystyle 0\in {\mathcal {B}}}

pour que la jauge associée s'annule en l'origine. Mais on ne suppose pas que 0 {\displaystyle 0} est intérieur à B {\displaystyle {\mathcal {B}}} , si bien que f {\displaystyle f} peut prendre la valeur + {\displaystyle +\infty } . Comme B {\displaystyle {\mathcal {B}}} est fermé, la jauge f {\displaystyle f} est « fermée », c'est-à-dire semi-continue inférieurement.

Soient I 0 I {\displaystyle I_{0}\subset I} et J 0 J {\displaystyle J_{0}\subset J} . Il est utile d'introduire les applications linéaires

C I 0 : α I 0 R | I 0 | C I 0 α I 0 := i I 0 α i c i E , C := C I , D J 0 : β R | J 0 | D J 0 β := j J 0 β j d j E , D := D I . {\displaystyle {\begin{array}{c}C_{I_{0}}:\alpha _{I_{0}}\in \mathbb {R} ^{|I_{0}|}\mapsto C_{I_{0}}\alpha _{I_{0}}:=\sum _{i\in I_{0}}\alpha _{i}c_{i}\in E,\quad C:=C_{I},\\D_{J_{0}}:\beta \in \mathbb {R} ^{|J_{0}|}\mapsto D_{J_{0}}\beta :=\sum _{j\in J_{0}}\beta _{j}d_{j}\in E,\quad D:=D_{I}.\end{array}}}

On adopte la notation matricielle pour l'application linéaire

( C I 0   D J 0 ) : ( α I 0 , β J 0 ) R | I 0 | × R | J 0 | ( C I 0   D J 0 ) ( α I 0 , β J 0 ) = C I 0 α I 0 + D J 0 β J 0 E {\displaystyle (C_{I_{0}}~D_{J_{0}}):(\alpha _{I_{0}},\beta _{J_{0}})\in \mathbb {R} ^{|I_{0}|}\times \mathbb {R} ^{|J_{0}|}\mapsto (C_{I_{0}}~D_{J_{0}})(\alpha _{I_{0}},\beta _{J_{0}})=C_{I_{0}}\alpha _{I_{0}}+D_{J_{0}}\beta _{J_{0}}\in E}

et l'on note ( C   D ) := ( C I   D J ) {\displaystyle (C~D):=(C_{I}~D_{J})} . Avec ces notations, l'ensemble B {\displaystyle {\mathcal {B}}} s'écrit aussi

B = { C α + D β α Δ I ,   β R + | J | } , {\displaystyle {\mathcal {B}}=\{C\alpha +D\beta \mid \alpha \in \Delta _{I},~\beta \in \mathbb {R} _{+}^{|J|}\},}

Δ I := { α R + | I | i I α i = 1 } {\displaystyle \Delta _{I}:=\{\alpha \in \mathbb {R} _{+}^{|I|}\mid {\sum }_{i\in I}\alpha _{i}=1\}} est le simplexe unité de R | I | {\displaystyle \mathbb {R} ^{|I|}} .

Grâce à la condition 0 B {\displaystyle 0\in {\mathcal {B}}} , on a l'équivalence

f ( x ) = 0 x = D β     pour un     β 0     ( ou     x = 0     si     J = ) . {\displaystyle f(x)=0\qquad \Longleftrightarrow \qquad x=D\beta ~~{\mbox{pour un}}~~\beta \geqslant 0~~({\mbox{ou}}~~x=0~~{\mbox{si}}~~J=\varnothing ).}

Le polaire de l'ensemble B {\displaystyle {\mathcal {B}}} introduit ci-dessus s'écrit

B = { x E i I     x , c i 1  et  j J     x , d j 0 } . {\displaystyle {\mathcal {B}}^{\circ }=\{x^{*}\in E\mid \forall i\in I~~\langle x^{*},c_{i}\rangle \leqslant 1{\text{ et }}\forall j\in J~~\langle x^{*},d_{j}\rangle \leqslant 0\}.}

Alors le sous-différentiel de la jauge f {\displaystyle f} en x {\displaystyle x} est donné par la formule

S ( x ) := argmax x  tel que i I x , c i 1  et  j J x , d j 0 x , x . {\displaystyle \displaystyle {\mathcal {S}}(x):=\displaystyle \operatorname {argmax} \limits _{\begin{array}{c}x^{*}{\text{ tel que}}\\\forall i\in I\quad \langle x^{*},c_{i}\rangle \leqslant 1{\text{ et }}\\\forall j\in J\quad \langle x^{*},d_{j}\rangle \leqslant 0\end{array}}\,\langle x^{*},x\rangle .}

Existence de solution

Le résultat d'existence de solution II du cas abstrait devient le suivant.

Existence de solution II — Soient f {\displaystyle f} une jauge polyédrique sous description primale dont le domaine intersecte X {\displaystyle {\mathcal {X}}} et x ¯ X {\displaystyle {\bar {x}}\in {\mathcal {X}}} . Alors

  • x ¯ Sol ( P f ) {\displaystyle {\bar {x}}\in \operatorname {Sol} (P_{f})} si, et seulement si, les deux conditions suivantes ont lieu
    1. x ¯ = C α ¯ + D β ¯  pour des  ( α ¯ , β ¯ ) R + | I | × R + | J | {\displaystyle {\bar {x}}=C{\bar {\alpha }}+D{\bar {\beta }}{\text{ pour des }}({\bar {\alpha }},{\bar {\beta }})\in \mathbb {R} _{+}^{|I|}\times \mathbb {R} _{+}^{|J|}} ,
    2. il existe y ¯ F {\displaystyle {\bar {y}}\in F} tel que pour tout ( i , j ) I × J {\displaystyle (i,j)\in I\times J} on a A y ¯ , c i = 1 {\displaystyle \langle A^{*}{\bar {y}},c_{i}\rangle =1} si α ¯ i > 0 {\displaystyle {\bar {\alpha }}_{i}>0} , A y ¯ , c i 1 {\displaystyle \langle A^{*}{\bar {y}},c_{i}\rangle \leqslant 1} si α ¯ i = 0 {\displaystyle {\bar {\alpha }}_{i}=0} , A y ¯ , d j = 0 {\displaystyle \langle A^{*}{\bar {y}},d_{j}\rangle =0} si β ¯ j > 0 {\displaystyle {\bar {\beta }}_{j}>0} et A y ¯ , d j 0 {\displaystyle \langle A^{*}{\bar {y}},d_{j}\rangle \leqslant 0} si β ¯ j = 0 {\displaystyle {\bar {\beta }}_{j}=0} ,
  • x ¯ ir Sol ( P f ) {\displaystyle {\bar {x}}\in \operatorname {ir} \operatorname {Sol} (P_{f})} si, et seulement si, les deux conditions suivantes ont lieu
    1. x ¯ = C α ¯ + D β ¯  pour des  ( α ¯ , β ¯ ) R + | I | × R + | J | {\displaystyle {\bar {x}}=C{\bar {\alpha }}+D{\bar {\beta }}{\text{ pour des }}({\bar {\alpha }},{\bar {\beta }})\in \mathbb {R} _{+}^{|I|}\times \mathbb {R} _{+}^{|J|}} ,
    2. il existe y ¯ F {\displaystyle {\bar {y}}\in F} tel que pour tout ( i , j ) I × J {\displaystyle (i,j)\in I\times J} on a A y ¯ , c i = 1 {\displaystyle \langle A^{*}{\bar {y}},c_{i}\rangle =1} si α ¯ i > 0 {\displaystyle {\bar {\alpha }}_{i}>0} , A y ¯ , c i < 1 {\displaystyle \langle A^{*}{\bar {y}},c_{i}\rangle <1} si α ¯ i = 0 {\displaystyle {\bar {\alpha }}_{i}=0} , A y ¯ , d j = 0 {\displaystyle \langle A^{*}{\bar {y}},d_{j}\rangle =0} si β ¯ j > 0 {\displaystyle {\bar {\beta }}_{j}>0} et A y ¯ , d j < 0 {\displaystyle \langle A^{*}{\bar {y}},d_{j}\rangle <0} si β ¯ j = 0 {\displaystyle {\bar {\beta }}_{j}=0} .

Les coefficients α ¯ {\displaystyle {\bar {\alpha }}} et β ¯ {\displaystyle {\bar {\beta }}} permettant de représenter x ¯ {\displaystyle {\bar {x}}} par x ¯ = C α ¯ + D β ¯ {\displaystyle {\bar {x}}=C{\bar {\alpha }}+D{\bar {\beta }}} dans ce résultat sont en réalité les multiplicateurs de Lagrange associés aux contraintes du problème d'optimisation linéaire définissant S ( x ¯ ) {\displaystyle {\mathcal {S}}({\bar {x}})} . Au second point, ces coefficients α ¯ {\displaystyle {\bar {\alpha }}} et β ¯ {\displaystyle {\bar {\beta }}} sont des multiplicateurs optimaux satisfaisant en plus la stricte complémentarité.

Existence et unicité de solution

Le résultat d'existence et d'unicité de solution du cas abstrait devient le suivant.

Existence et unicité de solution — Soient f {\displaystyle f} une jauge polyédrique sous description primale dont le domaine intersecte X {\displaystyle {\mathcal {X}}} et x ¯ X {\displaystyle {\bar {x}}\in {\mathcal {X}}} . Alors les conditions suivantes sont équivalentes :

  1. x ¯ {\displaystyle {\bar {x}}} est l'unique solution de ( P f ) {\displaystyle (P_{f})}  ;
  2. on peut trouver des ensembles d'indices I + I {\displaystyle I_{+}\subset I} et J + J {\displaystyle J_{+}\subset J} tels que :
    • x ¯ = C I + α ¯ I + + D J + β ¯ J + {\displaystyle {\bar {x}}=C_{I_{+}}{\bar {\alpha }}_{I_{+}}+D_{J_{+}}{\bar {\beta }}_{J_{+}}} , pour des α ¯ I + > 0 {\displaystyle {\bar {\alpha }}_{I_{+}}>0} et β ¯ J + > 0 {\displaystyle {\bar {\beta }}_{J_{+}}>0} ,
    • il existe y ¯ F {\displaystyle {\bar {y}}\in F} tel que A y ¯ , c i = 1 {\displaystyle \langle A^{*}{\bar {y}},c_{i}\rangle =1} si i I + {\displaystyle i\in I_{+}} , A y ¯ , c i < 1 {\displaystyle \langle A^{*}{\bar {y}},c_{i}\rangle <1} si i I I + {\displaystyle i\in I\setminus I_{+}} , A y ¯ , d j = 0 {\displaystyle \langle A^{*}{\bar {y}},d_{j}\rangle =0} si j J + {\displaystyle j\in J_{+}} et A y ¯ , d j < 0 {\displaystyle \langle A^{*}{\bar {y}},d_{j}\rangle <0} si j J J + {\displaystyle j\in J\setminus J_{+}} ,
    • quels que soient ces ensembles d'indices I + {\displaystyle I_{+}} et J + {\displaystyle J_{+}} vérifiant ces deux premières conditions, on a Ker ( A ) Im ( C I +   D J + ) = { 0 } {\displaystyle \operatorname {Ker} {(A)}\cap \operatorname {Im} {(C_{I_{+}}~D_{J_{+}})}=\{0\}}  ;
  3. on peut trouver des ensembles d'indices I + I {\displaystyle I_{+}\subset I} et J + J {\displaystyle J_{+}\subset J} tels que :
    • x ¯ = C I + α ¯ I + + D J + β ¯ J + {\displaystyle {\bar {x}}=C_{I_{+}}{\bar {\alpha }}_{I_{+}}+D_{J_{+}}{\bar {\beta }}_{J_{+}}} , pour des α ¯ I + > 0 {\displaystyle {\bar {\alpha }}_{I_{+}}>0} et β ¯ J + > 0 {\displaystyle {\bar {\beta }}_{J_{+}}>0} ,
    • il existe y ¯ F {\displaystyle {\bar {y}}\in F} tel que A y ¯ , c i = 1 {\displaystyle \langle A^{*}{\bar {y}},c_{i}\rangle =1} si i I + {\displaystyle i\in I_{+}} , A y ¯ , c i < 1 {\displaystyle \langle A^{*}{\bar {y}},c_{i}\rangle <1} si i I I + {\displaystyle i\in I\setminus I_{+}} , A y ¯ , d j = 0 {\displaystyle \langle A^{*}{\bar {y}},d_{j}\rangle =0} si j J + {\displaystyle j\in J_{+}} et A y ¯ , d j < 0 {\displaystyle \langle A^{*}{\bar {y}},d_{j}\rangle <0} si j J J + {\displaystyle j\in J\setminus J_{+}} ,
    • Ker ( A ) Im ( C I +   D J + ) = { 0 } {\displaystyle \operatorname {Ker} {(A)}\cap \operatorname {Im} {(C_{I_{+}}~D_{J_{+}})}=\{0\}} .

La seconde condition semble plus forte que la troisième, mais ce résultat montre qu'il n'en est rien. Cette seconde condition est utilisée par l'algorithme de détection d'unicité présenté plus loin. Cet algorithme détermine d'abord des ensembles d'indices I + I {\displaystyle I_{+}\subset I} et J + J {\displaystyle J_{+}\subset J} satisfaisant les deux premiers points de la condition 2 et détermine ensuite si l'unicité a lieu en vérifiant si Ker ( A ) Im ( C I +   D J + ) = { 0 } {\displaystyle \operatorname {Ker} {(A)}\cap \operatorname {Im} {(C_{I_{+}}~D_{J_{+}})}=\{0\}} .

Méthode de résolution

La méthode de résolution du problème de recouvrement par jauge sous forme primale ( P f ) {\displaystyle (P_{f})} décrite dans cette section transforme ce problème en le problème d'optimisation linéaire suivant

( P f ) { sup ( α , β , t ) R | I | × R | J | × R t A ( C α + D β ) = t b ( α , β ) Δ I × R + | J | , {\displaystyle (P'_{f})\quad \left\{{\begin{array}{l}\sup _{(\alpha ,\beta ,t)\in \mathbb {R} ^{|I|}\times \mathbb {R} ^{|J|}\times \mathbb {R} }\;t\\A(C\alpha +D\beta )=tb\\(\alpha ,\beta )\in \Delta _{I}\times \mathbb {R} _{+}^{|J|},\end{array}}\right.}

où les opérateurs linéaire C {\displaystyle C} et D {\displaystyle D} ont été définis ci-dessus et Δ I {\displaystyle \Delta _{I}} est le simplexe unité de R | I | {\displaystyle \mathbb {R} ^{|I|}} . En quelques mots, dans le problème ( P f ) {\displaystyle (P_{f})} , l'ensemble de sous-niveau un B {\displaystyle {\mathcal {B}}} de f {\displaystyle f} est mis à l'échelle de manière que sa frontière vienne en contact avec le sous-espace affine X = { x E A x = b } {\displaystyle {\mathcal {X}}=\{x\in E\mid Ax=b\}} (par l'homogénéité positive de f {\displaystyle f} cela revient à trouver son bon ensemble de sous-niveau), tandis que dans ( P f ) {\displaystyle (P'_{f})} , le même sous-espace affine X {\displaystyle {\mathcal {X}}} est translaté de manière à venir en contact avec la frontière de B {\displaystyle {\mathcal {B}}} . Le sens de cette équivalence entre ( P f ) {\displaystyle (P_{f})} et ( P f ) {\displaystyle (P'_{f})} est précisé dans le résultat suivant.

Équivalence entre ( P f ) {\displaystyle (P_{f})} et ( P f ) {\displaystyle (P'_{f})}  — Soit f {\displaystyle f} une jauge polyédrique sous description primale. Alors, on peut trouver un couple ( α 0 , β 0 ) Δ I × R + | J | {\displaystyle (\alpha _{0},\beta _{0})\in \Delta _{I}\times \mathbb {R} _{+}^{|J|}} tel que C α 0 + D β 0 = 0 {\displaystyle C\alpha _{0}+D\beta _{0}=0} . De plus

  • b A D ( R + | J | ) {\displaystyle b\in AD(\mathbb {R} _{+}^{|J|})} {\displaystyle \Longleftrightarrow } D β Sol ( P f ) {\displaystyle D\beta \in \operatorname {Sol} (P_{f})} pour un β 0 {\displaystyle \beta \geqslant 0} {\displaystyle \Longleftrightarrow } val ( P f ) = 0 {\displaystyle \operatorname {val} (P_{f})=0} {\displaystyle \Longleftrightarrow } val ( P f ) = + {\displaystyle \operatorname {val} (P'_{f})=+\infty } ,
  • b A ( R + B ) {\displaystyle b\notin A(\mathbb {R} _{+}{\mathcal {B}})} {\displaystyle \Longleftrightarrow } val ( P f ) = + {\displaystyle \operatorname {val} (P_{f})=+\infty } {\displaystyle \Longleftrightarrow } val ( P f ) = 0 {\displaystyle \operatorname {val} (P'_{f})=0} {\displaystyle \Longleftrightarrow } ( α 0 , β 0 , 0 ) Sol ( P f ) {\displaystyle (\alpha _{0},\beta _{0},0)\in \operatorname {Sol} (P'_{f})} ,
  • si b A ( R + B ) A D ( R + | J | ) {\displaystyle b\in A(\mathbb {R} _{+}{\mathcal {B}})\setminus AD(\mathbb {R} _{+}^{|J|})} , alors 0 < val ( P f ) = 1 / val ( P f ) < + {\displaystyle 0<\operatorname {val} (P'_{f})=1/\operatorname {val} (P_{f})<+\infty }  ; de plus,
    • si ( α ¯ , β ¯ , t ¯ ) {\displaystyle ({\bar {\alpha }},{\bar {\beta }},{\bar {t}})} est une solution de ( P f ) {\displaystyle (P'_{f})} , alors x ¯ = ( C α ¯ + D β ¯ ) / t ¯ {\displaystyle {\bar {x}}=(C{\bar {\alpha }}+D{\bar {\beta }})/{\bar {t}}} est une solution de ( P f ) {\displaystyle (P_{f})} ,
    • inversement, si x ¯ {\displaystyle {\bar {x}}} est une solution de ( P f ) {\displaystyle (P_{f})} , alors x ¯ = f ( x ¯ ) ( C α ¯ + D β ¯ ) {\displaystyle {\bar {x}}=f({\bar {x}})(C{\bar {\alpha }}+D{\bar {\beta }})} pour un couple ( α ¯ , β ¯ ) Δ I × R + | J | {\displaystyle ({\bar {\alpha }},{\bar {\beta }})\in \Delta _{I}\times \mathbb {R} _{+}^{|J|}} et, pour toute expression de x ¯ {\displaystyle {\bar {x}}} de cette forme, ( α ¯ , β ¯ , 1 / f ( x ¯ ) ) {\displaystyle ({\bar {\alpha }},{\bar {\beta }},1/f({\bar {x}}))} est solution de ( P f ) {\displaystyle (P'_{f})} .

Le fait que le problème ( P f ) {\displaystyle (P_{f})} soit équivalent au problème d'optimisation linéaire ( P f ) {\displaystyle (P_{f}')} rend possible la résolution de ( P f ) {\displaystyle (P_{f})} en temps polynomial, par exemple en utilisant un algorithme de points intérieurs.

Le dual lagrangien de ( P f ) {\displaystyle (P_{f}')} s'écrit

( D f ) { inf ( y , s ) F × R s , i I A y , c i s , j J A y , d j 0 , b , y = 1. {\displaystyle (D_{f}')\quad \left\{{\begin{array}{l}\inf _{(y,s)\in F\times \mathbb {R} }\;s,\\\forall i\in I\quad \langle A^{*}y,c_{i}\rangle \leqslant s,\\\forall j\in J\quad \langle A^{*}y,d_{j}\rangle \leqslant 0,\\\langle b,y\rangle =1.\end{array}}\right.}

Il n'y a pas de saut de dualité :

val ( P f ) = val ( D f ) {\displaystyle \operatorname {val} (P_{f}')=\operatorname {val} (D_{f}')} .

Détection de l'unicité

Le résultat d'existence et unicité de solution ci-dessus permet de mettre au point un algorithme détectant l'unicité de solution du problème ( P f ) {\displaystyle (P_{f})} .

Détection de l'unicité — 

  1. On résout le problème d'optimisation linéaire ( P f ) {\displaystyle (P_{f}')} par un solveur fournissant une solution strictement complémentaire (lorsqu'une solution existe : cas 3 et 4 ci-dessous).
  2. Si la valeur optimale val ( P f ) = + {\displaystyle \operatorname {val} (P_{f}')=+\infty } , alors val ( P f ) = 0 {\displaystyle \operatorname {val} (P_{f})=0} et
    • soit J {\displaystyle J\neq \varnothing } , auquel cas Sol ( P f ) = D ( R + | J | ) {\displaystyle \operatorname {Sol} (P_{f})=D(\mathbb {R} _{+}^{|J|})} (la solution n'est pas unique),
    • ou J = {\displaystyle J=\varnothing } , auquel cas Sol ( P f ) = { 0 } {\displaystyle \operatorname {Sol} (P_{f})=\{0\}} (la solution est unique).
  3. Si la valeur optimale val ( P f ) = 0 {\displaystyle \operatorname {val} (P_{f}')=0} , alors val ( P f ) = + {\displaystyle \operatorname {val} (P_{f})=+\infty } (le problème est non borné).
  4. Sinon 0 < val ( P f ) < + {\displaystyle 0<\operatorname {val} (P_{f}')<+\infty } , auquel cas val ( P f ) = 1 / val ( P f ) {\displaystyle \operatorname {val} (P_{f})=1/\operatorname {val} (P_{f}')} . Soit ( ( α ¯ , β ¯ , t ¯ ) , ( y ¯ , s ¯ , u ¯ , v ¯ ) ) {\displaystyle (({\bar {\alpha }},{\bar {\beta }},{\bar {t}}),({\bar {y}},{\bar {s}},{\bar {u}},{\bar {v}}))} la solution primale-duale strictement complémentaire calculée par le solveur. Alors x ¯ = ( C α ¯ + D β ¯ ) / t ¯ {\displaystyle {\bar {x}}=(C{\bar {\alpha }}+D{\bar {\beta }})/{\bar {t}}} est une solution de ( P f ) {\displaystyle (P_{f})} et celle-ci est unique si, et seulement si,

    Ker ( A ) Im ( C I + D J + ) = { 0 } , {\displaystyle \operatorname {Ker} {(A)}\cap \operatorname {Im} {(C_{I_{+}}\;D_{J_{+}})}=\{0\},}

    I + := { i I α ¯ i > 0 } {\displaystyle I_{+}:=\{i\in I\mid {\bar {\alpha }}_{i}>0\}} et J + := { j J β ¯ j > 0 } {\displaystyle J_{+}:=\{j\in J\mid {\bar {\beta }}_{j}>0\}} .

Annexes

Notes

  1. Gauge recovery en anglais : voir par exemple Chandrasekaran et al. 2012 ou Gilbert 2016.
  2. Voir Gilbert 2016.

Bibliographie

  • (en) V. Chandrasekaran, B. Recht, P. A. Parrilo et A. S. Willsky, « The convex geometry of linear inverse problems », Foundations of Computational Mathematics, vol. 12, no 6,‎ , p. 805-849 (DOI 10.1007/s10208-012-9135-7, arXiv 1012.0621)
  • (en) J. Ch. Gilbert, « On the solution uniqueness characterization in the L1 norm and polyhedral gauge recovery », Journal of Optimization Theory and Applications, vol. 1, no 1,‎ , p. 1-32 (DOI 10.1007/s10957-016-1004-0, lire en ligne)
  • icône décorative Portail de l'analyse