Lemme de Schwartz-Zippel

Page d’aide sur l’homonymie

Ne doit pas être confondu avec Lemme de Schwarz.

En mathématiques, le lemme de Schwartz-Zippel est un résultat important pour évaluer l'égalité entre deux polynômes multivariés. Ce lemme donne naturellement un algorithme probabiliste efficace pour résoudre la question de l'égalité entre polynômes, qui fut historiquement le premier à être prouvé correct[1]. De fait il possède de nombreuses applications en théorie des nombres, en cryptographie, en géométrie, mais également dans les problèmes issues de la théorie des graphes et en théorie de la complexité[1].

Histoire

Le résultat lui-même a été redécouvert plusieurs fois de manière indépendante. En 1922 Øystein Ore publie une première version limitée aux corps finis[2], puis Richard DeMillo et Richard Lipton publient une version faible en 1978[3]. Le lemme sous sa forme (forte) actuelle est due simultanément à Jack Schwartz[4] et Richard Zippel[5] en 1979, qui l'ont présenté indépendamment à la même conférence[6]. En dépit de ses nombreux auteurs, et bien que n'étant pas issu d'une collaboration entre eux, le résultat est le plus souvent simplement attribué à « Schwartz-Zippel. »

Énoncé du lemme

On se place dans un corps commutatif F {\displaystyle \mathbb {F} } et on considère un polynôme multivarié P F [ x 1 , , x n ] {\displaystyle P\in \mathbb {F} [x_{1},\dotsc ,x_{n}]} , non identiquement nul, de degré d 0 {\displaystyle d\geq 0} .

Soit S {\displaystyle S} un sous-ensemble fini non vide de F {\displaystyle \mathbb {F} } . Si s 1 , s 2 , , s n {\displaystyle s_{1},s_{2},\dotsc ,s_{n}} sont des éléments tirés uniformément et indépendamment de S {\displaystyle S} , alors

Pr [ P ( s 1 , , s n ) = 0 ] δ ( n , d , | S | ) {\displaystyle \displaystyle \Pr \left[P(s_{1},\dotsc ,s_{n})=0\right]\leq \delta (n,d,|S|)}

où la fonction δ {\displaystyle \delta } est bornée par:

  • d / | S | {\displaystyle d/|S|} dans la version forte du lemme (due à Schwartz);
  • n d / | S | {\displaystyle nd/|S|} dans la version faible du lemme (due à DeMillo, Lipton, et Zippel).

Note : dans le cas des corps finis F q {\displaystyle \mathbb {F} _{q}} , il est possible qu'un polynôme s'évalue toujours à zéro sans être nul pour autant, comme par exemple x 2 x F 2 [ x ] {\displaystyle x^{2}-x\in \mathbb {F} _{2}[x]} , rendant inopérant le résultat de Schwartz-Zippel ; cette situation est évitée en s'assurant que d < q {\displaystyle d<q} .

Preuve du lemme

Nous allons démontrer la version forte, la version faible en découlant naturellement. La preuve s'obtient par récurrence sur n {\displaystyle n} .

Le cas n = 1 {\displaystyle n=1} correspond simplement au fait qu'un polynôme de degré d {\displaystyle d} possède au plus d {\displaystyle d} racines dans F {\displaystyle \mathbb {F} } . Cela se montre aisément par contradiction : s'il y avait plus de d {\displaystyle d} racines, on pourrait écrire P {\displaystyle P} comme un produit d'au moins d + 1 {\displaystyle d+1} facteurs de la forme ( x 1 α i ) {\displaystyle (x_{1}-\alpha _{i})} et donc P {\displaystyle P} serait de degré au moins d + 1 {\displaystyle d+1} , ce qui est faux. Ainsi le cas n = 1 {\displaystyle n=1} du théorème est établi.

On suppose alors que le résultat tient pour tous les polynômes en m < n {\displaystyle m<n} variables, et on procède ainsi : soit P F [ x 1 , , x n ] {\displaystyle P\in \mathbb {F} [x_{1},\dotsc ,x_{n}]} , on extrait la dépendance en x 1 {\displaystyle x_{1}} de la manière suivante :

P ( x 1 , , x n ) = i = 0 d x 1 i P i ( x 2 , , x n ) {\displaystyle P(x_{1},\dotsc ,x_{n})=\sum _{i=0}^{d}x_{1}^{i}P_{i}(x_{2},\dotsc ,x_{n})}

en notant que cela est possible car le corps est commutatif.

Tous les polynômes P i {\displaystyle P_{i}} ne peuvent pas être nuls, car sinon P {\displaystyle P} serait identiquement nul, ce qui est faux. Soit alors m {\displaystyle m} le plus grand indice tel que P m 0 {\displaystyle P_{m}\neq 0} . Par construction, le degré de x m P m {\displaystyle x^{m}P_{m}} est au plus d {\displaystyle d} , c'est-à-dire que le degré de P m {\displaystyle P_{m}} est au plus d m {\displaystyle d-m} . L'hypothèse de récurrence donne alors :

Pr [ P m ( s 2 , , s n ) = 0 ] d m | S | {\displaystyle \Pr[P_{m}(s_{2},\dotsc ,s_{n})=0]\leq {\frac {d-m}{|S|}}}

Si P m {\displaystyle P_{m}} ne s'annule pas sur s 2 , , s n {\displaystyle s_{2},\dotsc ,s_{n}} , alors P {\displaystyle P} est au moins de degré m {\displaystyle m} . Appliquant encore l'hypothèse de récurrence, on a ainsi

Pr [ P ( s 1 , , s n ) = 0 P m ( s 2 , , s n ) 0 ] m | S | {\displaystyle \Pr \left[P(s_{1},\dotsc ,s_{n})=0\mid P_{m}(s_{2},\dots ,s_{n})\neq 0\right]\leq {\frac {m}{|S|}}}

On conclut de la manière suivante : dénotons par A {\displaystyle A} l'événement correspondant à l'annulation de P {\displaystyle P} , et par B {\displaystyle B} l'annulation de P m {\displaystyle P_{m}} . Les deux formules ci-dessus s'écrivent alors :

Pr [ B ] ( d m ) / | S | {\displaystyle \Pr[B]\leq (d-m)/|S|}

Pr [ A B ¯ ] m / | S | {\displaystyle \Pr[A\mid {\overline {B}}]\leq m/|S|}

Ce qui permet d'écrire

Pr [ A ] = Pr [ A | B ] Pr [ B ] + Pr [ A | B ¯ ] Pr [ B ¯ ] Pr [ B ] + Pr [ A | B ¯ ] d m | S | + m | S | = d | S | {\displaystyle {\begin{aligned}\Pr[A]&=\Pr[A|B]\Pr[B]+\Pr[A|{\overline {B}}]\Pr[{\overline {B}}]\\&\leq \Pr[B]+\Pr[A|{\overline {B}}]\\&\leq {\frac {d-m}{|S|}}+{\frac {m}{|S|}}\\&={\frac {d}{|S|}}\end{aligned}}}

Ainsi on a montré que le théorème est vrai pour un polynôme en n {\displaystyle n} variables.

Test d'identité polynomiale

Le lemme de Schwartz-Zippel donne immédiatement un algorithme probabiliste pour tester la nullité d'un polynôme, ou l'égalité entre deux polynômes (on teste la nullité de leur différence). Il suffit en effet de tirer n {\displaystyle n} valeurs uniformément au hasard et d'évaluer le polynôme, quitte à réitérer la procédure jusqu'à atteindre le niveau de certitude souhaité.

Les meilleures méthodes déterministes pour résoudre ce problème, lorsque le polynôme est fourni sous forme par exemple d'un circuit arithmétique, sont de complexité exponentielle. L'utilisation d'un aléa permet donc un gain substantiel et fait du lemme de Schwartz-Zippel un outil important. Réciproquement, trouver un algorithme déterministe aussi efficace aurait des implications profondes sur la théorie de la complexité[7],[8].

Si on considère une classe restreinte de polynômes (généralement exprimés comme des circuits arithmétiques contraints) alors quelques algorithmes déterministes efficaces sont connus, au moins pour la profondeur 2 et 3[9],[10], ou des instances très creuses[11]. La profondeur 4 est abordable uniquement pour des classes très réduites[12].

Parmi les algorithmes probabilistes, celui de Schwartz-Zippel est le plus efficace connu, mais il présente le défaut de consommer beaucoup d'aléa. Il existe des variantes plus parcimonieuses, telles que l'algorithme de Chen et Kao[13] ou Lewin et Vadhan[8], qui utilisent moins de bits aléatoires mais ont une complexité plus grande.

Applications

  • En théorie de la complexité. Le lemme joue un rôle clé dans la preuve par Adi Shamir de IP = PSPACE[14], plus spécifiquement dans l'étape montrant que QSAT appartient à ABPP[15].
  • En théorie des nombres. Le test de primalité d'Agrawal-Biswas[16] repose sur l'algorithme de Schwartz-Zippel pour tester l'égalité ( 1 + z ) n = 1 + z n mod n {\displaystyle (1+z)^{n}=1+z^{n}{\bmod {n}}} , qui vaut lorsque n {\displaystyle n} est premier.
  • En géométrie. En 2008, Zeev Dvir a démontré la conjecture de Kakeya dans les corps finis via une preuve remarquablement simple qui s'appuie notamment sur le lemme de Schwartz-Zippel[17].
  • En logique. L'identité entre diagrammes de décision binaire se ramène au problème de l'identité entre polynômes et peut donc être abordée par les mêmes outils.
  • En théorie des graphes. Via le théorème de Tutte[18], l'existence d'un couplage équivaut à ce que le polynôme caractéristique d'une certaine matrice soit le polynôme nul, ce que permet de vérifier (en probabilité) le lemme de Schwartz-Zippel[19].
  • En algorithmique. Si A , B , C {\displaystyle A,B,C} sont des matrices carrées de taille n × n {\displaystyle n\times n} , l'identité A B = C {\displaystyle AB=C} peut être vérifiée en temps O ( n 2 ) {\displaystyle O(n^{2})} en appliquant le lemme, plutôt que O ( n 3 ) {\displaystyle O(n^{3})} en effectuant le produit et en comparant.
  • En cryptographie. En 2016, Garg et coll. ont proposé une construction d'obfuscation cryptographique dont la sécurité repose notamment sur une extension du lemme de Schwartz-Zippel à des valeurs tirées des distributions générales avec assez d'entropie (à la place d'exiger la distribution uniforme) et possiblement présentant une dépendance entre elles (à la place d'exiger que les valeurs soient indépendantes)[20].

Références

  1. a et b (en) Nitin Saxena, « Progress on Polynomial Identity Testing », Bulletin of the EATCS 99,‎ , p. 49-79
  2. (de) Øystein Ore, « Über höhere Kongruenzen », Norsk Mat. Forenings Skrifter, Ser I. no 7,‎
  3. (en) Richard A. Demillo et Richard J. Lipton, « A probabilistic remark on algebraic program testing », Information Processing Letters, vol. 7, no 4,‎ , p. 193–195 (DOI 10.1016/0020-0190(78)90067-4, lire en ligne, consulté le )
  4. (en) Jack T. Schwartz, « Fast Probabilistic Algorithms for Verification of Polynomial Identities », Journal of the ACM (JACM), vol. 27, no 4,‎ , p. 701–717 (ISSN 0004-5411, DOI 10.1145/322217.322225, lire en ligne, consulté le )
  5. (en) Richard Zippel, « Probabilistic algorithms for sparse polynomials », International Symposium on Symbolic and Algebraic Manipulation (EUROSAM) 1979, Symbolic and Algebraic Computation,‎ , p. 216-226
  6. (en) Richard Lipton, « The Curious History of the Schwartz-Zippel Lemma »,
  7. (en) Valentine Kabanets et Russell Impagliazzo, « Derandomizing Polynomial Identity Tests Means Proving Circuit Lower Bounds », computational complexity, vol. 13, nos 1-2,‎ , p. 1–46 (ISSN 1016-3328 et 1420-8954, DOI 10.1007/s00037-004-0182-6, lire en ligne, consulté le )
  8. a et b (en) Daniel Lewin et Salil Vadhan, « Checking polynomial identities over any field: towards a derandomization? », Proceedings of the Thirtieth Annual ACM Symposium on the Theory of Computing, ACM,‎ , p. 438–447 (ISBN 0897919629, DOI 10.1145/276698.276856, lire en ligne, consulté le )
  9. (en) Richard J. Lipton et Nisheeth K. Vishnoi, « Deterministic identity testing for multivariate polynomials », Proceedings of the Fourteenth Annual ACM-SIAM Symposium on Discrete Algorithms,‎ , p. 756-760
  10. (en) N. Saxena et C. Seshadhri, « An Almost Optimal Rank Bound for Depth-3 Identities », SIAM Journal on Computing, vol. 40, no 1,‎ , p. 200–224 (ISSN 0097-5397, DOI 10.1137/090770679, lire en ligne, consulté le )
  11. (en) Michael Ben-Or et Prasoon Tiwari, « A deterministic algorithm for sparse multivariate polynomial interpolation », Proceedings of the 20th Annual ACM Symposium on Theory of Computing, ACM,‎ , p. 301–309 (ISBN 0897912640, DOI 10.1145/62212.62241, lire en ligne, consulté le )
  12. (en) Amir Shpilka et Amir Yehudayoff, « Arithmetic Circuits: A survey of recent results and open questions », Foundations and Trends in Theoretical Computer Science, vol. 5, nos 3-4,‎ , p. 207–388 (DOI 10.1561/0400000039, lire en ligne, consulté le )
  13. (en) Z. Chen et M. Kao, « Reducing Randomness via Irrational Numbers », SIAM Journal on Computing, vol. 29, no 4,‎ , p. 1247–1256 (ISSN 0097-5397, DOI 10.1137/s0097539798341600, lire en ligne, consulté le )
  14. (en) Adi Shamir, « IP = PSPACE », Journal of the ACM (JACM), vol. 39, no 4,‎ , p. 869–877 (ISSN 0004-5411, DOI 10.1145/146585.146609, lire en ligne, consulté le )
  15. Nathanaël François, « IP = PSPACE »,
  16. (en) M. Agrawal et S. Biswas, « Primality and identity testing via Chinese remaindering », 40th Annual Symposium on Foundations of Computer Science (Cat. No.99CB37039),‎ , p. 202–208 (DOI 10.1109/sffcs.1999.814592, lire en ligne, consulté le )
  17. (en-US) Zeev Dvir, « On the size of Kakeya sets in finite fields », Journal of the American Mathematical Society, vol. 22, no 4,‎ , p. 1093–1097 (ISSN 0894-0347 et 1088-6834, DOI 10.1090/s0894-0347-08-00607-3, lire en ligne, consulté le )
  18. (en) William T. Tutte, « The Factorization of Linear Graphs », Journal of the London Mathematical Society, vol. s1-22, no 2,‎ , p. 107–111 (ISSN 1469-7750, DOI 10.1112/jlms/s1-22.2.107, lire en ligne, consulté le )
  19. (en) László Lovász, « On determinants, matchings, and random algorithms », FCT,‎ , p. 565-574 (lire en ligne)
  20. (en) Sanjam Garg, Eric Miles, Pratyay Mukherjee et Amit Sahai, « Secure Obfuscation in a Weak Multilinear Map Model », Theory of Cryptography, Springer, Berlin, Heidelberg, lecture Notes in Computer Science,‎ , p. 241–268 (ISBN 9783662536438, DOI 10.1007/978-3-662-53644-5_10, lire en ligne, consulté le )
  • icône décorative Portail des mathématiques