Les polynômes sont des représentations mathématiques des expressions intervenant dans les équations polynomiales. Ils permettent l’application de méthodes algébriques à la résolution de ces équations

Les équations sont des « objets » linguistiques

Equations polynomiales et systèmes de nombres

Une équation polynomiale est une équation de la forme \(a_nx^n+a_{n-1}x^{n-1}+\ldots+a_1x+a_0=0\), où \(a_0,\ldots,a_n\) sont classiquement des nombres, avec \(a_n\) non nul. De manière informelle, un polynôme est une expression \(a_nx^n+a_{n-1}x^{n-1}+\ldots+a_1x+a_0\), soit le membre de gauche d’une telle équation. Mais il faut en donner une définition mathématique.

Par exemple, l’équation \(x^2-x-1=0\), dont les coefficients sont \(-1,-1,1\), a pour solutions le nombre d’or \(\dfrac{1+\sqrt 5}{2}\) et le nombre \(\dfrac{1-\sqrt 5}{2}\). L’équation \(x^2+1=0\) n’a pas de solution dans l’ensemble \(\mathbb R\) des nombres réels (voir Qu’est-ce qu’un nombre réel ? La formidable construction de Cauchy), mais possède deux solutions dans l’ensemble \(\mathbb C\) des nombres complexes, les fameux nombres imaginaires \(i\) et \(-i\) (voir Qu’est-ce qu’un nombre complexe ? Une approche géométrique simple). 

Classiquement, les « coefficients » d’une telle équation polynomiale sont pris dans un « système de nombres » : entiers, rationnels, réels, complexes. En fait, pour écrire une telle équation il suffit de disposer d’un ensemble sur lequel sont définis une addition \(+\) et une multiplication \(\times\) ayant des propriétés similaires à celles qu’on trouve dans ces systèmes de nombres. On appelle un tel ensemble un anneau commutatif unitaire (voir par exemple https://fr.wikipedia.org/wiki/Anneau_commutatif).

Problème : étudier les solutions en général

Le degré d’une équation polynomiale est l’entier \(n\), c’est-à-dire le plus grand indice d’un coefficient non nul de l’équation, ou encore la puissance maximale de l’inconnue \(x\) apparaissant dans l’équation. On connaît des méthodes pour résoudre les équations de degré \(2\) (en utilisant le discriminant \(\Delta=b^2-4ac\), comme on l’apprend au lycée), \(3\) et \(4\) et certaines équations de degré \(\geq 5\), dans certains systèmes de nombres. Par exemple, depuis Lagrange on sait qu’une équation du type \(x^3+px+q=0\), avec \(p,q\in\mathbb C\), possède trois solutions, qu’on peut obtenir en extrayant des racines cubiques et en utilisant le nombre complexe \(j=e^{\frac{2i\pi}{3}}=-\dfrac 1 2 +i\dfrac{\sqrt 3}{2}\).

Cependant, il n’existe pas de méthode générique pour résoudre toutes les équations dans tous les anneaux et tous les degrés simultanément. Pour faire une étude théorique des équations polynomiales en général, on considère alors plutôt les polynômes, c’est-à-dire les expressions \(a_nx^n+a_{n-1}x^{n-1}+\ldots+a_1x+a_0\) elles-mêmes, et toutes les valeurs qu’elles prennent sur chaque élément du système : les « racines » d’un polynôme sont celles pour lesquelles l’expression vaut 0. Par exemple, \(i\) et \(-i\) sont les racines du polynôme \(x^2+1\) dans l’ensemble \(\mathbb C\) (puisque \(i^2+1=(-i)^2+1=-1+1=0\)) tandis que ce polynôme n’a pas de racines dans l’ensemble \(\mathbb R\) (puisque \(a^2+1\geq 1>0\) pour tout nombre réel \(a\)).

Les polynômes sont des objets mathématiques

Représenter des expressions par des suites

Or, pour étudier de manière systématique les polynômes avec des méthodes mathématiques, il faut que les polynômes soient des objets mathématiques. Nous les avons définis comme des expressions, c’est-à-dire des objets linguistiques. Il nous faut donc les transformer, ou plutôt les représenter comme des objets mathématiques, ce qui est possible grâce aux ressources de la combinatoire élémentaire.

Puisqu’un polynôme est, de manière informelle, une expression de la forme \(a_nx^n+a_{n-1}x^{n-1}+\ldots+a_1x+a_0\), on va simplement représenter une telle expression, dite « polynomiale », par la suite \(a_0,a_1,\ldots,a_{n-1},a_n\) de ses coefficients, dans l’ordre croissant des indices. Pour des raisons de commodité, on le représente en fait comme une suite infinie d’entiers naturels, en complétant après le dernier coefficient non nul \(a_n\) par des \(0\). Un polynôme à coefficients dans un anneau \(A\) est donc, de manière rigoureuse, une suite \(a_0,a_1,\ldots,a_n,\ldots\) d’éléments de \(A\) dont les termes sont nuls à partir d’un certain « rang ».

Par exemple, l’expression polynomiale \(x+\pi x^3-e x^6\), dont les coefficients sont des nombres réels, est représentée par le polynôme \(0,1,0,\pi,0,0,e,0,\ldots\), à coefficients dans l’anneau \(\mathbb R\) des nombres réels (les coefficients des puissances d’ordres \(0,2,4,5\) sont nuls).

L’addition des polynômes

Dans une expression polynomiale \(f(x)=a_nx^n+a_{n-1}x^{n-1}+\ldots + a_1x+a_0\), « l’inconnue » \(x\) est un élément générique qu’on peut remplacer par n’importe quelle valeur \(c\) : on obtient alors la valeur \(f(c)\) de l’expression \(f\) en \(c\), qui s’obtient comme résultat du calcul \(a_nc^n+a_{n-1}c^{n-1}+\ldots+a_1c+a_0\). Autrement dit, l’inconnue se comporte, vis-à-vis des opérations \(+\) et \(\times\), comme un élément quelconque de l’anneau \(A\) où sont choisis les coefficients de l’expression.

En particulier, si \(g(x)=b_mx^m+b_{m-1}x^{m-1}+\ldots+b_1x+b_0\) est une autre expression polynomiale, en remplaçant à nouvau \(x\) par \(c\) on obtient la valeur \(g(c)=b_mc^m+b_{m-1}c^{m-1}+\ldots+b_1c+b_0\). Supposons par exemple que \(n\geq m\) : si on additionne \(f(c)\) et \(g(c)\), on obtient alors \((a_n+b_n)c^n+(a_{n-1}+b_{n-1})c^{n-1}+\ldots +(a_1+b_1)c+(a_0+b_0)\). Autrement dit, pour calculer la somme des valeurs \(f(c)\) et \(g(c)\), il suffit d’additionner les coefficients de même indice des deux expressions polynomiales, pour obtenir une nouvelle expression \[h(x)=(a_n+b_n)x^n+(a_{n-1}+b_{n-1})x^{n-1}+\ldots +(a_1+b_1)x+(a_0+b_0)\] et de calculer la valeur de \(h\) en \(c\) !

Si nous traduisons ceci sur le plan des polynômes, cela signifie que l’on peut représenter l’addition de deux expressions polynomiales par une addition des polynômes, en additionnant simplement les coefficients qui ont la même place dans la suite. Par exemple, la somme du polynôme \(P=5,-2,0,4\) (qui représente l’expression \(4x^3-2x+5\)) et du polynôme \(Q=0,9,7\) (qui représente l’expression \(7x^2+9x\)), est le polynôme \(P+Q=5,7,7,4\), qui représente l’expression \(4x^3+7x^2+7x+5\).

Le produit de convolution

De la même façon, lorsqu’on multiplie les deux expressions polynomiales \(f(x)\) et \(g(x)\) précédentes en considérant l’inconnue \(x\) comme une valeur générique, on obtient une nouvelle expression polynomiale \(u(x)\), et en remplaçant \(x\) par une valeur donnée \(c\), le résultat obtenu, c’est-à-dire \(u(c)\), est la valeur du produit de \(f(c)\) et de \(g(c)\). Cependant, dans ce cas il ne suffit pas, comme pour l’addition, de multiplier les coefficients de même indice entre eux pour obtenir \(u(x)\) : la multiplication est plus complexe.

Par exemple, si \(f(x)=x^2+2x-3\) et \(g(x)=-5x+7\), leur multiplication donne, en développant, \((x^2+2x-3)(-5x+7)=-5x^3+7x^2-10x^2+14x+15x-21=-5x^3-3x^2+29x-21\). Il est possible de donner une description rigoureuse de la manière dont on doit « combiner » les coefficients des deux expressions de départ pour obtenir ceux de leur produit. En fait, une telle description revient à décrire la multiplication directement sur les polynômes, et c’est ce qu’on appelle un produit de « convolution », pour le distinguer d’avec un produit « coefficient par coefficient ».

Ainsi, si deux polynômes sont donnés comme les suites \(P=(a_0,a_1,\ldots,a_{n-1},a_n,0,\ldots)\) et \(Q=(b_0,b_1,\ldots,b_{m-1},b_m,0\ldots)\), on définit leur produit \(P\times Q\) comme le polynôme \((c_0,c_1,\ldots,c_{p-1},c_p,0,\ldots)\) dont le coefficient \(c_k\) d’indice \(k\) est donné par la formule suivante : \(c_k=\sum_{i+j=k} a_ib_j\). Cette formule signifie que pour obtenir \(c_k\), on additionne tous les produits de la forme \(a_i\times b_j\) d’un coefficient \(a_i\) de \(P\) et d’un coefficient \(b_j\) de \(Q\) pour lesquels la somme des indices \(i+j\) vaut \(k\). C’est une traduction de la multiplication des expressions génériques, et les opérations \(+\) et \(\times\) ainsi définies font de l’ensemble de ces polynômes (à coefficients dans un anneau \(A\)) un nouvel anneau (commutatif, unitaire) noté \(A[X]\) (lire « \(A\) crochet \(X\) ») .

L’indéterminée \(X\) et la recherche des racines

Représentation de « l’inconnue »

Dans \(A[X]\), tout élément de \(A\) peut se représenter comme le polynôme \((a,0,\ldots)\) : on dit qu’on a « plongé » \(A\) dans \(A[X]\). Ceci correspond au fait qu’on peut représenter, par exemple, tout nombre réel \(a\), comme une expression polynomiale « constante » dont la valeur est \(a\). Dans une expression polynomiale, la « variable », \(x\) par exemple, est souvent appelée une « inconnue », ce qui signifie que sa valeur n’est pas connue ou fixée. La théorie des polynômes permet également de représenter cette inconnue \(x\) comme un polynôme particulier, qu’on appelle indéterminée, et qu’on note \(X\). On doit donc distinguer entre l’inconnue – qui est un objet linguistique – et l’indéterminée – qui est un objet mathématique.

Pour représenter l’inconnue \(x\) comme un polynôme, il suffit de la considérer comme une expression polynomiale, soit \(1.x + 0\), autrement dit de la représenter par le polynôme \(X=(0,1,0,\ldots)\). En utilisant les règles du produit de convolution, on voit alors que les puissances de \(X\) sont représentées par des suites où \(1\) n’apparaît qu’une fois, à la position correspondant à la puissance considérée ! Par exemple, \(X^2=(0,0,1,0,\ldots)\) (le \(1\) apparaît en position \(2\), puisqu’on commence à l’indice \(0\)…), et \(X^3=(0,0,0,1,0,\ldots)\), et ainsi de suite. Par convention, on a \(X^0=1\), soit le polynôme \(1,0,\ldots)\).

Grâce à cette représentation particulière de l’inconnue \(x\) des équations par l’indéterminée \(X\) des polynômes, il est alors possible de retrouver l’écriture originelle des expressions polynomiales. En effet, avec les définitions de l’addition et du produit de convolution des polynômes, un polynôme donné \(P=(a_0,a_1,\ldots,a_{n-1},a_n,0,\ldots)\) peut s’écrire sous la forme \(a_0+a_1X+\ldots+a_{n-1}X^{n-1}+a_nX^n\), puisqu’on peut additionner et multiplier les polynômes, et donc en particulier les éléments de \(A\) et les puissances de \(X\). Nous sommes, en quelque sorte, revenus à notre point de départ – les expressions polynomiales – mais cette fois-ci, nous manipulons un objet mathématique, auquel nous pouvons désormais appliquer la théorie mathématique elle-même !

Racines d’un polynôme et solutions d’une équation

Puisque nous avons remplacé les expressions polynomiales par des polynômes, résoudre une équation polynomiale consiste maintenant à trouver les « valeurs » pour lesquelles un polynôme donné \(P=a_0+a_1X+\ldots+a_{n-1}X^{n-1}+a_n X^n\) est nul. Pour cela, nous devons définir rigoureusement ce qu’est la valeur ou l’évaluation, que l’on note \(P(b)\), d’un tel polynôme \(P\) en un élément \(b\) de l’anneau \(A\), où sont pris les coefficients \(a_0,a_1,\ldots,a_{n-1},a_n\). Ceci se fait en décrétant que \(P(b)=a_0+a_1\times b+a_2\times b^2+\ldots +a_{n-2}\times b^{n-2}+a_{n-1}\times b^{n-1}+a_n\times b^n\). Autrement dit, on « remplace » l’indéterminée \(X\), comme pour les expressions polynomiales, par la valeur \(b\) choisie. Pour être rigoureuse, cette définition doit être faite par récurrence sur le degré du polynôme.

Il pourrait sembler ici que nous n’avons rien gagné par rapport aux expressions polynomiales. Cependant, puisque les polynômes sont des objets mathématiques, en définissant ainsi l’évaluation d’un polynôme \(P\) en un élément \(b\) de \(A\) on définit une application (une fonction) \(e\) de \(A[X]\) dans \(A\), ce qui n’est bien sûr pas possible avec des « expressions » ! L’intérêt de cette fonction, est qu’elle est un « homomorphisme d’anneaux » (elle préserve l’addition et la multiplication, ce qui traduit que si \(Q\) est un autre polynôme, on a \((P+Q)(b)=P(b)+Q(b)\) et \((P.Q)(b)=P(b).Q(b)\)). On dispose alors désormais des ressources de la théorie algébrique des anneaux pour étudier les polynômes de \(A[X]\) et leurs racines.

Notons que, comme c’est souvent le cas lorsqu’on formalise les choses en mathématique, définir les polynômes comme objets mathématiques véritables se fait au prix d’un changement de point de vue. En effet, chercher les solutions d’une équation polynomiale \(a_nx^n+a_{n-1}x^{n-1}+\ldots +a_1x+a_0=0\) consiste à s’interroger sur les différentes valeurs de l’inconnue \(x\) pour lesquelles cette équation, « fixée », est vérifiée. Par contraste, travailler avec l’évaluation des polynômes consiste à fixer une valeur \(b\) de l’indéterminée \(X\) et à étudier les valeurs de tous les polynômes \(P\) en \(b\), pour identifier celles pour lesquelles \(P(b)=0\) !