Géométrie affine du plan [C1.IV.2]
La géométrie du plan a été axiomatisée par Euclide d’Alexandrie dès l’Antiquité dans ses « Eléments », où l’on trouve en effet la première approche axiomatique connue sur le sujet, qui déduit de nombreux théorèmes d’un petit nombres de principes intuitifs admis sans démonstration, appelés » postulats » et » axiomes ». On appelle une telle approche « synthétique », puisqu’on construit la substance mathématique à partir d’une création axiomatique qui capture ou « synthétise » des intuitions fondamentales. Nous avons adopté une telle approche jusqu’ici pour définir et décrire les ensembles de nombres $\mathbb N$, $\mathbb Q$ et $\mathbb R$. Dans ce chapitre nous posons les fondements de la géométrie plane, et nous introduisons les concepts de base de l’algèbre linéaire et de la géométrie affine, à partir d’une approche concrète qui prend le contrepied de l’approche synthétique et qu’on dit plutôt « analytique ». Il s’agit de définir le plan à partir d’autres objets mathématiques auxquels on le « réduit », plutôt que d’adopter une approche axiomatique. Ici, c’est grâce à des rudiments de théorie naïve des ensembles et à la description de l’ensemble $\mathbb R$ développée au chapitre précédent, que nous allons décrire le plan. Nous adoptons cette approche pour plusieurs raisons. D’une part, elle permet d’intégrer complètement la géométrie et la théorie des nombres, grâce aux notions de coordonnées introduites par Descartes. D’autre part, elle sert de modèle à la construction de la géométrie affine (basée sur les points) à partir de l’algèbre linéaire (basée sur les vecteurs). Ajoutons également que la géométrie euclidienne du plan était en fait insuffisamment axiomatisée : il manquait aux axiomes d’Euclide des axiomes, implicites dans ses démonstrations, à propos des angles; ce défaut a été corrigé par le mathématicien David Hilbert dès la fin du 19ième siècle, mais le résultat est moins économique et satisfaisant, et il nous semble que la théorie des angles se comprend mieux en première approche d’un point de vue analytique. Par ailleurs, ce point de vue permet d’accéder directement aux mesures des longueurs, ce qui est bien commode, notamment pour la trigonométrie. Nous retrouverons alors les axiomes et théorèmes antiques de la géométrie euclidienne synthétique sous la forme de théorèmes ou de définitions de la géométrie analytique du plan. Dans ce chapitre, nous introduisons d’abord la géométrie affine du plan, c’est-à-dire ici de l’ensemble $\mathbb R^2$ des couples de nombres réels. Les propriétés dites affines sont celles qui sont associées au parallélisme, et ne dépendent donc essentiellement que de la possibilité d’inverser les nombres réels non nuls. Il s’agit donc d’une première approche des relations élémentaires entre arithmétique et géométrie, déjà esquissée à propos des rapports entre division euclidienne et partie entière rationnelle d’une part, entre primalité relative et commensurabilité d’autre part. Nous n’entrerons pleinement dans la géométrie euclidienne que dans le chapitre suivant, à partir des notions d’orthogonalité et de distance.
1.Droites dans le plan euclidien
1.1.Sous-corps de $\mathbb{R}$
Les « systèmes de nombres » à partir desquels nous pouvons faire de la géométrie cartésienne (c’est-à-dire, avec des coordonnées) sont des sous-ensembles $S$ de $\mathbb R$ qui contiennent l’ensemble $\mathbb Q$, autrement dit tels que $\mathbb Q\subseteq S\subseteq \mathbb R$. Par souci de simplicité, après cette section nous travaillerons toujours à partir des nombres réels, c’est-à-dire avec $S=\mathbb R$, mais il est important se souligner que cela n’est pas nécessaire, et que la géométrie euclidienne du plan est avant tout une question d’algèbre (théorie des équations) – plutôt que d’analyse (théorie des fonctions). Pour des raisons arithmétiques et géométriques, on demande pour l’instant à ces systèmes d’être « fermés » pour les opérations usuelles : addition, soustraction, multiplication, division. Ils répondent à la définition suivante :
Définition 1.1
Un sous-corps de $\mathbb R$ est un sous-ensemble $K$ de $\mathbb R$ tel que :
i) $0,1\in K$
ii) Pour tous $x,y\in K$, on a $x+y\in K$, $-x\in K$, $x.y\in K$ et $1/x\in K$ si $x\neq 0$. On note $K^*$ l’ensemble des éléments non nuls de $K$.
Remarque 1.2
i) Un sous-corps de $\mathbb R$ est un cas particulier de ce qu’on appelle un corps. Il n’est toutefois pas nécessaire de définir ici cette notion générale, tout comme il n’était pas nécessaire de définir ce qu’est un groupe pour définir un sous-groupe (additif) de $\mathbb R$ dans la section [La droite réelle :: Sous-groupes additifs de $\mathbb R$]. Nous aborderons ces notions au début du semestre II.
ii) Un sous-corps de $\mathbb R$ est exactement un sous-groupe de $\mathbb R$ (ibid., définition 3.39), contenant $1$, et stable par divisions, c’est-à-dire tel que si $x,y\in K$ avec $y\neq 0$, on a $x/y=x.(1/y)\in K^*$. En effet, la multiplication $x\times y$ de $x,y\in K$ vaut $0$ si $y=0$, et vaut $x/(1/y)$ si $y\neq 0$.
L’intérêt de considérer des sous-corps de $\mathbb R$ qui ne sont pas tout l’ensemble $\mathbb R$, est que la réalisation de certaines constructions géométriques ne fait usage que d’un nombre limité de nombres réels, qu’on peut tous enfermer dans un tel sous-corps (c’est le cas par exemple des constructions dites à la règle et au compas). Les sous-corps réels différents de $\mathbb R$ et de $\mathbb Q$ les plus simples sont ce qu’on appelle des « extensions quadratiques réelles », dont le modèle est donné dans l’exemple suivant.
Exemple 1.3
L’ensemble des nombres réels de la forme $r+s\sqrt 2$, où $r,s\in\mathbb Q$, est un sous-corps de $\mathbb R$, noté $\mathbb Q(\sqrt 2)$. En effet, on a $0=0+0\sqrt 2$ et $1=1+0\sqrt 2$, donc $0,1\in \mathbb Q(\sqrt 2),$ et si $x=r+s\sqrt 2$ et $y=t+u\sqrt 2$ sont des éléments de $\mathbb Q(\sqrt 2),$ on a $r,s,t,u\in \mathbb Q,$ d’où $-x=-r-s\sqrt 2\in \mathbb Q(\sqrt 2),$ $x+y=(r+t)+(s+u)\sqrt 2\in \mathbb Q(\sqrt 2),$ $x.y=(r+s\sqrt 2).(t+u\sqrt 2)=(rt+2su)+(ry+st)\sqrt 2\in \mathbb Q(\sqrt 2)$. En ce qui concerne l’inversion, supposons que $x=r+s\sqrt 2\neq 0$ : si $s=0$, alors $x=r$ et évidemment $1/x=1/r\in \mathbb Q(\sqrt 2);$ tandis que si $s\neq 0$, on a $r-s\sqrt 2\neq 0$ (sinon $r/s=\sqrt 2\in \mathbb Q,$ ce qui contredit l’irrationalité de $\sqrt 2$ (voir [Arithmétique des nombres rationnels, Proposition 4.9]), et par intégrité (La droite réelle, Lemme 1.20) on a $r^2-2s^2=(r+2\sqrt s).(r-2\sqrt s)\neq 0$ (puisque $r+\sqrt 2\neq 0$ par le même argument), si bien qu’on peut écrire $1/(r+s\sqrt 2)=(r-s\sqrt 2)/(r^2-2s^2)=(r/(r^2-2s^2))+((-s)/(r^2-2s^2)).\sqrt 2,$ ce qui est bien par définition un élément de $\mathbb Q(\sqrt 2)$, lequel est donc un sous-corps de $\mathbb R$.
La définition d’un sous-corps enveloppe en fait la propriété suivante :
Proposition 1.4
Si $K$ est un sous-corps de $\mathbb R$, alors on a $\mathbb Q\subseteq K$.
Démonstration
Par récurrence sur $n\in\mathbb N$, on démontre facilement que $n\in K$ pour tout $n\in\mathbb N$, si bien que $\mathbb N\subseteq K$. Comme $0\in K$, par définition pour tout $n\in\mathbb N$ on a $-n=0-n\in K$, donc $\mathbb Z\subseteq K$. Si $r\in\mathbb Q$, on peut écrire $r$ sous la forme d’un quotient $a/b$, avec $a,b\in \mathbb Z$ et $b\neq 0$ : par définition aussi, comme $a,b\in K$ on a bien $r=a/b\in K$, donc finalement $\mathbb Q\subseteq K$. $\square$
Les sous-corps de $\mathbb R$ sont donc des « extensions » de l’ensemble $\mathbb Q$ des nombres rationnels par certains nombres réels, par exemple la mesure de la distance entre deux points, qu’on calcule grâce à des racines carrées de quantité exprimées à partir de leurs coordonnées, comme nous le verrons dans la suite.
Dans toute la suite du chapitre, nous ne travaillerons qu’à partir de l’ensemble $\mathbb R$ des nombres réels. Le lecteur/la lectrice courageux(se) pourra essayer de remplacer partout $\mathbb R$ par un sous-corps $K$ de $\mathbb R$ et vérifier que les énoncés géométriques sont toujours valables, à ceci près que le calcul des distances entres deux points à coordonnées dans $K$ ne fournira pas toujours un résultat dans $K$, bien que leurs carrés seront toujours des éléments de $K$.
1.2.Points et vecteurs
Désolé, vous n'avez pas accès à tout MATHESIS::Essentiel sans abonnement. Pour vous abonner, rendez-vous sur MATHESIS - Adhésion
2.Description analytique des droites du plan
2.1.Equation cartésienne d’une droite
Dans l’exercice 1.27(v), nous proposons une démonstration du fait suivant : si $a,b,c\in\mathbb R$ et ($a\neq 0$ ou $b\neq 0$), alors l’ensemble $D=\{(x,y)\in \mathbb R^2 : ax+by+c=0\}$ est une droite affine. C’est en effet vrai de toute droite affine du plan, autrement dit les droites du plan sont exactement tous les ensembles de solutions de telles équations, dites cartésiennes.
Ces équations apparaissent naturellement de la manière suivante : on suppose que $D$ est une droite du plan euclidien $\mathbb R^2$ et $M=(a,b)$ et $N=(c,d)$ deux points distincts de $D$, de sorte qu’on a soit $a\neq c$, soit $b\neq d$. On peut alors donner à partir de $M$ et $N$ une équation cartésienne de $D$, c’est-à-dire une équation de la forme $\alpha x+\beta y+\gamma=0$, dont $D$ est l’ensemble des solutions, de la manière suivante, en supposant par exemple que $c\neq a$.
1) Si $P=(x,y)\in D$, par la définition 1.10 il existe $\lambda\in \mathbb R$ tel que $(x-a,y-b)=\vec{MP}=\lambda \vec{MN}=\lambda (c-a,d-b)$, c’est-à-dire $x=\lambda c+(1-\lambda) a$ et $y=\lambda d+(1-\lambda) b$. Distinguons deux cas, selon que $P\neq M$ ou $P=M$.
i) Supposons que $P\neq M$ : on a $x-a\neq 0$ (sinon, en substituant $a$ à $x$ on a $\lambda c=\lambda a$, d’où $\lambda =0$ par la proposition 1.6(iv), puisque $a\neq c$, et donc $y=b$, c’est-à-dire $P=M$); on a donc $\lambda\neq 0$ et $\dfrac{y-b}{x-a}=\dfrac{\lambda d-\lambda b}{\lambda c-\lambda a}=\dfrac{d-b}{c-a}$. En multipliant par $(x-a)(c-a)$, $P$ vérifie alors l’équation $(y-b)(c-a)=(x-a)(d-b),$ ou en développant l’équation $E: (b-d)x+(c-a)y+(ad-bc)=0$ : en posant $\alpha=b-d$, $\beta=c-a$ et $\gamma=ad-bc$, l’équation $E$ est de la forme souhaitée.
ii) Supposons que $P=M$ : on a alors $(b-d)x+(c-a)y+(ad-bc)=(b-d)a+(c-a)b+(ad-bc)=ab-ad+bc-ab+ad-bc=0,$ donc dans ce cas aussi $P$ vérifie l’équation $E$.
2) Réciproquement, supposons que $P=(x,y)$ soit une solution de $E$ : on a $(y-b)(c-a)=(x-a)(d-b)$, et on distingue à nouveau deux cas.
i) Si $b\neq d$, on peut poser $\lambda:=\dfrac{y-b}{d-b}=\dfrac{x-a}{c-a}$, d’où $x-a=\lambda(c-a)$ et $(y-b)=\lambda(d-b)$, donc $\vec{MP}=\lambda \vec{MN}$ et $P\in D$ (C1.IV.3, définition 3).
ii) Si $b=d$, alors on a $(y-b)(c-a)=0$, d’où $y-b=0$ puisque $c\neq a$, et en posant $\lambda=\dfrac{x-a}{c-a}$, à nouveau on a $(x-a)=\lambda(c-a)$ et $(y-b)=\lambda (d-b)$, donc $P\in D$.
Un raisonnement parfaitement analogue s’applique lorsque $c=a$ (et donc $d\neq b$), et on obtient la même équation $E$ pour la droite $D$ (voir l’exercice 2.7). Nous résumons l’étude précédente dans l’énoncé suivant :
Proposition 2.1
Si $D$ est une droite du plan et $M=(a,b)$ et $N=(c,d)$ sont deux points distincts de $D$, alors $D$ est l’ensemble des solutions de l’équation $E:(b-d)x+(c-a)y+(ad-bc)=0$, et $D$ est une droite vectorielle si et seulement si $ad-bc=0$.
Démonstration
La première partie a été démontrée dans le paragraphe précédent dans le cas où $c\neq a$, le cas $c=a$ étant renvoyé aux exercices. La droite $D$ est vectorielle si et seulement si $O=(0,0)\in D$, autrement dit si et seulement si $(0,0)$ est solution de $E$, ou encore $ad-bc=0$. $\square$
Remarquons que l’équation $E:(b-d)x+(c-a)y+(ad-bc)=0$ tirée de la droite $D$ dans la discussion précédente est non triviale, autrement dit on a $b-d\neq 0$ ou $c-a\neq 0$. On obtient finalement la description analytique complète des droites du plan :
Corollaire 2.2
i) Les droites du plan sont les ensembles de solutions d’équations cartésiennes non triviales (de la forme $ax+by+c=0$, avec $a\neq 0$ ou $b\neq 0$).
ii) Une droite est vectorielle si et seulement si elle possède une équation de la forme $ax+by=0$.
Démonstration
i) Si $a\neq 0$ ou $b\neq 0$, par l’exercice 1.27(v) l’ensemble $D=\{(x,y)\in \mathbb R^2 : ax+by+c=0\}$ est une droite affine. Réciproquement, par la proposition 2.1 toute droite affine est l’ensemble des solutions d’une équation de la forme $ax+by+c=0$, avec $a\neq 0$ ou $b\neq 0$.
ii) L’ensemble des solutions de $E:ax+by=0$ est une droite vectorielle puisqu’il contient $0$, et une droite vectorielle possède une équation de cette forme par la proposition 2.1 à nouveau. $\square$
Remarquons que si $D$ est une droite d’équation « $ax+by+c=0$ », cette équation n’est pas unique pour $D$ : pour chaque nombre réel $r\neq 0$, « $(ar).x+(br).y+cr=0$ » est aussi une équation pour $D$. Cependant, les coefficients de deux équations différentes pour $D$ sont toujours liés de cette façon par un facteur de proportionnalité non nul. Puisque les vecteurs directeurs de $D$ sont les éléments de $D_0$, ils sont tous de la forme suivante :
Proposition 2.3
Si $D$ est une droite d’équation $E:ax+by+c=0$, alors la direction $D_0$ de $D$ est la droite d’équation $E_0:ax+by=0$, et les vecteurs directeurs de $D$ sont tous les vecteurs de la forme $(-\lambda b,\lambda a)$, avec $\lambda\neq 0$.
Démonstration
Introduisons le vecteur $u=(-b,a)$, et distinguons d’abord deux cas, selon que $a\neq 0$ ou $b\neq 0$. Si $a\neq 0$, alors le point $M=(-c/a,0)$ est sur $D$ (en remplaçant $y$ par $0$ dans $E$), et le point $M+u:=N=(-b-c/a,a)$ aussi, puisque $a(-b-c/a)+b(a)+c=0$, donc le vecteur $u$ est un vecteur directeur de $D$. Si $b\neq 0$, en raisonnant de la même manière les points $M=(0,-c/b)$ et $M+u=N=(-b,a-c/b)$ sont sur $D$, et le vecteur $u$ est donc aussi sur $D_0$. Par la remarque 1.14, $D_0$ est donc l’ensemble des vecteurs de la forme $\lambda u=(-\lambda b,-\lambda a)$, pour $\lambda\in\mathbb R$. Or, tout tel vecteur vérifie évidemment l’équation $E_0$, tandis que toute solution $v=(x,y)$ de $E_0$ vérifie soit $x=(-b/a)y$, d’où $(x,y)=(y/a)(-b,a)=(y/a)u$ (si $a\neq 0$), soit $y=(-a/b)x$, d’où $(x,y)=(-x/b)(-b,a)=(-x/b)u$ (si $b\neq 0$) : dans les deux cas, on a $v\in D_0$. $\square$
La donnée d’un vecteur non nul ou d’une droite vectorielle étant équivalentes, nous pouvons réinterpréter le résultat précédent à partir du concept suivant, qui complète la définition 1.20 :
Définition 2.4
Si $u$ est un vecteur non nul, la droite vectorielle engendrée par $u$ (ou direction de $u$) est l’ensemble des vecteurs de la forme $\lambda.u$, pour $\lambda\in\mathbb R$.
La direction d’un vecteur non nul contient donc par définition tous les vecteurs qui lui sont proportionnels : il s’agit bien d’une droite vectorielle par la proposition 1.13.
Proposition 2.5
Soit $u=(a,b)$ un vecteur non nul du plan. La direction de $u$ est la droite vectorielle d’équation $-bx+ay=0$.
Démonstration
Soit $D$ la direction de $u$ : si $v=(r,s)\in D$, il existe $\lambda\in\mathbb R$ tel que $v=\lambda u=(\lambda a,\lambda b)$, si bien que $-br+as=-b(\lambda a)+a(\lambda b)=0$, donc $v$ vérifie l’équation $E:-bx+ay=0$. Réciproquement, si $v=(r,s)$ vérifie l’équation $E$, alors soit $a\neq 0$, auquel cas de $br=as$ on tire $(r,s)=(r/a)(a,b)=(r/a).u$, soit $b\neq 0$, auquel cas de $br=as$ on tire $(r,s)=(s/b)(a,b)=(s/b).u$, et dans les deux cas $v$ est dans la direction de $u$. Par conséquent, celle-ci est la droite vectorielle d’équation $E$. $\square$
2.1.1.Exercices de la section
Exercice 2.6
i) Soient $M=(a,b)$ et $N=(c,d)$ deux points distincts d’une droite affine $D$. En supposant que $a=c$, terminer la démonstration de la proposition 2.1 en montrant que $D$ est l’ensemble des points $(x,y)\in\mathbb R^2$ tels que $(b-d)x+(c-a)y+(ad-bc)=0$.
2.2.Colinéarité et déterminant
Désolé, vous n'avez pas accès à tout MATHESIS::Essentiel sans abonnement. Pour vous abonner, rendez-vous sur MATHESIS - Adhésion