Contributeurs: Arthur Escalas, Lou, R3d d33r, Vincent Bonhomme
De la forme au nombre
De la forme au nombre
par Vincent BonhommePublié le 14 janvier 2016
Avec la participation de :
Arthur Escalas, Lou, R3d d33r, Vincent Bonhomme
Pourquoi les objets qui nous entourent, biologiques ou non, ont-ils la forme qu'ils ont ?
Le lien - s'il existe - entre la forme et la fonction des objets est l'une des plus anciennes des questions scientifique, philosophique et même artistique [1]. Elle a toujours puissamment inspiré la pensée et porté les questionnements ; citons par exemple :
- Platon avec « Que nul n'entre ici s'il n'est géomètre » inscrit, selon la légende, à l’entrée de l’Académie ;
- de Vinci, dont l'ensemble de l’œuvre témoigne d'une obsession des proportions, des formes et de leurs fonctions ;
- Goethe, qui en plus de sa production littéraire esquisse la botanique moderne en reliant, au moins philosophiquement, morphologie et diversité ;
- D'Arcy Thompson, une super star de la biologie qui redonne au développement sa toute puissance créatrice et unificatrice de la diversité morphologique.
La forme, kézaco ?
Reconnaître les formes est l'une des premières tâches cognitives vraiment complexe que réalise notre cerveau de nourrisson [2][3]. La courbure du visage, de la bouche et des sourcils, la position relative des yeux et du nez, l'ovale du visage, etc. autant de signatures qui, combinées, deviennent des identifiants uniques de nos parents. Maman ne ressemble ni à tata, ni à papi.
Alors pourquoi diable étudier quelque chose d'aussi trivial que la forme ? Nous savons toutes et tous ce qu'est la forme ! Non ? La forme est comme la qualité [4] : nous en avons une idée très précise tant que nous n'avons pas à la définir.
L'idéal serait une définition mathématique, qui puisse s'abstraire des particularités au profit de l'universalité, ou du moins d'un cadre un peu générique. Ainsi, nous pourrions, avec les mêmes outils, la même formalisation, décrire des feuilles, des cœurs, des chats, des bouteilles de bière, etc.
À défaut d'être mathématique, voici une définition simple et - donc ! - élégante : "la forme est l'information invariante à la translation, la rotation et à la déformation isotrope"[5][6][7]. Autrement dit, comme l'illustrent les petits cœurs de la figure, si vous dessinez un cœur (en blanc), et que vous le déplacez (translation) et/ou le tournez (rotation) et/ou l'agrandissez ou le rapetissez de façon homogène (déformation dite isotrope ou encore homothétique), et bien vous avez, en termes de forme mathématique, le même cœur.
Les mathématiques de la forme sont regroupées dans la branche de la morphométrie, dont l'objet est, comme son nom l'indique, de mesurer la forme, et de décrire statistiquement sa variation conjointe avec d'autres facteurs[8]. En d'autres termes, passer de la forme au nombre, puis de laisser les statisticiens s'en amuser et leur demander d'expliquer ces nombres avec d'autres nombres. Par exemple, on pourra se demander pourquoi et comment les feuilles d'une espèce d'arbre sont différentes d'un environnement A à un environnement B, si ces changements s'opèrent de façon conjointe à d'autres changements, eux-mêmes morphologiques ou non. Tel est l'objet de la morphométrie.
Décrire la forme avec des mots
Naturellement, l'être humain utilise des mots pour décrire la forme. Dénichons par exemple un glossaire de botanique[9] et plongeons dans l’œuvre de ces tendres maniaques du rangement, de la poésie et des langues mortes. Les fesses dans une prairie fleurie par un après-midi de juin, paisiblement installés, ouvrons ce glossaire.
Enfer et damnation ! Qui pourrait me donner une définition opérationnelle, aux frontières nettes, à bipennatiséqué, à hypocratériforme ou bien à palmatipartite ? Quelques sessions de botanique pourraient résoudre le problème mais comment pourrait-on expliquer la forme en termes plus abstraits, par exemple à un extra-terrestre, un-e mathématicien-ne, un ordinateur ou un-e anthophobe ?
Plutôt qu’une description littérale (avec des mots), forcément subjective (qui dépend de l'observateur), peu générique (qui dépend de la forme décrite) et réfractaire aux statistiques (qu'on ne puisse discipliner dans un tableur), la morphométrie elle, permet une description sans a priori, générique et qui convertit la forme en nombres. Aux yeux du morphométricien comme du statisticien, les mots, fussent-ils beaux, ne valent pas une bonne vieille variable quantitative comme un tour de hanche ou une masse corporelle.
Mais la question de départ : « comment convertir la forme en nombres ?» reste, pour l'instant, sans réponse. Il existe pléthores d'approches, de la reconnaissance faciale, à la reconstitution 3D de la canopée des forêts, que nous ne détaillerons pas. Nous allons choisir l'angle des principales approches utilisées en biologie, pour finalement citer quelques exemples pratiques en conclusion. Et par bonheur, l'approche chronologique est adaptée à ce survol des techniques morphométriques.
Décrire la forme avec des longueurs
La première approche, la plus naturelle, est de sortir la règle pour décrire la forme. Prenons un oiseau : nous pouvons mesurer ses pattes, son bec, sa tête, ses ailes, etc. Si nous avons plusieurs oiseaux, en répétant l'opération, nous obtenons, pour chaque individu et chaque variable, une mesure. On peut ensuite calculer certains ratios, par exemple la longueur du bec par rapport à la longueur du crâne, bref un tableau de données composé d'un faisceau de variables quantitatives pour chaque individu, puis le traiter dans le cadre multivarié classique.
C'est ce qu'a fait Sir Ronald Fisher sur le jeu de données iris[10][11], très célèbre en statistiques, car il illustre généralement l'analyse discriminante linéaire (ou Linear Discriminant Analysis en bon anglais) et a en réalité présidé au développement de cette approche, et non l'inverse. L'idée est assez simple et se formule comme suit : « à partir de la mesure de quelques longueurs sur trois variétés d'iris, puis-je ensuite trouver une combinaison de ces longueurs (un peu de longueur de pétale, un peu moins de largeur de sépale, etc.) qui puisse me permettre de discriminer - au sens séparer - au mieux mes variétés » ? Puis-je ensuite utiliser cette combinaison pour déterminer la variété de nouveaux individus ? Si, mon analyse discriminante est satisfaisante, c'est à dire que l'on peut trouver une combinaison de nos variables qui sépare bien les groupes, alors je dispose d'un outil pour identifier chaque espèce d'iris.
Avec une règle, je peux donc déjà faire pas mal de choses, même si les mesures prises sur un oiseau ne marcheront pas sur une amphore ou un cocotier : nous ne capturons que les éléments de la forme qui nous paraissent essentiels, certes généralement à raison, mais sur un modèle bien particulier.
Décrire la forme des objets avec des points remarquables
L'approche par longueurs est aujourd'hui qualifiée - de façon assez arrogante quoique basée sur la chronologie - de « morphométrie traditionnelle » et on l'oppose à la « morphométrie moderne » qui englobe toutes les approches qui lui ont succédé. Ces approches modernes ont en commun, outre d'être plus récentes, de capturer les angles plutôt que les longueurs et généralement de préserver la forme dans la description. Avec des mesures faites à la règle, on peut obtenir des formes très différentes qui satisfont la même combinaison de mesures. Bref, à partir des mesures, impossible de reconstituer sans ambiguïté la forme de départ. Ce n'est pas le cas de la morphométrie moderne qui retient la géométrie. Notons que ces méthodes facilitent également la prise en compte ou non de la taille. La langue anglaise distingue la forme pure (shape) de la forme et de la taille de façon conjointe (form) et on peut écrire : form = size + shape.
La plupart des objets présentent des points homologues, c'est à dire des points situés à des endroits similaire entre les individus et dont la signification développementale est raisonnablement claire. Si l'on traduit cela avec l'exemple des oiseaux, ils possèdent tous, d'une part, un bec, une aile gauche, une aile droite, une queue et d'autre part, ces organes s'ancrent toujours au même endroit du corps.
Plutôt que de se servir de ces points pour positionner la règle et prendre des mesures, on peut projeter - par l'esprit - l'oiseau dans un repère (poser l'oiseau sur un cahier à petits carreaux ou un plan euclidien fera l'affaire) et mesurer les coordonnées x, y du bec, des ailes, etc. Ce sont ces coordonnées dans l'espace et leurs positions des uns par rapport aux autres que l'on utilise. Alors qu'avec nos longueurs, nous étions incapables de reconstruire l'oiseau moyen puisque nous ne savions pas précisément où ces mesures avaient été faites mais seulement entre quoi et quoi, ici nous en sommes capables, la géométrie est donc conservée.
Un problème intermédiaire, qui se trouve être au cœur de la méthode d'analyse est que ces coordonnées entres elles, c'est à dire pour les différents objets qui nous intéressent, peuvent être différentes. Ainsi les cœurs bleus ont la même forme pour peu que l'on supprime les différences de position, de taille et de rotation. Il nous faut donc d'abord supprimer ces différences pour ne comparer que la forme.
C'est à ce moment qu'intervient les méthodes Procrustes, dont le nom dérive d'un brigand de la mythologie grecque. Selon la légende, il offrait aux voyageurs l'hospitalité et leur proposait de se reposer dans un lit. Sitôt endormi, le voyageur fatigué se voyait attacher au lit par Procrustes. À ce moment deux solutions : si les jambes était trop courtes pour remplir le lit, Procrustes sortait un marteau et tapait sur les jambes pour les allonger ; si les jambes était trop longues, il sortait plutôt sa hache. Il n'arrêtait sa brutale besogne que lorsque la longueur des jambes était adaptée à la forme du lit. Aujourd'hui, le nom de Procrustes est associé au conformisme et/ou à des pratiques sexuelles exotiques, sauf pour les morphométriciens qui le connaissent surtout par le nom de baptême d'une méthode couramment utilisée : la superposition Procrustes.
Voilà son principe : une fois que l'on a supprimé les différences de position, de rotation et de dilatation homogène, les différences qui demeurent entre individus sont des différences de forme pure. On peut donc les analyser directement et faire de la morphométrie sur des objets présentant des points homologues.
Décrire la forme des contours
Parfois, nous sommes intéressés par des objets qui n'ont pas de points homologues, trop peu, ou bien peu fiables, c'est à dire susceptibles d'être absents, varier en termes de localisation, etc. Heureusement, nous disposons d'une autre grande famille d'analyses morphométriques : l'analyse de contours.
Nous commencerons avec les contours fermés, par exemple une bouteille de vin vue de profil. Sur ces bouteilles, qui présentent une forte symétrie bilatérale (la gauche est un miroir parfait de la droite), peu de points homologues. L'analyse de contours vise à utiliser l'intégralité du contour, que l'on peut décrire par une série de points successifs, et leurs coordonnées x, y. La clé de ces méthodes est de décrire, de résumer, plus ou moins finement, la forme de ce contour. Si l'on cherche du côté des mathématiques, les méthodes de description de courbes sont nombreuses et l'une des plus utilisées sont les transformées de Fourier [12]. Nous allons d'abord faire un détour par les transformées de Fourier pour mieux revenir à la description de la forme.
Joseph Fourier a eu une vie bien remplie : bourguignon, mathématicien, professeur à l'âge de 16 ans (!), découvreur de l'effet de serre, a aussi "inventé" la transformation de Fourier (le hasard fait bien les choses). L'idée est de décomposer une courbe potentiellement très complexe et périodique (qui se répète dans le temps ou selon une autre dimension) en une somme de courbes plus simples, régulières, en l'occurrence des fonctions trigonométriques. Si « trigonométrique » vous rappelle à des souvenirs tortueux sur les bancs du collège, on peut ici avantageusement remplacer « fonctions trigonométriques » par « jolies courbes oscillantes ».
Toute courbe périodique peut être décrite, plus ou moins finement, par une somme de fonctions trigonométriques, oscillant plus ou moins vite. La première va avoir la même période que la fonction de départ (Période/1) : si la courbe que l'on cherche à décrire recommence son motif au bout de 24 secondes ou 1 an, on cherche l'oscillation complète sur 24 secondes ou 1 an, qui colle au mieux à la courbe[13]. Bien sûr, c'est grossier, mais avec seulement deux paramètres associés à cette première oscillation (l'amplitude et la phase) on a résumé, compressé, notre courbe de départ.
On peut faire mieux et chercher à ajuster une oscillation parcourant la courbe complexe deux fois, soit en 12 secondes ou 6 mois (Période/2). Quand cette deuxième oscillation aura fait ses deux motifs, la courbe de départ aura tout juste fini son premier motif. On obtient deux autre paramètres, et si on additionne ces deux courbes, appelées harmoniques (les musiciens apprécieront). On continue ad lib à rajouter des harmoniques (Période/3, Période/4, etc.) jusqu'à ce que le compromis entre compacité (le nombre d'harmoniques et donc de paramètres utilisés) et la fidélité de l'approximation de la courbe de départ soit satisfaisant.
On a donc d'une part des formes sans points homologues mais avec des contours exploitables, et d'autre part une méthode pour décrire des courbes périodiques avec les transformées de Fourier. En d'autres termes, si on pouvait traduire un contour en une courbe périodique, on pourrait le décrire avec notre ami Fourier ! C'est assez simple mais prenons un contour de chat pour fixer les idées.
Si on met un crayon sur le nez du chat et que l'on parcourt ce contour, on repassera sur le nez du chat, on a donc quelque chose de périodique qui commence à intéresser Fourier, occupé à tiser du côte de Nuits. Mieux, si on note, séparément, la différence sur l'axe des abscisses (à l'horizontale) et des ordonnées (à la verticale) entre chacun des points et le premier (le nez), on obtient deux courbes périodiques, une pour les x et l'autre pour les y qui traduisent parfaitement la géométrie de mon chat et qui conviennent fabuleusement à Fourier qui quitte le bar.
On calcule les transformées de Fourier sur chacune des formes à analyser et les paramètres de chacune des fonctions périodiques peuvent être considérées comme des variables quantitatives. Ces variables quantitatives, un peu comme le tour de poitrine, de taille, de hanches, la masse, etc. font ensuite le bonheur des statisticien-ne-s. Nous sommes passés de la forme au nombre, bref, nous avons fait de la morphométrie.
Décrire la forme des courbes ouvertes
Et si les formes qui nous intéressent ne présentent pas de points homologues et ne sont pas non plus des contours fermés ? Pour étudier par exemple le ventre de dames enceintes photographiées entre la poitrine et le pubis, des nez vus de profil ou des becs, etc. on utilise une variante des analyses de contours : l'analyse de contours ouverts, ou plus simplement l'analyse de courbes.
Plusieurs stratégies existent. D'abord une variante des transformées de Fourier permet de décrire des courbes ouvertes[14] mais nous n'allons pas en parler. Ensuite, les courbes de Bézier, un autre français, celles que vous pourriez connaitre si vous faites de la retouche photo ou de l'infographie, permettent également de décrire des courbes ouvertes, mais nous n'en parlerons pas non plus.
Pour les courbes simples, c'est à dire qui ne « reviennent » pas sur elles-mêmes, on peut simplement ajuster un polynôme d'un degré choisi (encore un compromis entre compacité et fidélité de reconstruction). Par exemple, pour un polynôme de degré 3, on ajuste une fonction de la forme , autrement dit , sur nos coordonnées et on peut utiliser les quatre coefficients () comme autant de variables quantitatives. Ces polynômes dits « naturels » sont avantageusement remplacés par des polynômes de Legendre, aussi appelés polynômes orthogonaux, mais l'idée reste la même : passer de la forme au nombre.
À quoi sert tout ce bazar morphométrique ?
Décrire la forme ? À quoi ça sert ? Mais à tout mon bon monsieur, ma bonne dame ! Dans quantité de domaines, et en premier lieu en biologie, la description de la forme est essentielle à sa compréhension, voire sa modélisation.
Si on se cantonne aux disciplines du vivant, la morphologie, par ses approches descriptive et comparative, a notamment contribué aux premières classifications systématiques, à la naissance de la biologie du développement, à l'essor de la biologie des populations, de l'écologie fonctionnelle et de la paléontologie, puis à les réunir dans le cadre conceptuel plus large de l'écologie évolutive.
La forme des organismes et des organes est à la fois un trait particulièrement intégré et directement observable. La forme des objets biologiques est le résultat d'interactions à la fois multi-échelles et hiérarchisées : contraintes biophysiques, héritage phylogénétique et architecture génomique, traits d'histoires de vie, plasticité phénotypique, structure populationnelle, conditions environnementales, etc.
On peut également utiliser la description de la forme dans nombre d'autres domaines : en archéologie, en géographie, etc. partout où l'objet d'étude présente une forme qui peut être intéressante à étudier, comprendre, décrire, seule ou en fonction d'autres variables.
Prenons un exemple plus précis.
La forme est une signature du développement, c'est à dire le passage, modulé par l'environnement, du génotype au phénotype, mais aussi des processus micro et macroévolutifs aboutissant aux diversités morphologiques, observées sur les populations actuelles comme dans le registre fossile. On fait le pari que décrire finement la forme permettrait de comprendre, au moins partiellement, tous les mécanismes sous-jacents intimement encastrés et résultant dans les formes observées. Du coup, la morphométrie excite (ou est susceptible d'exciter) des biologistes des populations à ceux du développement des plantes et des animaux, en passant par les archéologues puisque leurs fossiles sont parfois exploitables. Tel est le sort de l'archéobotanique qui désigne non pas le corpus des très vieux botanistes mais la botanique sur des plantes très vieilles. Chez ces plantes, ou ce qu'il en reste, souvent les parties dures comme les fruits, la forme est à peu près la seule donnée exploitable. Même les experts de l'ADN ancien restent parfois la micropipette en bandoulière, bredouilles. Puis pas question de broyer ce matériel souvent rare et fragile pour tenter deux-trois trucs de biologie moléculaire.
La forme est donc non seulement précieuse mais peut aussi se révéler utile pour comprendre des processus à large échelle spatiale et temporelle comme la domestication des plantes. La lectrice et le lecteur passionné de pique-nique pourra consulter avec bonheur ce qu'on arrive avec la seule forme à comprendre l'histoire récente d'espèces aussi centrales à notre bonheur que l'olive[15], les céréales[16], la vigne[17], et j'en passe.
D'une façon générale, la morphométrie permet de passer de la forme au nombre, et donc d'obtenir à partir d'une forme plusieurs (éventuellement dizaines) variables quantitatives . Et avec des variables quantitatives on peut faire tout un tas de statistiques multivariées, comme par exemple : explorer la diversité globale, tester des différences entre groupes, construire un arbre de distance, etc.
Pour donner un autre exemple non seulement concret mais crucial, on peut par exemple se demander si (la réponse est oui), comment, et pourquoi les bouteilles de bière et de whisky ont une forme différente[18]. Les exemples graphiques ci-dessous illustrent ce qu'on peut faire avec des bouteilles mais l'imagination fertile de la lectrice et du lecteur extrapolera à d'autres cas plus bankables.
Références
- ↑ Bonhomme, V., Picq, S., Gaucherel, C., & Claude, J. (2014). Momocs: Outline Analysis Using R. Journal of Statistical Software, 56(13). [1]
- ↑ Bushneil, I. W. R., Sai, F., & Mullin, J. T. (1989). Neonatal recognition of the mother’s face. British Journal of Developmental Psychology, 7(1), 3–15. doi:10.1111/j.2044-835X.1989.tb00784.x
- ↑ Johnson, M. H., Dziurawiec, S., Ellis, H., & Morton, J. (1991). Newborns’ preferential tracking of face-like stimuli and its subsequent decline. Cognition, 40(1-2), 1–19. doi:10.1016/0010-0277(91)90045-6
- ↑ Pirsig, R. M. (1974). Zen and the Art of motorcycle maintenance (p. 418). William Morrow & Company.
- ↑ Pour les anglophones, c'est plus joli en anglais : the total of all information invariant under translations, rotations, and isotropic rescaling
- ↑ Small, C. G. (1996). The statistical theory of shape (p. 254). Springer Verlag.
- ↑ Kendall, D. (1989). A survey of the statistical theory of shape. Statistical Science, 4(2), 81–120.
- ↑ Rohlf, F., & Bookstein, F. (1990). Proceedings of the Michigan morphometrics workshop (Blue Book).
- ↑ pour un aperçu, on peut aller chez Tela-Botanica consulter le Glossaire de botanique de Thebault, L.
- ↑ http://stat.ethz.ch/R-manual/R-devel/library/datasets/html/iris.html
- ↑ https://en.wikipedia.org/wiki/Iris_flower_data_set
- ↑ http://fr.wikipedia.org/wiki/Transformation_de_Fourier
- ↑ Au sens des moindres carrés
- ↑ Dommergues, C. H., Dommergues, J.-L., & Verrecchia, E. P. (2007). The Discrete Cosine Transform, a Fourier-related Method for Morphometric Analysis of Open Contours. Mathematical Geology, 39(8), 749-763.
- ↑ Terral, J.J.-F., Alonso, N., Chatti, N., Capdevila, R.B. i, Fabre, L., Fiorentino, G., Marinval, P., Jordá, G.P., Pradat, B., Rovira, N., Alibert, P., 2004. Historical biogeography of olive domestication (Olea europaea L.) as revealed by geometrical morphometry applied to biological and archaeological material. Journal of Biogeography 31, 63–77. doi:10.1046/j.0305-0270.2003.01019.x
- ↑ Bonhomme V, Forster E, Wallace M, Stillman E, Charles M, Jones G. 2015. The first shoots of a modern morphometrics approach to the origins of agriculture. Web Ecology.
- ↑ Terral, J.-F.F., Tabard, E., Bouby, L., Ivorra, S., Pastor, T., Figueiral, I., Picq, S., Chevance, J.-B.B., Jung, C., Fabre, L., Tardy, C., Compan, M., Bacilieri, R., Lacombe, T., This, P., 2010. Evolution and history of grapevine (Vitis vinifera) under domestication: new morphometric perspectives to understand seed domestication syndrome and reveal origins of ancient European cultivars. Annals of Botany 105, 443–455. doi:10.1093/aob/mcp298
- ↑ Et, oui, une question aussi cavalière est publiable. L'abus d'alcool n'en demeure pas moins déconseillé pour la santé.
Note
Pour celles et ceux qui voudraient faire de la morphométrie, les graphes de cet article ont été crées avec mon package R Momocs.