Cline” ou pas “cline” ? Persistance des “races humaines” en sciences de la Vie

Article paru dans le n°2 de la revue L’Émancipation syndicale et pédagogique (octobre 2023) Partie 1

Alors que la seconde moitié du XXe siècle s’est évertuée à démontrer que dans le domaine de la biologie, les “races humaines” n’existaient pas, le séquençage des génomes humains, qui a débuté à l’aube du XIXe siècle, s’est accompagné de la résurgence de la notion de “races humaines”.

Fortement combattue au sein de la recherche scientifique, cette idée reste toutefois prégnante, véhiculée par certains chercheurs et par certaines représentations graphiques qui imprègnent les publics non avertis.

Des chercheurs courtisent les “races humaines”

En 2021, le généticien français Bertrand Jordan écrivait que les récentes analyses génomiques “nuança[ie]nt l’affirmation un peu simpliste selon laquelle « les races humaines n’existent pas »”. Il expliquait “Oui, une analyse sans a priori des ADN humains montre bel et bien l’existence objective de groupes plus apparentés génétiquement entre eux qu’avec les autres individus ; et oui, les groupes ainsi définis correspondent souvent, bien qu’assez approximativement, aux catégories « raciales  » (« ethniques » pour être politiquement correct) qui reposent sur l’aspect mais aussi sur l’appartenance culturelle des personnes concernées”. Tout en précisant que “les frontières de ces groupes sont floues” et en préconisant de nommer ces groupes “groupes d’ascendance” plutôt que de “races”, au vu du lourd passé de ce terme. [1]

Dans cet article, B. Jordan citait à plusieurs reprises le biologiste états-unien renommé David Reich. Ce dernier a notamment écrit le 23 mars 2018 dans le New York Times une tribune “Comment la génétique est en train de changer notre conception de la « race »” qui a fait polémique. Il y écrivait notamment : “J’ai une profonde sympathie pour la crainte que les découvertes génétiques puissent être utilisées à mauvais escient pour justifier le racisme. Mais en tant que généticien, je sais aussi qu’il n’est tout simplement plus possible d’ignorer les différences génétiques moyennes entre les « races »”

Une tribune de 67 chercheurs lui répondit alors, tribune que le New York Times refusa de publier… idéologie oblige. Aujourd’hui David Reich continue à propager son idéologie via, notamment, un livre pour le grand public écrit en 2018, promu par le New York Times et traduit en français.

Regrouper pour classifier

B. Jordan et D. Reich parlent tous deux de groupes au sein de l’espèce humaine (qu’ils appellent races ou groupes d’ascendance), comme s’il s’agissait de groupes naturels. Or d’un point de vue biologique, seuls les individus existent. En effet, tout terme regroupant des individus en biologie est un outil descriptif, et qui peut avoir un rôle classificatoire : il doit donc être opératoire, répondre à une procédure définie à l’avance par rapport à un objectif précis. Par exemple, la notion d’animal, fondée sur un mode de nutrition partagé par plusieurs individus, est opératoire, la notion d’espèce également (regroupement d’individus interféconds).

Ainsi, la première question qui se pose, sous-jacente à celle de “race humaine”, est : peut-on faire des groupes distincts, classificatoires, au sein de l’espèce humaine ? Si non, la question de comment appeler des groupes qui n’existent pas ne se pose pas (et donc les races humaines n’existent pas). Si oui, dans ce cas, on peut alors se demander si on doit les appeler races, groupes d’ascendance ou autre, en fonction des définitions que l’on donne à ces termes.

Variations graduelles de la population humaine

Tout être humain est unique et partage en moyenne 99,9 % de son information génétique (contenu dans l’ADN) avec tout autre individu de son espèce. Ainsi la variation moyenne d’information génétique entre deux individus pris au hasard dans la population humaine se fait sur 0,1 % de leur ADN (valeur un peu plus élevée pour certains auteurs).

Une très petite partie de cette variabilité génétique se reflète au niveau des caractères phénotypiques des individus (caractères visibles à l’échelle macroscopique, notamment), comme la couleur de la peau. Si on observe la variation mondiale du caractère “couleur de peau” ou de la diversité génétique, la répartition qui se dessine est une variation spatiale graduelle (clinale).

Melanin index

Couleur de la peau (indice de mélanine) mesuré sur des êtres humains (les points indiquent les populations échantillonnées). [2]

Diversité génétique au sein des populations

Diversité génétique au sein des populations d’après l’analyse du génome de 1000 individus. Forte diversité génétique en couleur sombre, faible diversité en claire (les points indiquent les 52 populations échantillonnées, provenant du panel HGDP-CEPH ; le gradient coloré est une interpolation à partir des données échantillonnées de séquences d’ADN de type STRs) [3]

De façon générale, à l’échelle mondiale, la variation spatiale des caractères phénotypiques des individus et de leurs génomes est graduelle (et en faible proportion par rapport aux variations locales). La structure génétique de la population humaine étant graduelle dans l’espace, le regroupement d’individus en groupes distincts, discontinus, n’est donc pas opératoire. Ainsi, on ne peut d’un point de vue classificatoire subdiviser l’espèce humaine en groupes (et donc a fortiori en races). Mais alors… pourquoi la notion de “race humaine” reste prégnante ?

Les populations locales, des groupes pratiques

Pour des raisons pratiques, les chercheurs découpent souvent, de façon artificielle, la population humaine (mondiale, ensemble des individus de l’espèce) en groupes, qu’ils appellent… des populations (locales). Cette définition du terme population varie selon les objectifs de la recherche : il s’agit souvent de délimiter un espace géographique et d’étudier les individus qui s’y trouvent, sachant que parfois seuls certains sont sélectionnés (par exemple s’ils ont la même langue, et ont leurs grands-parents issus de cette même zone). Par conséquent deux populations locales correspondent à deux regroupements discontinus d’individus.

Donc, si les chercheurs choisissent de n’étudier que quelques populations locales, alors à l’échelle du globe les gradients disparaissent et l’on voit apparaître des groupes discontinus que certains s’empresseront d’appeler… race ! Alors que ce résultat n’est qu’un artefact d’échantillonnage !

Échantillonnage de populations locales humaines

Échantillonnage dans un gradient, formant trois groupes discontinus

En biologie des populations, lorsqu’on analyse une population, par exemple de coccinelles ou d’orchidées, on effectue un échantillonnage aléatoire des individus dans l’espace géographique considéré. Mais en génétique des populations humaines à l’échelle mondiale, ce n’est jusqu’alors pas le cas.

Pour étudier la distribution de la variabilité génétique et inférer l’histoire des populations, les équipes de recherche utilisent très souvent des panels de génomes d’individus comme le panel HGDP-CEPH ou le panel du projet 1000 génomes. Le panel HGDP-CEPH comporte ainsi plus de 1000 génomes d’individus répartis dans 52 populations locales mondiales : par exemple le génome de sept individus du groupe San et 13 du groupe des Pigmés Mbuti (Afrique sub-saharienne), 24 individus du groupe basque, 29 individus du groupe français (toutes régions confondues), 28 du groupe Sardaigne, 25 du groupe russe, 31 du groupe japonais… Les populations ont été choisies en fonction de “l’intérêt spécial porté par les anthropologues” ; les populations sont définies par leur langage, leur culture, leur histoire spécifique et/ou maladie spécifique. Les Américains ayant des descendants provenant ces derniers siècles d’Europe ou d’Afrique ont été exclus car “ils ont commencé des recherches indépendantes sur ce sujet”.

D’un point de vue spatial, les études de génétique de la population mondiale prennent ainsi très rarement des séries de populations adjacentes comme référence, et le plus souvent les points choisis sont discrets et relativement éloignés, ce qui peut influencer les interprétations. En outre, dans les articles scientifiques, le choix fréquent du panel HGDP-CEPH n’est jamais justifié. Implicitement, le choix exclusif, pour les Amériques, de populations présentes avant la colonisation qui a débuté en 1492 amène à penser qu’il s’agit pour les chercheurs de donner une idée de la distribution de la variabilité génétique avant cette date. Avec toutes les interrogations que cela peut poser car ce n’est pas un critère présenté par l’HGDP-CEPH. Par exemple comment ont été sélectionnés les 29 Français “représentatifs” du lieu France ?

Matrices de distances génétiques et biais d’échantillonnage

La différence d’information génétique entre l’ADN de deux individus (sur en moyenne 0,1 % du génome) permet de définir une distance génétique : deux individus ayant une différence génétique de 0,099 % seront plus proches génétiquement que deux individus ayant de différence génétique de 0,11 %.

PNG - 178.4 kio
PNG - 196.5 kio

Diagramme de corrélations entre des facteurs principaux (PC1, PC2, PC3) et les individus étudiés. Les facteurs principaux sont des combinaisons des distances génétiques entre individus. Il y en a autant que le nombre d’individus (1000 dans le cadre du projet 1000 Génomes -1-, en haut et plus de 3000 dans l’étude de Tishkoff et al. 2009 – 4-, en bas). Seuls les 2 ou 3 premiers sont représentés, ce qui correspond à une simplification des données.

Pour comprendre comment évoluent ces différences génétiques au sein de l’espèce humaine, les chercheurs calculent les différences (ou distances) génétiques entre plusieurs d’individus, pris deux à deux. Le tableau de données formé étant complexe, un traitement mathématique appelé Analyse en composantes principales (APC) peut être effectué, qui permet de former des combinaisons de ces différences génétiques et de représenter graphiquement les corrélations entre l’une de ces combinaisons et chaque individu étudié. Appliquée pour la première fois en génétique humaine dans les années 70, cette méthode d’analyse numérique statistique s’est fortement développée au tournant des années 2000 avec l’essor des données génétiques et du numérique.

Expliquant cette méthode, B. Jordan utilise, dans son article de 2021, les données du projet 1000 Génomes (1000 génomes d’individus issus de 14 populations) datant de 2012. Il conclut que le graphique obtenu par Analyse en composante principal met “en évidence de manière objective des groupements, des clusters, et ces derniers sont assez bien corrélés avec des groupes « ethniques » socialement définis comme les Européens, les Asiatiques ou les Africains. Exit les résultats précédents comme celui de Sarah Tishkoff et al. datant de 2009 qui montrent clairement la continuité entre les populations, leur recouvrement génétique progressif qui empêche de les séparer en groupes distincts (Analyse en composante principale faite sur des génomes provenant de 181 populations, plus de 3000 individus) [4]. Les données de 2012 ne retrouvent pas la répartition de S. Tishkoff et al. à cause d’un biais d’échantillonnage (faible nombre de génomes et de populations étudiées). Alors que les 181 populations étudiées par S. Tishkoff et al. sont discontinues, on peut en outre supposer que dans la réalité le recouvrement est encore plus important (du fait de la répartition clinale de la diversité humaine).

Analyses d’ADN ancien

Diagramme de corrélations entre deux facteurs principaux (PC1 et PC2) et 800 individus de populations de références, actuelles et échantillonnées en Eurasie (5)

Diagramme de corrélations entre deux facteurs principaux (PC1 et PC2) et 800 individus de populations de références, actuelles et échantillonnées en Eurasie  [5]

D. Reich est spécialisé dans l’ADN ancien (ADN d’humains ayant vécus il y a quelques milliers d’années). Dans son livre écrit en 2018, qui retrace l’histoire des populations millénaires, il fait également des regroupements qui interrogent. Pour comprendre les migrations passées, il superpose sur un diagramme APC des échantillons d’ADN ancien (par exemple 46 individus ayant vécu il y a plus de 10 000 ans) et des échantillons d’ADN actuels : 800 individus d’Eurasie. La répartition de ces 800 individus dessine une forme de Z montrant la continuité entre les populations échantillonnées. Mais il écrit : “Du nuage de points obtenu pour près de 800 Eurasiens de l’Ouest actuel, deux lignes ont émergé”, et sur son graphique, il trace deux lignes (“européenne” et “orientale”) ! (5) De tels regroupements, qui ne sont pas tracés dans les publications scientifiques et n’apportent rien à l’analyse, amènent le lecteur à intégrer, de façon inconsciente s’ils ne sont pas avertis, une vision de l’humanité en groupes naturels (distincts)… Et implicitement en races.

En outre, si l’échantillonnage des populations actuelles peut être discuté, D. Reich ne mène aucune discussion dans son livre sur l’échantillonnage des populations passées : les individus retrouvés semblent représentatifs de toutes les populations passées, ce qui sous-entend qu’elles ont toutes laissée des traces (et des os) et que l’Homme moderne les a toutes découvertes !

Les classifications en biologie sont des constructions humaines. Ainsi en est-il des groupes nommés “races”. La définition traditionnelle (XIXe siècle) des “races humaines” comme groupes génétiques associés à des caractères physiques se superposant aux continents est démontée par la variation graduelle, d’un point de vue géographique des caractères humains. Il n’est ainsi pas étonnant qu’un outil comme l’Analyse en composantes principales, en traitant et en simplifiant les données génétiques, puissent aboutir à tracer des groupes, qui de fait, sont causés par la méthode d’échantillonnage et par la simplification des données représentées.

La répartition géographique graduelle des variations génétiques au sein de l’espèce humaine a pour cause son origine unique, l’Afrique, et son moteur principal de différenciation entre populations, l’isolement par distance : un isolement de proche en proche des populations, ces dernières continuant toutefois à échanger entre elles. Bien que d’autres mécanismes puissent intervenir dans la différenciation d’individus au sein de l’espèce humaine (comme l’isolement partiel par barrière géographique, tels une montagne ou des océans, ou par barrière linguistique), cela ne remet pas en cause que le moteur principal de cette différenciation est l’isolement par distance. Bien que cette idée fasse consensus dans le domaine scientifiques, nombre de chercheurs continuent de perpétrer la notion de “races humaines” en biologie, par divers canaux qui seront abordés dans un prochain article.

Laure Jinquot

Notes

[1La génomique et la diversité humaine, B. Jordan, 2021, revue Appartenances et Altérités n°1.

[2Loci associated with skin pigmentation identified in African populations, Crawford et al., oct. 2017, Science.

[3A world in a grain of sand : Human history from genetic data, Colonna V. et al., nov. 2011, Genome Biology (d’après Prugnolle et al., 2007).

[4The Genetic Structure and History of Africans and African Americans, Tishkoff S. et al., mai 2009, Science.

[5Image extraite du supplément à l’article référencé par D. Reich (dans son livre Comment nous sommes devenus ce que nous sommes, 2018, éditions Quanto, page 140, note 11 du chapitre 5) : Massive migration from the steppe was a source for Indo-European languages in Europe, Haak et al., mars 2015, Nature.