Les big data au service du suivi de la croissance des enfants

En avril 2018, les courbes de croissance des carnets de santé ont été actualisées à partir d’un million et demi de mesures obtenues chez plus de 230 000 enfants français. Ces nouvelles courbes ont été établies grâce à une approche big data combinée à une modélisation mathématique, capable de recueillir et d’analyser d’importantes bases de données médicales. Elle rend plus fiables et réactualisables les données anthropométriques pédiatriques de référence.

©Flore Avram

Le développement en bonne santé d’un enfant est notamment apprécié à partir des courbes de croissance contenues dans son carnet de santé. Lorsque la courbe suivie par cet enfant s’écarte trop du couloir de référence où il évolue, il est nécessaire d’en rechercher la cause. Mais ce postulat n’est valable que si les courbes de référence sont fiables et fidèles à la croissance actuelle des enfants. Or, celles qui ont été utilisées jusque récemment ont été établies durant les années 1970, à partir de mesures réalisées dans une cohorte de quelques centaines d’enfants nés dans les années 50. Depuis, la taille et le poids des enfants ont clairement évolué, comme l’ont montré différents travaux de l’équipe Inserm EARoH*. Par ailleurs, les courbes récemment établies par l’Organisation Mondiale de la Santé se sont avérées en partie inadaptées aux observations réalisées en France notamment, selon d’autres études. Aussi était-il nécessaire de conduire un travail spécifique sur les données nationales afin d’actualiser les courbes de référence. 

Le 1er avril 2018, la Direction Générale de la Santé (DGS) a inauguré un nouveau carnet de santé dans lequel les courbes de croissance ont été actualisées. Ce sont les chercheurs de l’équipe EARoH qui, en collaboration avec l’équipe EPOPé**, ont été chargés de ce travail. Les chercheurs ont utilisé la modélisation mathématique pour mener ce travail, avec de multiples avantages à la clé, comme l’explique Martin Chalumeau** : « Cette approche permet d’exploiter des bases de données médicales dont la richesse offre une puissance et une représentativité supérieure à celles d’une étude de terrain qui serait menée auprès de quelques centaines ou même milliers de personnes. » C’est aussi une méthode relativement rapide à mettre en œuvre, une fois le premier modèle mis au point. Ce qui permet d’envisager « une actualisation des données assez simple si cela s’avère nécessaire ».

Grâce à un partenariat avec l’Association française de pédiatrie ambulatoire (AFPA) et l’éditeur CompuGroup Medical, les chercheurs ont eu accès aux données issues des dossiers médicaux anonymisés de 32 pédiatres de l’AFPA et 10 médecins généralistes de la Société française de médecine générale (tirés au sort parmi tous les utilisateurs d’un même logiciel médical), représentatifs de toutes les régions et environnements (urbain, rural) métropolitains. Ont ainsi pu être extraites les données de 238 102 enfants âgés de 0 à 18 ans et suivis par ces médecins entre 1990 et 2018, soit environ 1,5 millions de mesures de poids ou de taille. Après exclusion des valeurs aberrantes et des enfants souffrant a priori de troubles de la croissance, les chercheurs ont modélisé la croissance des enfants français, avec des courbes qui sont apparues en moyenne au-dessus des anciennes : pour un âge donné, le poids et la taille des enfants de la dernière génération sont supérieurs à ceux des générations les ayant précédées. 

De l’enfant en bonne santé à l’enfant malade

Pour s’assurer de la fiabilité de leur modèle, les chercheurs ont vérifié que les nouvelles courbes étaient concordantes avec les résultats d’une enquête transversale nationale récente de la Direction de la recherche des études, de l’évaluation et des statistiques (DRESS), au cours de laquelle plusieurs milliers d’enfants de 5–6 ans, 10–11 ans et 14–15 ans ont été mesurés au sein des établissements scolaires. « Nous avons observé que notre modélisation est parfaite concernant la taille aux trois âges de la vie. Concernant le poids, les données sont satisfaisantes pour les 5–6 ans, mais moins pour les enfants plus âgés pour lesquels nos courbes semblent légèrement sous-estimer le poids. » Cet écart pourrait être dû à deux facteurs : « Il est possible que les enfants n’aient pas été entièrement déshabillés dans le cadre scolaire, ce qui peut se traduire en une légère surestimation du poids. Par ailleurs, il est possible que les enfants en surpoids ou a fortiori en obésité soient moins suivis médicalement, ce qui suppose leur sous-représentation dans l’échantillon de consultations médicales analysées par rapport à l’enquête de la DRESS ».

En pratique, les courbes de taille établies sont parfaitement utilisables pour suivre le bon développement des enfants. « Il est cependant nécessaire, pour le repérage du surpoids et de l’obésité, d’évaluer la position de l’indice de masse corporelle par rapport à celui attendu à partir de la courbe internationale de l’International Obesity Task Force également reproduite dans le carnet » insiste le pédiatre. 

Ce travail montre que les promesses des big data sont importantes en matière de santé publique. « Maintenant que nous disposons de courbes permettant de décrire le développement des enfants en bonne santé, nous souhaitons modéliser la croissance spécifique de ceux atteints de différentes pathologies pouvant affecter la croissance, comme une insuffisance rénale, une maladie inflammatoire des intestins ou des troubles endocriniens. En utilisant de nouveaux algorithmes et des bases de données spécifiques à ces pathologies, nous pouvons envisager la mise au point d’outils d’aide au repérage précoce qui alerteront le médecin de premier recours face à un décrochage spécifique des courbes de croissance d’un enfant qu’il ou elle suit. »

Notes :
* EARoH : Équipe de recherche sur les origines précoces de la santé
** EPOPé : Équipe de recherche en épidémiologie obstétricale, périnatale et pédiatrique
Ces deux équipes font partie de l’unité 1153 Inserm/Université de Paris/Université Paris 13/Inra, Centre de recherche en épidémiologie statistique (CRESS)

Source : Heude B, Scherdel P, Werner A et al. A big-data approach to producing descriptive anthropometric references : a feasibility and validation study of paediatric growth charts. The Lancet Digital Health du 1er décembre 2019. DOI :10.1016/S2589-7500(19)30149–9 (en anglais, PDF, 2,6 Mo)