Protéomique

L’histoire de la chenille et du papillon

La protéomique, c’est l’histoire de la chenille et du papillon. Ces deux organismes apparemment si différents ont exactement le même génome. Ce qui les distingue, ce sont les produits finaux d’expression de leurs gènes, c’est à dire leurs protéines. Cet exemple montre à quel point il est nécessaire, pour comprendre un organisme, de s’intéresser à ses protéines et pas seulement à son génome.

Dossier réalisé en collaboration avec Jérôme Garin, Virginie Brun et Yohann Couté, unité de Biologie à grande échelle (unité 1038 Inserm/CEA/Université de Grenoble Alpes), équipe EDyP (Etude la dynamique des protéomes), Infrastructure nationale de protéomique (ProFI), Grenoble

Comprendre la protéomique

La protéomique consiste à étudier l’ensemble des protéines d’un organisme, d’un fluide biologique, d’un tissu, d’une cellule ou même d’un compartiment cellulaire. Cet ensemble de protéines est nommé « protéome ».

Le protéome est une entité dynamique et complexe. Au sein de chaque cellule, le contenu de protéines se modifie en permanence en fonction des conditions intra ou extra cellulaires. De plus, par le biais de réarrangements, un même gène peut donner naissance à plusieurs protéines. Les protéines peuvent également être modifiées, c’est-à-dire liées à des sucres, des lipides ou bien d’autres groupements chimiques qui vont participer à changer leur fonction. Le protéome contient donc un nombre beaucoup plus important de protéines que le génome ne contient de gènes. 

L’étude du protéome révolutionne la connaissance du vivant

Les principaux objectifs de la protéomique sont : 

  • d’identifier, de quantifier et caractériser finement les protéines présentes dans un échantillon biologique à un instant T
  • d’obtenir des données fonctionnelles : localisation, modifications, identification de protéines partenaires, sites de liaison de ligands...

Ces données permettent de mieux comprendre les mécanismes moléculaires impliqués dans les grandes fonctions cellulaires et la physiologie des organismes vivants. 

La protéomique pour… percer le mystère des virus géants

La découverte récente de virus géants a bouleversé les fondations de ce qui était connu jusqu’alors en virologie : les virus identifiés par le groupe de Chantal Abergel et Jean-Michel Claverie (UMR7256, Marseille) ont en effet des génomes dont la taille rivalise avec celle de certains microorganismes cellulaires eucaryotes, et forment des particules infectieuses plus grosses que certaines bactéries. Des analyses protéomiques systématiques de ces particules infectieuses ont permis de mettre en évidence la complexité unique de leur composition protéique, renfermant une majorité de protéines sans homologue connu. La caractérisation protéomique des hôtes infectés, réalisée par le groupe de Yohann Couté (unité Inserm 1038, Grenoble), a permis de révéler l’orchestration moléculaire complexe des cycles infectieux de ces virus géants dont la diversité génique pourrait être le reflet d’une capacité unique de créer de nouveaux gènes. 

La protéomique pour… découvrir de nouveaux médicaments

Alors que les bactéries pathogènes résistent de plus en plus aux antibiotiques, de nouveaux médicaments doivent être mis au point. Différents ensembles de molécules sont donc étudiés afin d’offrir de nouveaux médicaments. Parmi ceux-ci, la classe des bactériocines, des peptides antimicrobiens naturellement produits par les bactéries, paraît particulièrement prometteuse. La ruminococcine C est naturellement produite par une bactérie, Ruminococcus gnavus E1, qui vit en symbiose dans le système digestif humain. Des analyses protéomiques réalisées au sein de l’unité Inserm 1038 ont permis de révéler sa structure originale, contenant 4 ponts thioéther indispensables à son activité antimicrobienne. Celle-ci s’exerce contre des bactéries à l’origine d’infections nosocomiales comme Staphylococcus aureus ou Clostridium difficile, et contre d’autres pathogènes inscrits sur la liste prioritaire de l’OMS.

La protéomique pour… améliorer notre connaissance de la biologie humaine

Un vaste projet international de protéomique, appelé Human Proteome Project (HPP), a été lancé en 2011 par l’organisation mondiale HUPO (Human Proteome Organisation). Ce projet implique environ 50 équipes de recherche réparties dans 25 pays et consiste à établir une base de données permettant de décrire les protéines correspondant aux 19 800 gènes prédits comme codants chez l’Homme. En 2019, 11% de ces protéines « prédites » n’ont pas encore été identifiées : leur existence reste donc toujours à confirmer. On les appelle les protéines « manquantes ». L’hétérogénéité des protéomes d’une cellule à l’autre, d’un tissu à l’autre, d’un individu à l’autre et leur caractère dynamique rendent cet exercice très difficile, mais il présente l’avantage de promouvoir les recherches en protéomique et de stimuler les coopérations internationales. L’accomplissement de ce projet devrait permettre d’améliorer la connaissance de la biologie humaine et fournir de nouvelles informations utiles pour améliorer la prise en charge médicale des patients (diagnostic, choix thérapeutique…). 

En 2017, l’équipe de Charles Pineau (unité Inserm 1085, Rennes), en collaboration étroite avec l’infrastructure nationale de protéomique ProFI et l’institut Suisse de bioinformatique, a effectué une analyse en profondeur du protéome du sperme humain, un échantillon potentiellement enrichi en protéines « manquantes ». L’utilisation combinée de techniques de biochimie, d’analyse en spectrométrie de masse et de bioinformatique a permis d’identifier plus de 5 000 protéines dans le spermatozoïde, dont 220 jamais détectées jusqu’ici.

Analyse de protéines par chromatographie Nano LC et spectromètre de masse Q-Trap
Analyse de protéines par chromatographie Nano LC et spectromètre de masse Q‑Trap au laboratoire Biologie à grande échelle (unité Inserm 1038, Grenoble) © Inserm/Patrice Latron

La spectrométrie de masse au service de l’étude des protéines

L’étude des protéines a connu un essor spectaculaire au cours des années 90 avec l’avènement des spectromètres de masse (un développement technologique récompensé par un prix Nobel de chimie, attribué en 2002 à John Fenn et Koichi Tanaka). Jusque-là, les scientifiques utilisaient une méthode chimique, nécessitant de purifier des quantités importantes de chaque protéine avant de pouvoir en déterminer la séquence en acides aminés. Aujourd’hui, les spectromètres de masse permettent d’analyser des échantillons biologiques extrêmement complexes, pouvant contenir des milliers de protéines comme les fluides biologiques : plasma, urine. Ils permettent également de caractériser des échantillons biologiques restreints et précieux correspondant à quelques cellules, voire une seule cellule, et contenant des quantités infimes de protéines. 

La spectrométrie de masse consiste à identifier des molécules en fonction de la mesure précise de leur masse. Pour réaliser une étude protéomique, il faut d’abord digérer les protéines de l’échantillon à étudier grâce à une enzyme, afin d’obtenir des fragments protéiques (ou « peptides ») qui sont solubles dans la solution qui est injectée dans le spectromètre de masse. Ces peptides sont ensuite fragmentés par la machine. Les masses de chaque peptide et des fragments sont mesurées. Elles permettent d’identifier les peptides contenus dans l’échantillon, en comparant les données expérimentales aux données déjà existantes dans des banques. A noter que grâce aux performances des spectromètres de masse les plus récents, il est également possible d’étudier des protéines entières, sans avoir à les digérer préalablement. 

Les données sont restituées sous une forme que l’on peut comparer à un puzzle. C’est aux scientifiques de reconstituer ce puzzle pour retrouver l’identité des protéines qui étaient présentes dans l’échantillon. Ce travail est bien sûr facilité par des logiciels informatiques de plus en plus performants et des bases de données de plus en plus riches. 


Collaborer pour progresser toujours plus vite

Trois sites français de protéomique, localisés respectivement à Grenoble (unité Inserm 1038), Toulouse et Strasbourg, mutualisent depuis 2012 leurs expertises et réalisent des développements méthodologiques en commun dans le cadre de l’infrastructure nationale de protéomique ProFI. L’objectif est de partager les expériences, de développer des logiciels et des protocoles communs pour améliorer les analyses et le traitement des données de protéomique, et de proposer ce travail à la communauté scientifique française et internationale. 


Les enjeux de la protéomique

La protéomique pour comprendre les maladies

La protéomique permet d’étudier un échantillon biologique de façon exploratoire, sans a priori sur les protéines susceptibles d’y être présentes. Cette approche permet d’obtenir une liste de protéines avec des données quantitatives associées. Ainsi, en comparant les échantillons de personnes en bonne santé et de personnes malades (incluses dans de grandes cohortes), la protéomique permet de découvrir de potentiels biomarqueurs protéiques utiles au dépistage de maladies, au suivi de leur évolution ou encore à l’évaluation de l’efficacité d’un traitement. Cette stratégie a été utilisée avec succès par l’équipe de Pascal Cosette et l’unité Inserm 1234, à Rouen, pour identifier des biomarqueurs sériques permettant de prédire la réponse au traitement methotrexate/etanercept dans la polyarthrite rhumatoïde.

Généralement les analyses protéomiques exploratoires sont complétées par des analyses ciblées qui visent à étudier des biomarqueurs potentiels dans des cohortes de patients indépendantes, afin de vérifier leur intérêt clinique. Ce type d’approche a par exemple été utilisé par l’équipe de Jean-Paul Borg (unité Inserm 1068, Marseille) pour étudier le peptide d’activation du facteur de coagulation XIII en tant que biomarqueur sérique pour le diagnostic précoce du cancer colorectal. L’équipe de Virginie Brun (unité Inserm 1038, Grenoble), en collaboration avec l’équipe de néphrologues de Pierre Ronco (unité Inserm 1155, Paris), a également appliqué ce type d’approche pour évaluer l’intérêt de biomarqueurs urinaires dans l’insuffisance rénale aigüe. 

Afin de comprendre le développement des maladies, il est également possible d’étudier le renouvellement des protéines, c’est-à-dire l’équilibre contrôlé entre leur production et leur dégradation. L’équipe de Sylvain Lehmann (unité Inserm 1183, Montpellier) a ainsi réalisé des expériences protéomiques complexes, fondées sur du traçage isotopique, qui ont permis de déterminer la dynamique du renouvellement de protéines constituantes du liquide céphalo-rachidien chez l’humain. Ces travaux ouvrent des pistes très prometteuses pour mieux comprendre le développement et améliorer le diagnostic de maladies neurodégénératives dans lesquelles cet équilibre entre production et dégradation est altéré, conduisant à l’accumulation pathologique de protéines. C’est notamment le cas dans la maladie d’Alzheimer.

L’équipe de Chiara Guererra (unité de service Inserm 24, Paris) a quant à elle étudié la cystinose, une maladie métabolique caractérisée par une accumulation de cystine dans les lysosomes. Elle a montré qu’une mutation particulière, associée aux formes sévères de la maladie, induisait une instabilité et une dégradation accélérée de la protéine cystinosine, responsable des dérèglements aux niveau des lysosomes. 

La protéomique pour la médecine de précision

Même si les domaines d’application de la protéomique sont vastes, la meilleure compréhension des processus physiopathologiques et la découverte de biomarqueurs permettant de dépister des maladies, de suivre leur évolution ou l’efficacité d’un traitement sont actuellement les principaux moteurs de développement de cette science. Plus de 200 biomarqueurs protéiques sanguins sont déjà utilisés actuellement en biologie médicale, mais les besoins pour améliorer le diagnostic et le suivi des patients sont encore importants. Et l’exploration protéomique du plasma est un sujet d’investigation important. 

L’imagerie par spectrométrie de masse MALDI est une technique particulière qui permet d’établir des cartographies spatio-temporelles du contenu protéique d’un échantillon biologique. Le principe de cette approche consiste à balayer une coupe de tissu et à restituer sous forme d’image les masses mesurées dans les différentes zones de l’échantillon. Récemment, les chercheurs Isabelle Fournier et Michel Salzet (unité Inserm 1192, Lille) ont développé le prototype SpiderMass qui permet d’échantillonner les tissus biologiques in vivo grâce à une sonde laser et d’analyser l’échantillon en temps réel par spectrométrie de masse (MS). Cet outil pourra être utilisé pour améliorer la prise en charge de patients en cancérologie, lors du diagnostic et pour la définition des marges d’exérèses lors d’une chirurgie. 

Utilisation de SpiderMass pour une analyse
Utilisation de SpiderMass pour une analyse. La sonde du prototype SpiderMass est reliée, au second plan, à l’appareil d’analyse, un spectromètre de masse. Ce projet est piloté par Isabelle Fournier et Michel Salzet du laboratoire PRISM (unité Inserm 1192, Villeneuve‑d’Ascq). © Inserm/Philippe Saudemont/Laboratoire PRISM

La protéomique permet également de caractériser finement des protéines produites par biotechnologie et utilisées comme agents thérapeutiques (anticorps thérapeutiques, hormones protéiques…). Ces analyses protéomiques structurales contribuent au développement et la qualité de ces produits de santé. De plus, afin d’optimiser leur efficacité chez les patients, la protéomique peut être utilisée pour les quantifier dans le sang et optimiser leur dosage (posologie de précision). Dans ce domaine, l’équipe de Françoise Stanke-Labesque (unité Inserm 1042, Grenoble) a développé une méthode protéomique permettant de monitorer très précisément le traitement de patients atteints de la maladie de Crohn.

Dans l’avenir, un enjeu majeur est de développer des outils mathématiques et informatiques permettant d’intégrer les données issues de ces approches protéomiques avec d’autres types de données (imagerie, biochimie médicale, génomique, transcriptomique…) afin de générer des signatures moléculaires « composites » permettant de mieux caractériser les patients et les pathologies, avec pour objectif d’établir une médecine de précision. 

Pour aller plus loin