Aller au contenu

Détermination des états oligomériques du complexe NADPH oxydase par la combinaison d'approches théoriques et de résultats expérimentaux

Groupe scientifique : CpSysBio
Financement : ED2MIB
Date limite de candidature: 31 mars 2025

English version below

Depuis quelques années, nous observons un développement rapide des méthodes d'intelligence artificielle (IA) au sens large, depuis les approches les plus classiques d'apprentissage machine (machine learning, ML) jusqu'au développement très récent en apprentissage profond (deep learning, DL). Un des domaines dans lequel les progrès ont été impressionnants est la biochimie notamment grâce à la disponibilité de données massives dans des grandes bases de données concernant la séquence et la structure des biomolécules (ARN, ADN et protéines). Ainsi, le Prix Nobel de Chimie 2024 récompense l'équipe de Deepmind, Demis Hassabis et John Jumper, et D Baker qui ont proposé Alphafold et RosettaFold, des algorithmes qui arrivent à des résultats stupéfiants pour la prédiction de la structure des protéines.L'algorithme AlphaFold (AF) en particulier a déclenché une révolution, permettant une prédiction de complexes protéiques, particulièrement difficiles à appréhender, du fait de leur dynamique et flexibilité par des approches structurales classiques (RX, RMN, CryoEM) (Abramson et al., Nature, 2024). Néanmoins, même si les résultats sont globalement impressionnants, certains cas restent un défi notamment car ils sont sous représentés dans les bases de données, comme les protéines membranaires. Par ailleurs, les protéines ayant une grande flexibilité, par exemple à cause de segments intrinsèquement désordonnés, ou une grande diversité, par exemple via des modifications post-traductionelles, représentent une difficulté supplémentaire. Même si la dernière version de AF utilise une approche permettant d'obtenir des conformations variées (diffusion), les grands assemblages de protéines restent un défi pour AF. Le complexe NADPH oxydase illustre parfaitement la complexité de ces enzymes oligomériques dont l'assemblage et le fonctionnement dépendent de différents paramètres et partenaires. Ce sont des enzymes spécialisées dans la production d'espèces réactives de l'oxygène, indispensables à la destruction des pathogènes au cours de la réponse immunitaire innée (Vermot et al. Antioxydants, 2021). Comme leur dysfonctionnement conduit à des pathologies sévères (maladies immunitaires et neurodégénératives), elle est considérée comme une cible thérapeutique potentielle (Cipriano et al., J Med Chem 2023). Pour être fonctionnelle, cette enzyme membranaire nécessite l'assemblage d'au moins 6 protéines dont certaines sont modulaires et possédant des régions intrinsèquement désordonnées. Nous avons récemment utilisé AF combiné à des simulations de dynamique moléculaire pour dévoiler une partie de l'assemblage à la membrane de la NADPH oxydase (Aimeur et al. JBC 2024 ; Aimeur et al. BioRiv 2024; Versini et al, J Chem Info Model 2024). Dans ce travail, nous nous sommes focalisés sur un seul des modèles proposés par AF qui semblait les plus cohérent avec plusieurs données expérimentales. Cependant, en excluant volontairement certain modèles, nous sommes passés à côté de nombreux autres modèles qui présentent un double intérêt potentiel : i) d'un point de vue du fonctionnement de AF on n'explore pas tout l'espace des possibilités. Par exemple, on peut se demander combien de modèles sont nécessaires pour explorer de manière exhaustives l'ensemble de solutions respectant le jeu de contraintes expérimentales. ii) du point de vue du fonctionnement du complexe protéique on exclue potentiellement des sous-états dynamiques du système pouvant être en accord avec d'autres données expérimentales soulevant ainsi la validité des modèles considérés et leur limite. Le projet proposé consiste à analyser l'ensemble des modèles des prédictions en considérant leur robustesse par rapport aux paramètres influant sur la diversité des solutions, aux acquis expérimentaux en en combinant avec de la modélisation de dynamique moléculaire pour affiner les estimations.

 

*************

Over the past few years, we have witnessed the rapid development of artificial intelligence (AI) methods in the broadest sense, from the most classic machine learning (ML) approaches to the very recent development of deep learning (DL). One of the fields in which progress has been impressive is biochemistry, thanks in particular to the availability of massive data in large databases concerning the sequence and structure of biomolecules (RNA, DNA, and proteins). The Nobel Prize for Chemistry 2024 was awarded to the Deepmind team, Demis Hassabis and John Jumper, and to D Baker, who have proposed Alphafold and RosettaFold, algorithms that deliver astounding results for protein structure prediction.The AlphaFold (AF) algorithm in particular has triggered a revolution, enabling the prediction of protein complexes that are particularly difficult to understand, due to their dynamics and flexibility, using conventional structural approaches (XR, NMR, CryoEM) (Abramson et al., Nature, 2024). Nevertheless, even if the results are impressive overall, some cases remain challenging, notably because they are under-represented in databases, such as membrane proteins. Furthermore, proteins with high flexibility, e.g. due to intrinsically disordered segments, or high diversity, e.g. via post-translational modifications, represent an additional difficulty. Even though the latest version of AF uses an approach that allows varied conformations to be obtained (diffusion), large protein assemblies remain a challenge for AF.The NADPH oxidase complex perfectly illustrates the complexity of these oligomeric enzymes, whose assembly and function depend on different parameters and partners. These enzymes are specialized in producing reactive oxygen species, essential for destroying pathogens during the innate immune response (Vermot et al. Antioxydants, 2021). As their dysfunction leads to severe pathologies (immune and neurodegenerative diseases), they are considered a potential therapeutic target (Cipriano et al., J Med Chem 2023). To be functional, this membrane enzyme requires the assembly of at least 6 proteins, some of which are modular and possess intrinsically disordered regions. We recently used AF combined with molecular dynamics simulations to unveil part of the membrane assembly of NADPH oxidase (Aimeur et al. JBC 2024; Aimeur et al. BioRiv 2024; Versini et al, J Chem Info Model 2024). In this work, we focused on just one of the models proposed by AF that seemed most consistent with several experimental data. However, by deliberately excluding certain models, we have missed out on many others that have a double potential interest: i) from the point of view of AF functioning, we are not exploring the whole space of possibilities. For example, we may wonder how many models are needed to exhaustively explore the set of solutions respecting the set of experimental constraints. ii) from the point of view of the functioning of the protein complex, we potentially exclude dynamic sub-states of the system that may agree with other experimental data, thus raising the validity of the models considered and their limits. The proposed project consists of analyzing the set of prediction models, considering their robustness to the parameters influencing the diversity of solutions, and to experimental data, and combining them with molecular dynamics modeling to refine the estimates.

Contact

Laura Baciou