Pour accompagner mon manuscrit de thèse, j’ai mis en place une ressource numérique permettant au lecteur qui le souhaite d’approfondir et de compléter certains éléments du texte. Si vous avez des questions deux possibilités : une question publique ou une question privée. Vous pouvez aussi lire les questions déjà posées sur GitHub. Le code pour générer ce site est aussi disponible sur GitHub. Je vous souhaite une très bonne visite !

Bioinformatique et analyse de données multiomiques : principes et applications chez les levures pathogènes Candida glabrata et Candida albicans

Thèse présentée et soutenue à Orsay, le 16/09/2020, par Thomas DENECKER

Mots clés

Bioinformatique ; analyse de données ; Technologies multi-omiques ; levures Candida ; Génomique fonctionnelle

Résumé

Plusieurs évolutions sont constatées dans la recherche en biologie. Tout d’abord, les études menées reposent souvent sur des approches expérimentales quantitatives. L’analyse et l’interprétation des résultats requièrent l’utilisation de l’informatique et des statistiques. Également, en complément des études centrées sur des objets biologiques isolés, les technologies expérimentales haut débit permettent l’étude des systèmes (caractérisation des composants du système ainsi que des interactions entre ces composants). De très grandes quantités de données sont disponibles dans les bases de données publiques, librement réutilisables pour de nouvelles problématiques. Enfin, les données utiles pour les recherches en biologie sont très hétérogènes (données numériques, de textes, images, séquences biologiques, etc.) et conservées sur des supports d’information également très hétérogènes (papiers ou numériques). Ainsi « l’analyse de données » s’est petit à petit imposée comme une problématique de recherche à part entière et en seulement une dizaine d’années, le domaine de la « Bioinformatique » s’est en conséquence totalement réinventé.

Disposer d’une grande quantité de données pour répondre à un questionnement biologique n’est souvent pas le défi principal. La vraie difficulté est la capacité des chercheurs à convertir les données en information, puis en connaissance. Dans ce contexte, plusieurs problématiques de recherche en biologie ont été abordées lors de cette thèse. La première concerne l’étude de l’homéostasie du fer chez la levure pathogène Candida glabrata. La seconde concerne l’étude systématique des modifications post-traductionnelles des protéines chez la levure pathogène Candida albicans. Pour ces deux projets, des données « omiques » ont été exploitées : transcriptomiques et protéomiques. Des outils bioinformatiques et des outils d’analyses ont été implémentés en parallèle conduisant à l’émergence de nouvelles hypothèses de recherche en biologie. Une attention particulière et constante a aussi été portée sur les problématiques de reproductibilité et de partage des résultats avec la communauté scientifique.

Composition du Jury
Sarah COHEN BOULAKIA
Sarah COHEN BOULAKIA

Professeure, LRI, Paris Saclay
Présidente


Bertrand COSSON
Bertrand COSSON

Professeur, Paris Diderot - Rapporteur & Examinateur


Marie-Agnès DILIES
Marie-Agnès DILLIES

Ingénieur de recherche, Pasteur - Rapporteur & Examinatrice


Stéphane LE CROM
Stéphane LE CROM

Professeur, Sorbonne université - Rapporteur & Examinateur

Hélène CHIAPELLO
Hélène CHIAPELLO

Ingénieur de recherche, INRAE - Examinatrice

Jean-Michel CAMADRO
Jean-Michel CAMADRO

Directeur de recherche, IJM - Invité


Gaëlle LELANDAIS
Gaëlle LELANDAIS

Professeur, Professeure, I2BC, Paris Saclay - Directrice de thèse


Informations complémentaires

Thèse de doctorat de l'université Paris-Saclay
École doctorale n° École doctorale n°577
Structure et dynamique des systèmes vivants (SDSV)
Spécialité de doctorat : sciences de la vie et de la santé
Unité de recherche : Institut de Biologie Intégrative de la Cellule
Référent : Faculté des sciences