In recent years, high-throughput technologies and experimental procedures for post-genomics sequencing, DNA microarrays, mass spectrometry data...) developed so far, have provided massive amounts of data in all areas of molecular biology. Understanding the mechanisms involved in life implies facing this deluge of heterogeneous -omics data (genomics, transcriptomics, proteomics, metabolomics), by combining a strong modelling basis, algorithmic developments and experimental validation.
The trade-off between the biological accuracy of the model and the computational tractability or efficiency can only be tackled by a multidisciplinary research team, with a wide range of skills in computer science, and in a close partnership with experimental biology groups. Since its creation in 2002 the Bioinfo group has been addressing these issues by gathering diverse complementary computer science skills, including Algorithms, Combinatorics, Data Mining, Data Integration, Modelling, and Simulation, in a tight collaboration with biologists. During the last four years the Bioinfo group has continued its pluridisciplinary work by reinforcing its partnerships with Biology laboratories, notably with the creation of a joint research group in Bioinformatics at IGM (Institut de Génétique et Microbiologie, Orsay).
The BioInfo group is mainly interested in deciphering information organization in DNA sequences and identifying the role played by gene products namely proteins and RNA, ogether with their dynamics in the cellular process. As all protein and RNA functions are intimately related to their three-dimensional molecular structure, structure prediction and equence analysis are viewed as an integral part of gene annotation. Work on functional annotation has been carried out within an ACI IMPBio grant, while RNA structures are urrently investigated within an ANR Masses de Données grant, both grants being led by the group.
Présentation de l'activité scientifique de l'équipe Bioinformatique
Depuis quelques années les techniques à haut débit et les procédés expérimentaux qui sont développés (séquençage, puces à ADN, spectrométrie de masse etc.), ont produit un nombre considérable de données dans tous les domaines de la biologie moléculaire. Comprendre les mécanismes impliqués dans la vie des organismes suppose de pouvoir faire face à ce déluge de données hétérogènes, appelées données -omiques (génomiques, transcriptomiques, protéomiques, et métabolomiques). Cela implique à la fois des techniques de modélisation, des développements algorithmiques et une validation expérimentale.
Le compromis entre la précision du modèle pour la biologie et sa faisabilité et même son efficacité pour l'informatique ne peut être trouvé que par une équipe de recherche pluridisciplinaire, qui couvre un large champ de compétences en informatique, en synergie avec des groupes de biologie expérimentale. L'équipe Bioinformatique vise à relever ce défi depuis sa création en 2002, en rassemblant des compétences complémentaires en informatique, telles que Algorithmique, Combinatoire, Fouille de Données, Intégration de données, Modélisation et Simulation, et en travaillant dans une étroite collaboration avec les biologistes. Durant les dernières années, l'équipe Bioinfo a poursuivi son travail pluridisciplinaire en renforçant ses partenariats avec des laboratoires de Biologie, notamment avec la création d'une équipe de recherche mixte avec l'IGM (Institut de Génétique et Microbiologie, Orsay).
L'équipe Bioinfo s'intéresse principalement à déterminer l'organisation de l'information dans les séquences d'ADN et à identifier le rôle joué par les produits des gènes que sont les ARNs et les protéines, en même temps que leur dynamique dans les processus cellulaires. Toutes les fonctions des protéines et presque toutes celles des ARN étant reliées à leur structure moléculaire 3D, la prédiction de structures et l'analyse des séquences sont au coeur de l'annotation des gènes. Le travail sur l'annotation fonctionnelle a été réalisé au sein d'une ACI IMPBio, celui sur les structures de l'ARN dans le cadre d'une ANR Masses de Données, deux projets coordonnés par l'équipe.