Annuaire IPHC

DSA | Laboratoire de Spectrométrie de Masse BioOrganique (LSMBO) » Axes de recherche » Nouvelles approches bioinformatiques pour la protéomique

Nouvelles approches bioinformatiques pour la protéomique

Dernière mise à jour : jeudi 22 décembre 2016, par Alexandre Burel

L’analyse protéomique à haut débit est aujourd’hui génératrice de données massives (Big Data) et l’interprétation de ces données constitue un verrou majeur de la protéomique.
Le LSMBO œuvre depuis quelques années pour tenter de lever ce verrou en investissant des moyens humains et matériels importants dans le développement de logiciels libres pour l’interprétation des données de protéomique. Ces développements se font au niveau du laboratoire mais également au niveau national par le biais de l’Infrastructure Nationale de Protéomique ProFI dont le laboratoire est un des trois noeuds.
Le verrou à lever est double puisqu’il y a à la fois une nécessité de moyens de calculs plus importants pour permettre d’interpréter les données massives générées et une nécessité d’outils logiciels et d’algorithmes innovants pour un meilleur (re)traitement de ces données.

  • MSDA (Mass Spectrometry Data Analysis, https://msda.unistra.fr), une suite logicielle innovante pour l’interprétation des données de spectrométrie de masse.
    MSDA couvre des fonctionnalités allant de la création de banques de données de séquences protéiques « à façon », à la recherche en banques de données (par des algorithmes open-source tels que OMSSA et X-Tandem), au séquençage de novo haut débit (PepNovo+ et MS-BLAST) et à l’extraction d’annotations fonctionnelles (Gene Ontology GO) sur les listes de protéines identifiées (Carapito et al., Proteomics 2014).

  • Vigrid : un outil pour l’adaptation des logiciels de protéomique au calcul distribué sur la grille.
    Vigrid permet de déployer les outils de MSDA sur la grille de calcul. Cela a permis d’accroître considérablement notre puissance de calcul et capacité de traitement des données et de rendre possible des approches auparavant inenvisageables, comme par exemple le séquençage de novo systématique sur des analyses haut débit.
  • Proline (http://proline.profiproteomics.fr/), un logiciel pour la validation et la quantification label-free des données de protéomique.
    Proline est développé par les 3 nœuds de l’Infrastructure Nationale de Protéomique ProFI. Proline couvre les fonctionnalités de validation des identifications, de concaténation de résultats, de quantification label-free par comptage de spectres ou par chromatogrammes extraits, de visualisation des données et d’analyse statistique des résultats.