La fouille de données est une
étape importante de préparation et ou d'analyse de donnés de criblage.
ChemBioFrance fournit un portail d'accès à des bases de données développées et
maintenues en interne, permettant des requêtes simples concernant vos
molécules/cibles d'intérêt.
Protocole
Ces bases de données ne sont pas gérées par ChemBioFrance mais individuellement par chaque plateforme. Certaines peuvent être téléchargées en suivant le lien web. Pour les autres, veuillez suivre le lien web pour obtenir plus d'information et contacter les auteurs.
Base de données |
URL |
Description |
e-Drug3D |
Structure, métabolites actifs et données PK/PD des médicaments approuvés par la FDA |
|
PKIDB |
Inhibiteurs de Kinases en cours de développement clinique |
|
Bioinfo DB |
Molécules drug-like commercialement disponibles |
|
sc-PDB |
Sites de liaisons 'droguables' des protéines de la PDB |
|
2P2I |
Données structurales sur les interfaces protéine-protéine et leurs inhibiteurs connus |
|
iPPI-DB |
Structure et activités de modulateurs d'interaction protéine-protéine |
|
BactPepDB |
Peptides de génomes de procaryotes |
Informations requises
aucune
Notes
Références
Douguet, D. (2018) Data Sets Representative of the Structures and Experimental Properties of FDA-Approved Drugs. ACS Med Chem Lett, 9: 204-209
Carles F, Bourg S, Meyer C, Bonnet P (2018) PKIDB: A Curated, Annotated and Updated Database of Protein Kinase Inhibitors in Clinical Trials. Molecules, 23, E908
Desaphy J, Bret G, Rognan D, Kellenberger E. (2015) sc-PDB: a 3D-database of ligandable binding sites--10 years on. Nucleic Acids Res., 43, D399-404
Basse MJ, Betzi S, Morelli X, Roche P. (2016) 2P2Idb v2: update of a structural database dedicated to orthosteric modulation of protein-protein interactions, Database (Oxford), 2016: baw007.
Labbé CM, Kuenemann MA, Zarzycka B, Vriend G, Nicolaes GA, Lagorce D, Miteva MA, Villoutreix BO, Sperandio O. (2016) iPPI-DB: an online database of modulators of protein-protein interactions., Nucleic Acids Res., 44, D542-547.
Pupin M, Esmaeel Q, Flissi A, Dufresne Y, Jacques P, Leclère V (2016) Norine: A powerful resource for novel nonribosomal peptide discovery., Synth Syst Biotechnol, 1:89-94
Rey J, Deschavanne P, Tuffery P. (2014) BactPepDB: a database of predicted peptides from a exhaustive survey of complete prokaryote genomes Database (Oxford). 2014:bau106.
Demande de projet
Le criblage virtuel de
chimiothèques est un outil puissant, regroupant de nombreuses méthodes,
permettant de sélectionner à faible coût un petit nombre de molécules commercialement
disponibles (10-1000), répondant à un cahier des charges précis (ex: liaison à
une cible protéique, similarité à une molécule active connue, propriétés
physicochimiques particulières) parmi un catalogue de plus de 5 millions de
molécules commercialement disponibles.
Protocole
Deux types de prestations sont possibles selon les contraintes imposées par le client:
Informations requises
Nom et/ou structure de la protéine cible (code PDB, identifiant UniProt)
Nom et structures 2D des molécules actives connues
Notes
Les logiciels utilisés sont soit commerciaux, soit développés en interne à ChemBioFrance
QSAR : ISIDA-Fragmentor, ISIDA-Predictor, ISIDA-GTM, ISIDA-SOM
Docking: Surflex-Dock, PLANTS, IChem
Recherche pharmacophorique: LigandScout, Biovia, IChem
Recherche par similarité: Pipeline Pilot, ROCS
Références
Rivat, C. et al. Inhibition of neuronal FLT3 receptor tyrosine kinase alleviates peripheral neuropathic pain in mice. Nature Commun 2018, 9:1042
Da Silva, F. et al. IChem: A Versatile Toolkit for Detecting, Comparing, and Predicting Protein-Ligand Interactions. ChemMedChem 2018, 13:507-510
da Silva Figueiredo Celestino Gomes, P. et al. Ranking docking poses by graph matching of protein-ligand interactions: lessons learned from the D3R Grand Challenge 2. J Comput Aided Mol Des. 2018, 32:75-87.
Slynko, I. et al. Docking pose selection by interaction pattern graph similarity: application to the D3R grand challenge 2015. J Comput Aided Mol Des. 2016, 30:669-683.
Ruggiu, F. et al. ISIDA Property-Labelled Fragment Descriptors Mol Inf, 2010, 29, 855 - 868
Klimenko, K. et al. Chemical Space Mapping and Structure-Activity Analysis of the ChEMBL Antiviral Compound Set. J Chem Inf Model, 2016, 56, 1438-1454
Gaspar, H. et al. GTM-Based QSAR Models and Their Applicability Domains. Mol Inf, 2015, 34 (6-7), 348-356
Lin, A. et al. Mapping of the Available Chemical Space versus the Chemical Universe of Lead-Like Compounds. ChemMedChem.,2017, 13(6), 540-554
Demande de projet
Les molécules
biologiques constituent une alternative prometteuse aux petits composés
chimiques pour le développement de nouvelles génération de composés
thérapeutiques. Parmi eux, les peptides sont une classe spécifique de molécules
qui sont impliquées dans la signalisation et le trafficking cellulaire, peuvent
agir comme des antibiotiques, ou cibler des interactions protéines-protéines.
Des progrès récents ont été accomplis, entre autres, dans le contrôle de leur
biodisponibilité (résistance à la dégradation), de leur biodistribution (les
voies d'administration sont maintenant variées, et des procédés permettent de
faire penetrer les peptides dans les cellules, voir cibler des lignées
cellulaires specifiques ou des organites cellulaires), et des coûts de production. Plus de 60 peptides sont actuellement sur le marché et plus de 500 sont en phases de développement. Le service proposé porte sur l'identification, la
caractérisation et l'optimisation de « peptides interférants », c'est à dire de peptides capables d'interférer avec une interaction protéine-protéine cible.
Protocoles :
Informations requises :
Les différents cas de figures impliquent une connaissance spécifique de la cible et des mécanismes moléculaires impliqués comme préalable à la définition d'un cahier des charges.
Notes
Les protocoles in silico utilisés repose essentiellement sur des logiciels académiques et les protocoles spécifiques développés par les équipes de la plate-forme.
Références
Bruzzoni-Giovanelli et al.,Interfering peptides targeting protein-protein interactions: the next generation of drugs?, Drug Discov. Today, 2018, 23:272.
Quignot et al.,InterEvDock2: an expanded server for protein docking using evolutionary and biological information from homology models and multimeric inputs. C, Rey J, Yu J, Tufféry P, Guerois R, Andreani J. Nucleic Acids Res., 2018, 46:W408.
de Vries et al., The pepATTRACT web server for blind, large-scale peptide-protein docking., Nucleic Acids Res., 2017, 45:W361.
Lamiable et al., PEP-FOLD3: faster de novo structure prediction for linear peptides in solution and in complex., Nucleic Acids Res., 2016, 44:W449.
Saladin et al., PEP-SiteFinder: a tool for the blind identification of peptide binding sites on protein surfaces., Nucleic Acids Res., 2014, 42:W221.
Thévenet et al., PEP-FOLD: an updated de novo structure prediction server for both linear and disulfide bonded cyclic peptides., Nucleic Acids Res., 2012, 40:W288.
Demande de projet
Malgré le nombre croissant de
modulateurs développés, le taux de succès dans les campagnes de criblages
contre les interfaces protéine-protéine reste faible, principalement en raison
de l'inadéquation des chimiothèques utilisées. Un effort général a donc été
entrepris afin de développer des collections de molécules dédiées à ce type de
cibles.
Protocole
Les propriétés caractéristiques des inhibiteurs de PPIs présents dans la base de données 2P2IDB et iPPIDB peuvent être utilisées pour guider la conception de chimiothèques dédiées aux PPIs en utilisant des méthodes d'apprentissage [1-8]. Les algorithmes d'apprentissage 'SVM' (2P2IHUNTER) et PPI-HitProfiler ont, par exemple, été appliqués aux chimiothèques de deux fournisseurs (MolPort et Ambinter) représentant respectivement 6,3 et 5,7 millions de composés. Les sélections provenant des deux fournisseurs ont été regroupées aboutissant à 63,282 composés uniques. Les deux sélections ont ensuite été filtrées en éliminant les composés indésirables de type PAINS, agrégateurs ou frequent-hitters. Enfin, des filtres optimisés opérant sous contraintes ADME-Tox (Absorption, Distribution, Métabolisme, Excrétion, Toxicité) ont été appliqués afin d'améliorer les propriétés pharmacocinétiques et de chimie médicinale des composés. La chimiothèque finale composée de 10,314 molécules a été mise en plaque.
Une prestation similaire est possible selon les contraintes imposées par le client:
· Développement d'un modèle d'apprentissage propre aux données internes du client (structure de complexes Protéine-Ligand non publiées, résultats d'un premier criblage expérimental interne avec molécules actives et inactives) puis application des meilleurs modèles à la chimiothèque du totale du client. Les touches sont retenues par rapport à un cahier des charges conçu en accord avec le client (ex: présence de groupements chimiques obligatoires, seuil de similarité 2D et/ou 3D). Une liste de ligands également commercialement disponibles (référence commerciale, fournisseur, prix) peut aussi être transmise au client pour évaluation biologique
Informations requises
Structures chimiques des molécules 'propres' au client si nécessité de créer un modèle 'propriétaire'
Chimiothèque à filtrer au format sdf
Notes
Les bases de données et logiciels utilisés sont développés en interne
Références
1. Basse, M.J., et al., 2P2Idb v2: update of a structural database dedicated to orthosteric modulation of protein-protein interactions. Database (Oxford), 2016. 2016.
2. Basse, M.J., et al., 2P2Idb: a structural database dedicated to orthosteric modulation of protein-protein interactions. Nucleic Acids Res, 2013. 41(Database issue): p. D824-7.
3. Hamon, V., et al., 2P2I HUNTER: a tool for filtering orthosteric protein-protein interaction modulators via a dedicated support vector machine. J R Soc Interface, 2014. 11(90): p. 20130860.
4. Hamon, V., et al., 2P2Ichem: focused chemical libraries dedicated to orthosteric modulation of protein-protein interactions. MedChemComm, 2013. 4(5): p. 797-809.
5. Bosc, N. et al. Privileged Substructures to Modulate Protein-Protein Interactions. J Chem Inf Model. 2017 Oct 23;57(10):2448-2462. doi: 10.1021/acs.jcim.7b00435.
6. Reynès, C et al. Designing focused chemical libraries enriched in protein-protein interaction inhibitors using machine-learning methods. PLoS Comput Biol. 2010 Mar 5;6(3):e1000695.
7. Labbé, C.M. et al. iPPI-DB: an online database of modulators of protein-protein interactions. Nucleic Acids Res. 2016 Jan 4;44(D1):D542-7.
8. Labbé, C.M. et al. iPPI-DB: a manually curated and interactive database of small non-peptide inhibitors of protein-protein interactions. Drug Discov Today. 2013 Oct;18(19-20):958-68.
Demande de projet
L'optimisation des propriétés
pharmacocinétiques et ADMET (absorption, distribution, métabolisation,
excrétion, toxicité) est une étape clé dans la phase die "hit to
lead" de génération de têtes de séries à partir de touches de criblages.
ChemBioFrance vous propose de calculer une multitude de ces propriétés afin de
vous guider soit dans la priorisation de touches soit dans leur optimisation.
Protocole
Divers modèles QSAR et d'apprentissages sont disponibles afin de prédire les propriétés suivantes:
Informations requises
Nom et structures 2D des molécules
Notes
Les logiciels utilisés sont soit commerciaux (PipelinePilot, ADMET Predictor), soit développés en interne à ChemBioFrance
Références
Muller C, Pekthong D, Alexandre E, Marcou G, Horvath D, Richert L, Varnek A. Prediction of drug induced liver injury using molecular and biological descriptors. Comb Chem High Throughput Screen. 2015;18(3):315-22