WO2013097012A1 - Inibidores das enzimas poligalacturonases de fungos fitopatogênicos - Google Patents

Inibidores das enzimas poligalacturonases de fungos fitopatogênicos Download PDF

Info

Publication number
WO2013097012A1
WO2013097012A1 PCT/BR2012/000540 BR2012000540W WO2013097012A1 WO 2013097012 A1 WO2013097012 A1 WO 2013097012A1 BR 2012000540 W BR2012000540 W BR 2012000540W WO 2013097012 A1 WO2013097012 A1 WO 2013097012A1
Authority
WO
WIPO (PCT)
Prior art keywords
residues
structures
protein
plant
pdb
Prior art date
Application number
PCT/BR2012/000540
Other languages
English (en)
French (fr)
Inventor
Goran Neshich
Original Assignee
Embrapa - Empresa Brasileira De Pesquisa Agropecuária
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Embrapa - Empresa Brasileira De Pesquisa Agropecuária filed Critical Embrapa - Empresa Brasileira De Pesquisa Agropecuária
Publication of WO2013097012A1 publication Critical patent/WO2013097012A1/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/30Drug targeting using structural data; Docking or binding prediction
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment

Definitions

  • Patent Descriptive Report "INHIBITORS OF PHYTOPATHOGENIC FUNGI POLYGALACTURONASES".
  • the present patent document relates to a method for computationally designing new compounds with potential inhibitory function of the endopolygalacturonase enzyme produced by phytopathogenic fungi and involved in invasion processes of these fungi in plant cells.
  • Special focus is given to soil pathogenic fungus enzymes of the genus Fusarium, which are involved in a variety of plant pathogens and are responsible for a wide spectrum of damage to agriculture.
  • the members of the genus Fusanum are fungi that can cause diseases in plants, humans and animals, and in the latter two they cause diseases acting as opportunistic pathogens or through their toxins (secondary metabolites) causing growth problems, among others.
  • Agricultural disasters caused by such fungi are known, such as the fall in banana production in Panama in the 1960s and billions of dollars lost in wheat and barley in the Midwest.
  • Many plants have at least one Fusanum-associated disease; According to the American Phytopathological Society, in 2006, of the 101 plants listed as economically important at least 81 of them have some disease associated with this pathogen.
  • the phytopathogenicity occurs by the penetration of modified hyphae for invasion of plant tissue through the cell wall, providing intra and intercellular growth.
  • This hyphae penetration is only possible due to the secretion of enzymes (Celi wall-degrading enzymes - CW-DE) by the fungus that hydrolyzes structural molecules that make up the cell wall.
  • enzymes are cutinases, proteases, cellulases, chitin deacetylases, amino acid permeases and polygalacturonases (K. Mandgen, M. Hahn and H. Deising, Morphogenesis and mechanisms of penetration by plant pathogenic fungi, Annu. Rev. Phytopahol, 1996 34: 367-86).
  • Fusarium is the name given to the asexual form (anamorph) of the fungi of this genus and the sexed forms (teleomorphs) are distributed in the genera Gibberella, Haematonectria and Albonectria, being the genus Gibberella the most common because it is related to most species of Fusarium. .
  • the International Code of Botanical Nomenclature recommends that the name of the telephoto be used, and it is permissible to use the name of the anamorph under certain conditions.
  • Fusarium teleomorphs are not commonly found in the field, so the use of anamorph nomenclature is most commonly used (JF Leslie, BA Summerell, The Fusarium Laboratory, Blackwell Publishing, chapters 8-10, pp. 81-100, 2006). .
  • Polygalacturonases are of great importance for the penetration of the microorganism in plant tissues, as they act by catalyzing the cleavage of the galacturonic acid polymers that form the smooth, unbranched region of pectin. Since pectin is the largest component of the plant cell wall, the action of enzymes that break its structure is very deleterious to the whole cell wall structure (NC Carpita and DM Gibeaut, Structural models of primary cell walls in flowering plans-consistency). molecular structure with the physical properties of the walls during growth, Plant J. 3, 1-31, 1993).
  • Polygalacturonases act by catalyzing the hydrolysis of alpha-1,4 bonds between the residues of the ga-lacturonate polymer, turning it into smaller fragments and disrupting the pectin framework of the middle lamella and the primary cell wall favoring the growth of hyphae. of fungus within plant tissues (R. D'vidio, B. Mattei, S. Roberti, D. Bellincampi, Polygalacturonases, polygalacturonase-inhibiting proteins and pectic oligomers in plant-pathogen interactors, Biochim. Biophys. Acta 1696, 237-244, 2004).
  • PG endopoligalacturonase
  • EPG exopoligalacturonase
  • EPGD exopoly-alpha-galacturonosidase
  • polygalacturonases are not only present in phytopathogenic microorganisms, but are also produced by plants and participate in the plant growth and development process, using the same mechanism of breakdown of galacturonic acid polymers and their expression is controlled according to the need of the plant. .
  • the difference between plant polygalacturonases and phytopathogens is small, but it resides in structural particularities as demonstrated by Federici et al in a study on the requirements for the connection between F. moniliform polygalacturonase and PGIP (polygalacturonase-inhibiting protein). ) of Phaseolus vulgaris.
  • Federici and colleagues solved the three-dimensional structure of F.
  • PGIPs are glycoproteins located in the cell wall that reduce the catalytic activity of PGs and can trigger plant defense responses. They belong to the family of proteins with leucine-rich repeat sequence (LRR), related to resistance genes. PGIP production is triggered by the action of pathogens and molecules such as salicylate, jasmonate, oligogalacturonates, and physical factors such as low temperature and damage to plant tissues. PG inhibition by PGIP may be competitive or non-competitive (Cuixia Di, Manxiao Zhang, Shijian Xu, Tuo Cheng, Lizhe An, Role of polygalacturonase-inhibiting protein in plant defense, Critical Review in Microbiology, 32, 91-100 , 2006).
  • a PGIP naturally produced by a particular plant is not capable of inhibiting all forms of polygalacturonases produced by various types of phytopathogens and therefore transgenesis of the inhibitory protein sequence in other plants does not ensure effective protection. Nevertheless, it is interesting to use available PGIPs to study the types of interactions that differentiate plant enzymes from plant pathogens for structural modeling to create inhibitors that do not affect plant enzyme function and plant development, but which at the same time they may be able to inhibit a broader spectrum of phytopathogens than do natural PGIPs.
  • a PGIP is a large molecular weight protein that interacts by contacting a large surface area of PG, mostly with weak interactions, except the negatively charged region that interacts with PGs residues (A Di Matteo, L. Fedreici, B. Mattel, G. Salvi, KA Johnson, C. Savino, Lorenzo, D. Tsernoglou, F. Cervone, The crystal structure of polyglacturonase-inhibiting protein (PGIP), leucine.
  • PGIP polyglacturonase-inhibiting protein
  • Pear PGIP expression in transgenic tomatoes limits the colonization by the fungus Botrytis cinema, which shows the importance of the enzyme in pathogenic activity (ALT Powell, J. van Kan, A. ten Have, J. Visser, LC Greve, AB Bennet). , JM Labavitch, Transgenic expression of pear PGIP in tomato limits fungal colonization, ASP Journals, 13 (9), 942-950, 2000).
  • bean PGIP expression in transgenic wheat conferred resistance to phytopathogenic fungi F. moniliforme and Bipolaris sorokiniana (M. Janni, L.
  • the advantage of a smaller molecule able to bind more closely to the ligand site, which comprises the region with conserved residues, than the natural ligand (galacturonate), but at the same time structurally similar to the natural ligand, is that it can be effective against a wide variety of enzymes without suffering large affinity variations as it does not interact with the unconserved regions of the protein as PGIP does
  • PG endopolygalacturonase
  • this fungus expressed PG even in the plant defense response phase, which reinforces the importance of this enzyme during infection of this fungus, and suggests that it is indispensable for breaking down plant cell barriers (R. Kahmann, C. Basse, Fungai gene expression during pathogenesis-related development and host plant colonization (Current Opinion in Microbiology, London, v. 4, pp 374-380, 2001).
  • Fusarium graminearum is a filamentous fungus widely distributed in plants and soil and the major pathogen of cultivated grains, causing Fusarium head blight (FHB - also known as "scab") in wheat and barley, and leads as cause of damage to these plantations (JF Leslie and BA Summerell, The Fusarium Laboratory Manual, Blackwell, Ames, Iowa, 2006).
  • FHB Fusarium head blight
  • scab Fusarium head blight
  • CDWE secretion slows down fungal growth in the host and the onset of infection (Gisele Eleonora Kikot, Roque Alberto Hours and Maria Maria Alconada, A review of the Journal of Basic Fusarium Graminearum: a review, Journal of Basic Microbiology, 49, 231-241, 2009).
  • the fungus Fusarium oxysporum f. sp. lycopersici causative agent of Fusarium wilt, an extremely common disease in all tomato growing regions and is favored by temperatures between 21 and 33 ° C (optimal at 28 ° C). It produces hyaline macroconidia and hyaline microconidia, in addition to chlamydospores, resistance structures that allow the fungus to survive in the soil for more than 10 years (C. Kurozawa, MA Pavan, Tomato Diseases, in: H. Kimati, L. Amorim, A. Bergami Filho, L. Camargo, J. Rezende, Manual of Plant Pathology, Ed Ceres, 690-719, 1997).
  • Botrytis cine a Botryotinia fuckeliana fungus causes "gray mold" on more than 200 plant species and can cause damage at temperatures below 2 ° C which affects stored vegetables. Infection occurs as a result of: penetration by the surface of the host, formation of primary injury by death of plant tissue, expansion of the lesion with maceration of plant tissue and sporulation. The fungus expresses polygalacturones during infection for penetration and to make room for colonization in the middle lamella (M. Choquer, E. Fournier, C. Kunz, C. Levis, J.
  • Botrytus cinerea virulence factors new insights into a necrotrophic and polyphageous pathogen, minireview, Federation of European Microbiological Letters, 277, 1-10, 2007).
  • fungal PG In tomatoes, fungal PG must be present for full infection to occur, but in its absence infection can still occur, but with much slower expansion.
  • Have A Mulder W, Visser J, van Kan JA.
  • the endopolygalacturonase gene Bcpgl is required for full virulence of Botrytis cinerea Mol Plant Microbe Interact 1998 Oct; 11 (10): 1009-16).
  • Colletotrichum lupini is a causative agent of anthracnose, a disease favored by the warm and humid climate typical of the tropics affecting the crops that grow in this environment, such as hoses and peach palm, for example. In temperate regions it is better known as the lupine pathogen. It infects plants at all stages of development, causing necrosis of their tissues. It also produces polygalacturonase enzymes that assist in cell wall penetration (HI Nirenberg, U. Feiler, G. Hagedorn, Description of Colletotrichum lupini, Nov. in modern terms, Mycologia, 94 (2), 307-320, 2002).
  • Cryphonectria parasitica mainly affects Brazil nuts and is present in most European, Asian, US and Canadian countries. It hits the hosts through wind and rain and is also transmitted by beetles and birds. It causes gangrene in the stem and rust in the chestnuts, evidenced by color change. Between 1904 and 1950, this fungus nearly decimated US nut trees.
  • EPPO quarantine pest Cryphonectria parasitica, Datasheets on Quarantine Pests, www.eppo.org / QUARANTINE / fungi / Cryptoelectric_parasitic / ENDOPA_ds. Df).
  • the phytopathogen Sclerotinia sclerotiorum also known as white mold, is the cause of the "white rot" disease, which affects many plant species of agricultural interest.
  • the major enzymes produced at the time of plant infection, to cross the cell wall barrier is endopoligalacturonase (K. Mendgen, M. Hahn and H. Deising, Morphogenesis and echanisms of Penetration by plant pathogenic fungi, Annul Reviews on Phytopathology, 34, 367-386, 1996).
  • Aspergillus niger has major application in the food and beverage industry using the action of its pectinases, endo and exopolygalacturonases, methyl and acetylesterases, pectinases and pectatoliases, rhamgalacturonases and liases.
  • Bussink et al. Demonstrated in four studies the presence of seven different genes for polygalacturonases in Aspergillus niger N400, which suggests that these enzymes are in great demand and of great importance in the process of breaking down the plant cell wall (Bussink, Kester and Visser).
  • CADD computer-aided drug design techniques
  • -LBDD Ligand-Based Drug Design
  • Important advances in drug production have already been achieved through computational approaches.
  • CADD can predict experimental results with reasonable accuracy in short time compared to more classical methods.
  • CADD methods are already widely used by the pharmaceutical industry to identify new compounds or refine existing compounds that have activity against a biological target.
  • WO2001097098 describes a method for obtaining inhibitory potential molecules from databases containing the structures of the chemical compounds (PubChem), potential effectors. function of enzymes whose activity should be altered, inhibited or potentiated, using docking to select from molecules found in PubChem, based on scores provided by programs such as GOLD that simulate ligand mooring at binding site - target chosen.
  • Document RPI 2036 describes the development of herbicides against a specific enzyme by the docking technique followed by molecular modification of the best scoring ligands, considering spherical and electrostatic properties in the ligand-protein interaction. Finally, the docking results were corroborated by the experimental results.
  • US2002 / 01509061 relates to the use of a computational method for determining protein homology by aligning primary structures between at least two proteins and determining the tertiary structure of one from sequence alignment of a template protein. with three-dimensional structure already solved using the MODELLER program.
  • US 7383135 relates to the development of inhibitors that act in a particular conserved region between proteins of a family of kinases.
  • the work uses an isoform with a resolved three-dimensional structure as a template for resolving the three-dimensional structure of homologous proteins and for designing compounds with potential to bind to the isoform or homologues.
  • FmPG F moniliform PG
  • Botrytionia fuckeliana PG3 Botrytis cinerea
  • Sclerotium sclerotiorum Some fungal PGs are more similar to the other structure-resolved enzyme deposited in the PDB, Colletotrichum lupini PG (CIPG), so it was used as a template for the homology modeling of these PGs.
  • CIPG Colletotrichum lupini PG
  • the challenge of the present work is not only to produce molecules with potential inhibitory of phytopathogen endopolygalacturonases, but also to produce low risk compounds for the exposed population and the environment. This is mainly due to the similarity of the fungi to the tissues of plants and animals, also eukaryotes. For this reason, treatment against fungal infections in the agricultural environment as well as in human and animal health has always been difficult, as the drugs commonly used cause a number of moderate to severe undesirable side effects. Therefore, it is difficult to effectively control these phytopathogenic fungi so that they do not cause great harm to agriculture and animals, including humans.
  • the invention relates to the computational design of novel compounds with inhibitory potential for phytopathogenic fungi Endopoligalacturonases (PG) enzymes in order to prevent or decrease the colonization of these microorganisms in plant tissues.
  • PG is part of a group of enzymes secreted by phytopathogenic microorganisms during the process of invasion of plant tissues, participating in the catalysis of pectin hydrolysis, which culminates in the disruption of the cell wall framework, which favors the invasion of fungal hyphae.
  • a range of phytopathogenic microorganisms use these enzymes as pathogenicity factors that lead to disease in a wide variety of plants of economic interest such as wheat, barley, tomato, strawberry, mango, rice, cane. -sugar, among others.
  • small molecules designed to bind with high affinity to the residues of the substrate binding site are designed.
  • Figure 1 Alignment of the primary structures of the polygalacturonase enzymes used in this work.
  • the fungal sequences used in this alignment were: Fusarium PG moniliform, 17942538, FmPGA; hypothetical Fusari graminearum protein, 46138993, FgPG; from Aspergillus niger, 39654258, AnPGAI and 6435555, AnPGA2; of Fusar ⁇ um oxysporum f. sp.
  • lycopersici 3348099, FoPG; Parasitic Cryphonectria, 1208810, CpPGA; from Cochliobolus carbonum, 167221, CcPG; from Sclerotinia sclerotiorum, 156044128, SsPG; Botrytis cinerea (Botrytinia fuckeliana), 125629516, BfPG1; from Aspergillus flavus, 238490452, AfPG; from Stereum purpureum, 21465803, SpPG1; Colletotridhum lupini, 159794838, CIPGA; and Aspergillus aculeatus, 15988279, AaPGA.
  • Botrytis cinerea Botrytinia fuckeliana
  • plant PGs sequences were used to verify the conservation of the most important residues involved in catalysis and the existence of other residues that are unique to fungal PGs and are spatially close to the site.
  • catalytic / binder which could indicate the presence of additional and preferred targets, as a compound that binds strongly to a specific fungal residue is unlikely to cause binding effects on plant PG.
  • Vegetable PGs used were: from Arabidopsis thaliana, 15230328, AtPG_Plant; Brassica rubra, 21530799, BrPG_Plant and Solanum lycopersicum, 7381227, SIPG_Plant.
  • residues N189, D191, D212, D213, H234.G235, R267, K269 and T302 are well preserved.
  • residues highlighted by black-bordered transparent bars (H188, D 194 and G305) are the residues considered as "preferred targets", since they are close to catalytic and substrate binding residues, but have a restricted occurrence to phytopathogenic fungi PGs, not existing in plant PGs.
  • Figures 2A and B Alignment of F. monyliform enzyme structure (1 HG8) (gray) fungal enzymes (black) Stereum purpureum (K5C, figure 2a) and Colletotrichum lupini (2IQ7, figure 2b) obtained from Protein Data Bank.
  • the alignments were made with the PyMol program, also used to generate molecular images (WL Delano, The PyMol molecular graphics system Delano Scientific, San Carlos, CA, USA, http://www.pymol.com.org) and TM-align, also used to provide RMSD data and TM-score on quality of alignments (Yang Zhang, J.
  • Figure 3 Alignment of the tertiary structure of FmPG (1 HG8.pdb) and SpPG (I KCD.pdb) enzymes made in PyMol and imported by MVD for imaging.
  • Figure 3 A) highlights the monolacturonate residue positioned at the catalytic site (D191, D213 and D213 appear as fine lines) and the residues that are part of the ligand site (H234, R267 and K269, not shown in the figure), the latter adopted as targets for inhibition.
  • SpPG monogalacturonate I KCD.pdb
  • the gray scale figure represents the catalytic and binder regions of the enzyme FmPG (1 HG8.pdb). This is the ligand that presented the best results. of interaction between specific residues of fungal PGs: D194, H188 and G305, in both 1 HG8 and 2IQ7 (Tables 6 and 7). It has chemical groups that give different polarities to each end of the structure of this molecule which makes it fit in the region of the ligand and catalytic site through electrostatic complementarity.
  • the catalytic region is predominantly negative and in the image appears as medium shade gray; the mostly positive ligand region appears in the image as the darker gray; the light gray regions are supporting.
  • Ligand 602 positioned at 1 HG8 target site. This is the binder that presented the best interaction results with the conserved residues of the substrate binding site: H234, R267, K 269 and Y302, presenting very negative energies with these residues in both 1 HG8 and 2IQ7 docking (tables 6 and 7). This ligand also stood out in the ADMET analysis (Table 8), presenting good cLogP values, solubility, Druglikeness, Drug-score and, especially, no risk of toxic effect.
  • the present invention relates to a method for designing new compounds with potential inhibitory function of the endopolygalacturonase enzyme produced by phytopathogenic fungi and involved in invasion processes of these fungi in plant cells.
  • a special focus is given to soil pathogenic fungal enzymes involved in a range of plant pathogens and responsible for the broad spectrum of damage to agriculture.
  • the proposed method consists of the following steps:
  • BLAST provides data on the characteristics of primary sequence alignment characteristics such as: identities (percent identical amino acids at corresponding positions), positive (are identical amino acid number plus amino acid number are not identical between two sequences at given position but have similar properties, considered to be a "Positive” because it indicates substitutions in which the BLOSUM-62 matrix scores positively according to Altshul et al. (1997) .
  • the gaps indicate the number of regions that represent gaps in alignment (either due to insertions and deletions in the evolutionary history of genes.
  • the e-value (Expect Value) column represents a statistical parameter of the BLAST program that indicates the number of different alignments that would occur in a database by chance with a score equal to or better than that obtained for The lower the e-value, the more significant the score obtained in the alignment.
  • Sali Comparative protein structure modeling with MODELLER, Current Protocols in Bioinformatics, John Wiley & Sons, Inc. Supp 15, 5.6.1-5.6.30, 2006
  • the purpose of the models would be to compare the positions of amino acids of interest in the tertiary structures. From the alignment between the sequence to be modeled and a similar known structure in terms of primary sequence, the program generates a three-dimensional model (in a homology modeling procedure).
  • the structures are edited optimizing the residual sequence numbering, among other actions (Guex, N. and Peitsch, MC SWISS-MODEL and the Swiss-Pdb).
  • - Viewer An Environment for Comparative Protein Modeling (Electrophoresis 18: 2714-2723, 1997).
  • GRO-MACS is used to minimize energy from the generated models. By minimizing energy, the amino acids in the models adopt more energy-friendly conformations, which makes the model closer to a real conformation (D. Van Der Spoel, E. Lindhal, B. Hess, G.
  • Ramachandran data is generated via the STING platform Java Protein Dossier (Neshich, G., Togawa, R., Mancini, A.L, Kuser, PR, Yamagishi, MEB, Pappas Jr., G., Torres, WV, Campos, TR, Ferreira, L.L, Luna, R.M., Oliveira, AG, Miura, R.T, Inoue, MK, Horita, LG, de Souza, D.R., Dominiquini, R., Alvaro, A., Lima, CS, Ogawa, R.O., Gomes, BG, Palandrani, JC R., Santos, G.R, Freitas, EM, Mattiuz, AR, Costa, I.
  • Java Protein Dossier Neshich, G., Togawa, R., Mancini, A.L, Kuser, PR, Yamagishi, MEB, Pappas Jr., G., Torre
  • TM-score uses the Levitt-Gerstein factor which considers the pairs of residuals at shorter distances as more relevant than those at longer distances and is also more sensitive to general topology than localized structural variations.
  • TM-score is normalized so as not to be dependent on protein size, its value can range from 0.0 to 1.0, with values greater than 0.17 indicative of high structural similarity (Yang Zhang, J. Skolnick, TM-align: a protein). structure alignment algorithm based on the TM-score, Nucleic Acid Research, 33 (7): 2302-2309, 2005).
  • Stochastic and Systematic by Molecular Dynamics and Genetic / Evolutionary Algorithms.
  • the Stochastic and Systematic search method for ligands is widely used and varied.
  • the DOCK program for example, uses a method based on random conformations; FLEXX is based on the conformational space of the active site.
  • the Molecular Dynamics method used by AUTODOCK calculates the various conformations that the target protein can adopt during interaction with the ligand.
  • MVD uses the MolDcok algorithm which is based on Evolutionary Algorithm (a variety of Stochastic and Systematic Method) to simulate ligand-protein interactions.
  • Evolutionary algorithms can be defined as a group of computational approximations based on the concepts of Darwin's Theory of Evolution.
  • MolDock is an implementation of the evolutionary algorithm focused on molecular docking simulations, where computational approximations of an evolutionary process are applied to simulate the permanence of the most favorable characteristics (Thomsen R, Christensen MH .: MolDock: a new technique for high- molecular accuracy docking J Med Chem 2006 Jun 1.49 (11): 3315-21. WF By Azevedo Jr., MolDock applied to struc- virtual-based virtual screening, Current Drug Targets, 11 (3): 327-334, 2010). Studies comparing the most commonly used programs indicate that evolutionary algorithm-based programs such as GemDock and MolDock have better overall performance than Flexx, GOLD and Surflex (R.
  • Osiris Property Explorer online tool Thomas Sander, Actelion Pharmaceuticals Ltd., http://www.organic-chemistry.org/prog) / pao /
  • the Osiris program provides toxicity risk data: mutagenicity, tumorogenicity, irritant and reproductive effect, based on fragments of known molecules deposited in the RTECS database.
  • the fungal PGs whose three-dimensional structures are resolved and deposited in the PDB, are: Fusarium moniliform (1 HG8), Aspergillus aculeatus (1AI5), Aspergillus niger (1 NHC, PG1; 1 CZF, PG2), Colletotrichum lupini (2IQ7) and Stereum purpureum (1 K5C; 1 KCD - PG in complex with two galacturonate residues).
  • Table 1 Results obtained with BLASTp between FmPG (1 HG8) and NCBI NR Bank Sequences (www.ncbi.nlm.nih.gov), with hits reported against Gibberella and other Fusarium. Data are provided for the characteristics of the BLAST primary sequence alignment, such as: identities (percentage of identical amino acids at corresponding positions), positive (are the identical amino acid number plus the number of non-identical amino acids between two sequences at a given position, but have similar properties, considered as a "Positive” because it indicates substitutions in which the matrix BLOSUM-62 scores positively according to Altshul et al. 1997; SF Altschul, TL Madden, AA Schffer, Z Zhang, W Miller, DJ Lipman.
  • the gaps column indicates the number of regions that represent gaps in alignment (whether due to insertions and deletions in the evolutionary history of genes) and, finally, the e-value (Expect Value) column that represents a statistical parameter of the BLAST program that indicates the number of different alignments that would occur in a database by chance with a score equal to or better than that obtained for a given alignment. The lower the e-value, the more significant is the score obtained in the alignment in question.
  • Table 2 BLASTp results against NCBI NR protein sequence database using the query sequence Colletotr ⁇ chum lupini PG (CIPGA, PDB 2IQ7_A). The hits results found for the PG sequences of the economically important fungi described in the "State of the Art" section are shown. Some are annotated with PDB codes, which indicates that their structure has already been resolved. The description of the columns follows the pattern of table 1.
  • Table 3 Results obtained with the BLASTp program using as the search sequence the primary structure of FmPG (1 HG8.pdb) and CIPGA (2IQ7.pdb) against the NCBI NR protein sequence bank filtered for Viridiplantae sequences ( taxid 33090).
  • the design of antimicrobial drugs should be based on targets that are essential, mainly found in pathogens (relative to non-pathogenic organisms, and the host), have a unique function in the pathogen and are likely to be inhibited by small molecules.
  • the target protein PG is essential for the pathogenicity of these fungi, is inhibitible, as has been demonstrated practically by studies with PGIP, and we suggest below residues to be used as preferred targets as they exist specifically in Fungi PGs and absent in plant ones.
  • His188, Asp194 and G305 residues were found, which were chosen as "preferred targets".
  • the His188 residue is considered to be one of the most important in terms of PGs protein inhibitor (PGIP) interaction in PGs inhibition, as shown by Federici et al. (L. Federici, C. Caprari, B. Mattei, C Savino, A. di Mateo, Lorenzo G., F. Cervone, D. Tsernoglou, Structural Requirements of Endopolygalacturonase for the Interaction with PGIP, PNAS, 98 (23), 13425-13430, 2001).
  • Federici et al. L. Federici, C. Caprari, B. Mattei, C Savino, A. di Mateo, Lorenzo G., F. Cervone, D. Tsernoglou, Structural Requirements of Endopolygalacturonase for the Interaction with PGIP, PNAS
  • z-score values were -7.75, -7.54, -7.29, -7.04, -7.88, -7.58, - 7.59, respectively for modeled PGs of Fusarium oxysporum f. sp. lycopersici, F. graminearum, Aspergillus flavus, Botrytis cinerea, Cochlobus carbonum, Crypphonectria parasitica and Sclerotinia sclerotiorum; and the Colletotrichum lupini (CIPG) enzyme z-score was -7.59.
  • CIPG Colletotrichum lupini
  • moniliform PG and the structures deposited in the PDB are shown in figures 2a, 2b, 2c, 2d and 2e focusing on the important ligand site residues (H234, R267, K269 and Y302) and the general overlap. of the structures.
  • the values provided by the TM-align are the RMSD and the TM-score, the former calculating the quadratic average of the distance between the corresponding residues considering only the distances between pairs of residues and being influenced by protein size, not taking into account your topology.
  • the TM-Score is calculated taking into account the topology of the overlapping structures, which is quite important since most protein interactions are influenced by the topology.
  • Table 4 RMSD and TM-Score values resulting from structural alignment between the structures of fungal PGs and FmPG enzyme (1 HG8.pdb).
  • the RMSD provides the quadratic average of the distances between matched pairs of residues after one structure overlaps with another.
  • the TM-score uses the Levitt-Gerstein factor which considers the pairs of residuals at shorter distances as more relevant than those at longer distances and is also more sensitive to general topology than localized structural variations.
  • TM-score is normalized so as not to be dependent on protein size, its value can range from 0.0 to 1.0, with values greater than 0.17 indicative of high structural similarity (Yang Zhang, J. Skolnick, TM-align: a protein).
  • Table 5 RMSD and TM-Score values resulting from structural alignment between the modeled structures of fungal PGs and the structures
  • F. moniliforme PG F. moniliforme PG
  • SpPG S. Purpureum PG
  • purpureum showed good amino acid overlap at the site of interest; and also that the position of the crystallized galacturonate in complex with SpPG1 corresponds to the position obtained by ligands on docking with FmPG, which validates the technique for ligand mooring at the protein target site ( Figure 3) and can be considered a positive control. of the methodology.
  • Functional sites can be analyzed as a physicochemical nano- environment that accompanies a function rather than as a fixed residue group.
  • the substrate binding site constituent amino acids for these structures were identified according to their presence by establishing interactions with the galacturonate molecule in the SpPG structure (PDB 1 KCD).
  • Binders were also designed to target residues D194, H188 and G305, which are preserved only in fungi; plants have proline / leucine in place of histidine and histidine / threonine in place of aspartate.
  • the strategy for designing these ligands was based on observing the position of all amino acids in the ligand site and confirming strict fungal conservation through various alignments made using CLUSTALw between primary fungal and plant structures (only some plant sequences are shown in Figure 1). All the designed structures were then submitted to docking simulations with the FmPG structure, code PDB 1 HG8.
  • the docking was performed using the Molegro Virtual Docking (MVD) program (Thomsen R, Christensen MH .: Moldock: a new technique for high molecular accuracy docking. J Med Chem. Jun 1; 49 (11): 3315-21 , 2006.), which is based on an evolutionary algorithm to simulate ligand-protein interactions.
  • MMD Molegro Virtual Docking
  • MolDock Score was the algorithm used to calculate the score, using a Grid resolution of 0.3 ⁇ (the binder was evaluated by internal hydrogen bridge interactions, electrostatic interactions and Sp 2 -Sp 2 twists). .
  • the search and docking algorithm used was the MolDock Optimizer (which is an implementation of a variation of the evolutionary algorithm), with 10 rounds, population size 50 and 2000 iterations.
  • the MVD performed Energy Minimization and Optimization of the hydrogen bridges of the "poses" (one pose being a candidate bonding mode) obtained.
  • Energy values in interaction with target residues are lower for designed ligands, as are MolDock score, protein interaction, hydrogen interactions and LE1 (MolDock score divided by number of ligand atoms, except hydrogens), meaning that the complex formed between computationally designed compounds and even more stable.
  • Table 6 Interaction energy values (in Kcal / mol) between ligands and conserved residues among all PGs (H234, R267, K269 and Y302), sum of interaction energies established between ligands and fungus-specific residues (H188, D194 and G305) and Moldock score (total ligand energy), Protein (total ligand-protein interaction energy), Hbond (energy from hydrogen interactions) and LE1 (MolDock value divided by number of heavy atoms (except hydrogen) provided by Molegro Virtual Docker in the Ligand Energy Inspector module. These results were obtained from the docking simulation of ligands designed with the search space centered on the FmPG catalytic site.
  • Table 7 Values provided by the docking of ligands designed with centralized search space in the CIPGA catalytic site (2IQ7.pdb), as per table 6. because it served as a template for making models for enzymatic sequences that did not have a resolved tertiary structure and because of their greater similarity and identity. It is observed that the total interaction energy values between residues H221, R254, K256, Y289 are smaller (same residues of 1 HG8 mentioned in table 6, but with different numbering, now corresponding to the numbering found in 2IQ7.pdb) and the designed ligands compared to the galacturonate values, suggesting that the binding of the designed compounds to these residues may be more stable.
  • the drug score gives a general value that considers all the previous parameters.
  • the results of the analysis are shown in Table 8.
  • High water solubility is also desirable, as it favors the application of the product in agriculture and remains superficially in the plant, which is interesting because several fungi reach the plant from the surface. It is also possible an application with water in the soil, which would be absorbed by the roots (another gateway to fungal infections) and spread to other points of the plant by Xylem.
  • high water solubility also favors diffusion through the plant vascular network when it is of interest that the compound acts to inhibit plant PGs.
  • Osiris provides animal toxicity data such as risk of mutagenicity, tumorogenicity, reproductive effect and irritation based on molecular fragments with known toxicities stored in database (RTECS).
  • Table 8 Results of ADMET analysis performed by Osiris Property Explorer (http://www.organic-chemistry.org/prog/peo/) with toxicity risk data such as mutagenicity, tumorgenicity, irritability and possible effects reproductive side effects, based on fragments of known molecules deposited in the RTECS database.
  • This program provides a LogP value, the partition coefficient between water and n-octanol, which measures hydrophobicity (the higher the value, the greater the solubility of the compound in lipids). In the case of plants and because it is a surface compound (it does not need to be absorbed to act), having a low LogP can be a good thing as it will be less absorbed and less distributed in animal tissues.
  • a value of LogS solubility
  • Drug-score which is a general value resulting from the combination of all of the above parameters plus Druglikeness, which compares fragments of the designed compound against marketed compound database and non-drug compound database (Fluka). . It is desirable that both Druglikeness and Drug-score are positive.
  • the first compound, dh3211 obtained excellent interactions with the fungi-specific residues H188, D194 and G305 and the second, 602, with the residues H234, R267 and K269, which are conserved residues even in plants, as can be seen.
  • 602 was also highlighted in the ADMET analysis (table 8). Both can be considered as good potentials for inhibition of fungal enzymes, but the higher affinity specific to dh3211 fungal PGs in the simulations made indicates that this compound has a safer use potential compared to 602, because the residues with which Better interacts are not present in plants.

Abstract

A presente invenção se refere a um método para desenhar computacionalmente novos compostos com potencial função inibitória da enzima endopoligalacturonase e envolvida em processos de invasão em células vegetais. Notadamente, uma das principais aplicações desta tecnologia consiste no desenvolvimento de inibidores de enzimas de fungos patogênicos de solo do género Fusarium, envolvidos em uma série de fitopatogenias, responsáveis por grandes prejuízos à agricultura.

Description

Relatório Descritivo de Patente de Invenção: "INIBIDORES DAS ENZIMAS POLIGALACTURONASES DE FUNGOS FITOPATOGÊNICOS".
CAMPO DA INVENÇÃO
O presente documento de patente refere-se a um método para desenhar computacionalmente novos compostos com potencial função inibitória da enzima endopoligalacturonase produzida por fungos fitopatogênicos e envolvida em processos de invasão destes fungos em células vegetais. Um enfoque especial é dado às enzimas de fungos patogênicos de solo do género Fusarium, envolvidos em uma série de fitopatogenias e responsáveis por amplo espectro de prejuízos à Agricultura.
ESTADO DA TÉCNICA
Grande parte das doenças de plantas que causam prejuízos para a agricultura brasileira e mundial é causada por fungos fitopatogênicos, e a maioria deles de solo. Seria ideal a redução do potencial patogênico des- tes fungos em áreas infestadas de forma a permitir o plantio. Uma medida que tem sido utilizada é a de incorporação de matéria orgânica no solo, já que a introdução de antagonistas é uma medida de controle biológico. Entretanto, os índices de controle obtido com este método, isoladamente, podem estar abaixo do necessário para impedir danos à cultura (W. Bettiol, R. Ghini, Controle Biológico. In: A. ergamim Filho, Kimati, L. Amorin, Manual de Fito- patologia - Princípios e Conceitos. 3 edição. São Paulo: Agronómica Ceres, 1995. p. 717-728).
O uso e desenvolvimento de cultivares resistentes seria uma melhor opção de controle destas doenças, todavia, muitos hospedeiros não apresentam resistência a esses patógenos. A funcionalidade nem sempre é possível, devido à inexistência no mercado, de cultivares com todas as características desejadas (M.M.Q. Ambrósio, Sobrevivência em microcosmo e em campo solarizado de fitopatógenos submetidos à fermentação acelerada de diferentes materiais orgânicos. Tese (Doutorado em Agronomia) Faculda- de de Ciências Agronómicas da UNESP, Botucatu-SP, 2006).
Existem métodos de controle químico contra os fungos fitopatógenos, como por exemplo, o realizado, até há pouco tempo, com um agrotó- xico de amplo espectro, o brometo de metila utilizado nos últimos 60 anos como fumigante de solo em pré-plantio. Embora altamente eficaz, rápido, fácil penetração no solo, amplo espectro e baixa resistência dos fungos foi comprovado que este confere riscos para o ambiente, para o homem e para a camada de ozônio (R. Ghini, Alternativas para substituir o brometo de metila na agricultura. Summa Phytopathologica, Jaboticabal, v. 27, n. 1 , p. 162, 2001).
Os membros do género Fusanum são fungos que podem provocar doenças em plantas, humanos e animais, sendo que nesses dois últimos provocam doenças atuando como patógenos oportunistas ou através de suas toxinas (metabólitos secundários) causando problemas de crescimento, dentre outros. São conhecidos desastres agrícolas causados por fungos desse género, como a queda em produção da banana no Panamá, na década de 60 e bilhões de dólares perdidos em trigo e cevada no meio-oeste nor- te-americano. Muitas plantas têm pelo menos uma doença associada ao Fusanum; segundo o American Phytopathological Society, em 2006, das 101 plantas listadas como economicamente importantes pelo menos 81 delas têm alguma doença associada a esse patógeno. Os fungos desse género atacam plantas em qualquer estágio de desenvolvimento causando podridão de caules, raízes, sementes e frutos, doenças de folhas, gangrenas e mur- chamentos (J.F. Leslie, B.A. Summerell e S. Bullock. The Fusarium labora- tory manual, Wiley-Blackwell, 2006). Segundo a Food and Agriculture Orga- nization of the United Nations, estima-se que cerca de 50% das perdas agrícolas no mundo se devem ao Fusarium (L. Gilchrist, H.J. Dubin, Fusarium Head Blight, http://www.fao.org/docrep/006/y4011e/y4011e0j.htm, acessado em janeiro de 2010). A fitopatogenicidade se dá pela penetração de hifas modificadas para invasão de tecido vegetal através da parede celular, propiciando crescimento intra e intercelular. Esta penetração das hifas só se faz possível devido à secreção de enzimas {Celi wall-degrading enzymes - CW- DE) pelo fungo que hidrolisam moléculas estruturais que constituem a parede celular. Essas enzimas são cutinases, proteases, celulases, quitina deacetilases, aminoácido permeases e poligalacturonases (K. Mandgen, M. Hahn e H. Deising, Morphogenesis and mechanisms of penetration by plant pathogenic fungi, Annu. Rev. Phytopahol, 1996 34:367-86). Fusarium é o nome dado a forma assexuada (anamorfo) dos fungos desse género e às formas sexuadas (teleomorfos) são distribuídas nos géneros Gibberella, Ha- ematonectria e Albonectria, sendo o género Gibberella o mais comum por estar relacionado a maioria das espécies de Fusarium. O International Code of Botanical Nomenclature recomenda que seja utilizado o nome do teleo- morfo, sendo permitido empregar o nome do anamorfo sob certas condições. Porém, os teleomorfos de Fusarium não são comumente encontrados em campo, então é mais empregado o uso da nomenclatura do anamorfo (J.F. Leslie, B.A. Summerell, The Fusarium Laboratory, Blackwell Publishing, capítulos 8-10, págs. 81-100, 2006).
As poligalacturonases são de grande importância para a penetração do microrganismo nos tecidos vegetais, pois agem catalisando a cli- vagem dos polímeros de ácido galacturonico que formam a região lisa, sem ramificações, da pectina. Sendo a pectina o maior componente da parede celular vegetal, a ação de enzimas que agem quebrando sua estrutura é bastante deletéria para a estrutura da parede celular como um todo (N.C. Carpita e D.M. Gibeaut, Structucral models of primary cell walls in flowering plans-consistency molecular structure with the physical properties of the walls during growth, Plant J. 3, 1-31 , 1993). As poligalacturonases agem catalisando a hidrólise das ligações alfa-1 ,4 entre os resíduos do polímero de ga- lacturonato, transformando-o em fragmentos menores e desestruturando o arcabouço de pectina da lamela média e da parede celular primária favore- cendo o crescimento de hifas do fungo dentro dos tecidos da planta (R. D'0- vidio, B. Mattei, S. Roberti, D. Bellincampi, Polygalacturonases, polygalactu- ronase-inhibiting proteins and pectic oligomers in plant-pathogen interacti- ons, Biochim. Biophys. Acta 1696, 237-244, 2004). Há três tipos de poligalacturonases: endopoligalacturonase (PG), exopoligalacturonase (EPG) e a exopoli-alfa-galacturonosidase (EPGD), que diferem no modo de ação na catálise da hidrólise da pectina. A PG catalisa randomicamente os resíduos de ácido galacturonico gerando fragmentos de oligogalacturonato, enquanto que a EPG remove um único resíduo de ácido galacturônico da extremidade não redutora do fragmento, completando dessa forma a quebra do oligômero em monômeros de galacturonato; a EPGD catalisa a hidrólise de dois resíduos de galacturonato a partir da extremidade não redutora do polímero (O. Markovic e S. Janecek, Pectin degrading glycoside hydorlases of family 28: sequence-structural features, spefcificities and evolution, Protein Eng. 14, 615-631 , 2001).
Contudo, as poligalacturonases não estão presentes apenas em microrganismos fitopatogênicos, como também são produzidas pelas plantas e participam no processo de crescimento e desenvolvimento da planta, utilizando o mesmo mecanismo de quebra dos polímeros de ácido galacturônico e sua expressão é controlada conforme a necessidade da planta. A diferença entre as poligalacturonases vegetais e as de fitopatógenos é pouca, mas reside em particularidades estruturais como demonstrado por Federici et al em um estudo sobre os requisitos para que ocorra a ligação entre poligalac- turonase de F. moniliforme e PGIP {polygalacturonase-inhibiting protein) de Phaseolus vulgaris. Nesse trabalho, Federici e colaboradores resolveram a estrutura tridimensional da poligalacturonase do F. moniliforme e também analisaram as diferenças de interação entre PGIP e PG com resíduos do sítio catalítico e ligante modificados. Foram mais relevantes para a interação os resíduos do sítio de ligação His 88, Arg267 e Lys269. Além desses resíduos também se notou diferença em um aminoácido estrutural: em fitopatógenos geralmente ocorrem aminoácidos com resíduos hidrofóbicos e de pequeno volume na posição 270, porém em vegetais encontra-se aminoácidos com resíduos hidrofóbicos volumosos, o que pode interferir na interação do PGIP com a PG vegetal, de forma a não ser por ele inibida (L. Federici, C. Caprari, B. Mattei, C. Savino, A. di Mateo, G. De Lorenzo, F. Cervone, D. Tsernoglou, Structural requirements of endopolygalacturonase for the inte- raction with PGIP, PNAS, 98(23), 13425-13430, 2001). No trabalho citado, foi feita ainda uma troca de aminoácidos (não volumoso por um volumoso - serina por triptofano) nessa posição da sequência do F. moniliforme e obser- vou-se que com a troca não houve interação com o PGIP, o que reforça a idéia de que o tamanho do resíduo do aminoácido na posição 270 interfere na interação entre PG e PGIP.
As PGIPs são glicoproteínas localizadas na parede celular que reduzem a atividade catalítica das PGs e podem desencadear respostas de defesa das plantas. Pertencem à família de proteínas com sequência rica em repetições de leucina (leucine-rich repeat - LRR), relacionadas a genes de resistência. A produção de PGIP é desencadeada pela ação de patógenos e moléculas como salicilato, jasmonato, oligogalacturonatos, e fatores físicos como baixa temperatura e estabelecimento de lesões nos tecidos da planta. A inibição da PG pelo PGIP pode ser competitiva ou não competitiva (Cuixia Di, Manxiao Zhang, Shijian Xu, Tuo Cheng, Lizhe An, Role of polygalacturo- nase-inhibiting protein in plant defense, Criticai Review in Microbiology, 32, 91-100, 2006). Um PGIP produzido naturalmente por determinada planta não é capaz de inibir todas as formas de poligalacturonases produzidas pe- los diversos tipos de fitopatógenos e por isso a transgênese da sequência dessa proteína inibidora em outras plantas não assegura proteção efetiva. Não obstante, é interessante utilizar os PGIPs disponíveis para se estudar os tipos de interações que diferenciam enzimas vegetais das de fitopatógenos para a modelagem de estruturas com o intuito de criar inibidores que não afetem o funcionamento da enzima das plantas e o desenvolvimento vegetal, mas que ao mesmo tempo possam ser capazes de inibir um espectro maior de fitopatógenos do que o fazem os PGIPs naturais. Além disso, um PGIP é uma proteína de grande peso molecular, que interage entrando em contato com grande área superficial da PG, na maior parte com intera- ções fracas, exceto a região carregada negativamente que interage com os resíduos no 267_RIK das PGs (A. Di Matteo, L. Fedreici, B. Mattel, G. Salvi, K.A. Johnson, C. Savino, G. De Lorenzo, D. Tsernoglou, F. Cervone, The crystal structure of polyglacturonase-inhibiting protein (PGIP), a leucine-rich repeat protein involved in plant defense, PNAS, 100(17):10124-10128, 2003), o que faz com que qualquer sensível diferença de superfície que as enzimas de fitopatógenos tiverem já não as deixam ser inibidas pelo PGIP e, por essa razão, as diferenças que as PGs têm entre si, mesmo que fora do sítio ligante, podem interferir na interação com o PGIP. A vantagem de um ligante relativamente pequeno e que explore apenas as áreas conservadas que existem nas PGs é a de que este pode interagir com várias PGs diferentes, pois mesmo as PGs produzidas por microrganismos de espécies e gê- neros diferentes mantêm bastante conservados os resíduos envolvidos na ligação com o substrato.
Até o presente momento, no que diz respeito à inibição da enzima poligalacturonase, há apenas trabalhos voltados para a engenharia genética publicados na literatura científica. A expressão de PGIP de pêra em tomate transgênico limita a colonização pelo fungo Botrytis cinema, o que evidencia a importância da enzima na atividade patogênica (A.L.T. Powell, J. van Kan, A. ten Have, J. Visser, L.C. Greve, A.B. Bennet, J.M. Labavitch, Transgenic expression of pear PGIP in tomato limits fungai colonization, ASP Journals, 13(9), 942-950, 2000). Em outro notável trabalho, a expressão de PGIP de feijão em trigo transgênico conferiu resistência a fungos fitopatogê- nicos F. moniliforme e Bipolaris sorokiniana (M. Janni, L. Sella, F. Favaron, A.E. Blechl, G. De Lorenzo, R. DOvidio, The expression of a bean PGIP in transgenic wheat confers increased resistance to the fungai pathogen Bipolaris sorokiniana, MPMI, 21 (2), 171-199, 2008). Portanto, a inibição bem suce- dida das poligalacturonases afeta a invasão do microrganismo nos tecidos vegetais. Porém, apesar de efetivo por um tempo, é sabido que as pestes podem desenvolver resistência mesmo aos organismos transgênicos, cujas PGIPs não interagem apenas com o sítio ligante do substrato natural, mas com uma região menos conservada e por isso mais susceptível a variações. A vantagem de uma molécula menor capaz de se ligar com maior afinidade ao sítio ligante, que compreende a região com resíduos conservados, do que o ligante natural (galacturonato), mas sendo ao mesmo tempo estruturalmente semelhante ao ligante natural, é a de que pode ser eficaz contra uma grande variedade de enzimas sem sofrer grandes variações de afinidade, pois não interage com as regiões não conservadas da proteína assim como o faz o PGIP
A expressão de genes de endopoligalacturonase (PG) em Fusa- rium moniliforme na ocasião da infecção em cana-de-açúcar foi avaliada por recentes trabalhos (R. Mendes, Diversidade e caracterização genética de comunidades microbianas endofíticas associadas à cana-de-açúcar. 119p. Tese - Doutorado em Genética e Melhoramento de Plantas - Escola Superi- or de Agricultura "Luiz de Queiroz", Universidade de São Paulo, Piracicaba- SP, 2008) e verificou-se que a enzima está presente neste fungo em todos os estágios da infecção: desde o contato inicial com a planta hospedeira até a aquisição de nutrientes e fase necrótica. Interessantemente, este fungo expressou a PG mesmo na fase de resposta à defesa da planta, o que refor- ça a importância desta enzima durante a infecção deste fungo, e sugere que esta seja indispensável para romper as barreiras celulares da planta (R. Kahmann, C. Basse, Fungai gene expression during pathogenesis-related development and host plant colonization. Current Opinion in Microbiology, London, v. 4, p. 374-380, 2001).
Outros fungos fitopatogênicos de importância económica mencionados neste documento, com a finalidade de estabelecer semelhanças que possibilitem o emprego das moléculas propostas em tratamento anti- fúngico de amplo espectro, são: Fusarium graminearum, Fusarium oxyspo- rum f. sp. lycopersici, Botrytis cinerea (Botryotinia fuckeliana), Colletotrichum lupini, Cryphonectria parasitica Sclerotinia sclerotiorum, Aspergillus niger, A. Aculeatus, A. flavus e Stereum purpureum.
O Fusarium graminearum é um fungo filamentoso amplamente distribuído em plantas e solo e o maior patógeno de grãos cultivados, sendo o causador do Fusarium head blight (FHB - conhecido também como "scab", ou sarna) no trigo e na cevada, e lidera como causa de prejuízos nestas plantações (J.F. Leslie e B.A. Summerell, The fusarium laboratory manual, Blackwell, Ames, lowa, 2006). Em publicação da Food and Agriculture Orga- nization of The United Nations (FAO) estima-se de que o FHB seja responsável por cerca de 50% das perdas agrícolas mundiais (L. Gilchrist, H.J. Du- bin, Fusarium head blight, em Bread Wheat, FAO Plant Production and Pro- tection Series n°30, 2002, http://www.fao.org/docrep/006/y4011e/y4011e0j.htm). Trinta e dois genes desse fungo codificam para enzimas envolvidas na degradação de parede celular vegetal (Cell wall-degrading enzymes - CDWE) que ocorre durante a invasão pelo fungo. Esses genes, dentre outros, são expressos exclusivamente durante a infecção (CA. Cuomo, U. Gulgener, Jin-Rong Xu, F. Trail, B. Gillian Turgeon, A. Di Pietro, J.D. Wallow, Li-Jun Ma, S.E. Baker, M. Rep,
G. Adam, J. Antoni, T. Baldwin, S. Calvo, Yueh-Long Chang, D. DeCaprio, L.R. Gale, S. Gnerre, R.S. Gaswani, K. Hammond-Kosack, L.J. Harris, K. Hilburn, J.C. Kennell, S. Kroken, J.K. Magnuson, G. Mannhaupt, E. Mauceli,
H. W. Mewes, R. Mitterbauer, G. Muehlbauer, M. Miinsterkõtter, D. Nelson, K. 0'Donnell, T. Ouellet, W. Qi, H. Quenesville, M.I.G. Roncero, Kye-Yong Se- ong, I.V. Tetko, M. Urban, C. Waalwijk, T.J. Ward, Jiqiang Yao, B.W. Birren, H.C. Kistler, The Fusarium graminearum genome reveals a link between lo- calized polymorphism and pathogen specialization, Science 317, 1400, 2007). A redução de secreção das CDWE retarda o crescimento do fungo no hospedeiro e o estabelecimento da infecção (Gisele Eleonora Kikot, Roque Alberto Hours e Teresa Maria Alconada, Contribution of cell wall-degrading enzymes to pathogenesis of fusarium graminearum: a review, Journal of Basic Microbiology, 49, 231-241 , 2009).
O fungo Fusarium oxysporum f. sp. lycopersici, agente causador da murcha de Fusarium, uma doença extremamente frequente em todas as regiões onde há cultivo de tomate e é favorecida por temperaturas entre 21 e 33°C (sendo ótimo a 28°C). Produz macroconídios hialinos e microconídios hialinos, além de clamidósporos, estruturas de resistência, que permitem a sobrevivência do fungo no solo por mais de 10 anos (C. Kurozawa, M.A. Pa- van, Doenças do tomateiro, in: H. Kimati, L. Amorim, A. Bergami Filho, L. Camargo, J. Rezende, Manual de fitopatologia, ed. Ceres, 690-719, 1997). Este fungo invade sua planta hospedeira através das raízes e coloniza o sistema vascular. Vários estudos já foram conduzidos sobre as doenças causadas por este fungo que tem demonstrado a participação da PG no estabele- cimento das fitopatogenias. Um destes estudos foi realizado por Huertas- González e colaboradores sobre o patossistema tomate e Fusarium oxysporum, confirmando o uso de poligalacturonases, especialmente a endopoliga- lacturonase I (com os maiores níveis de expressão e secreção) na penetração e colonização da planta hospedeira (Roncero Ml, Di Pietro A, Ruiz- Roldán MC, Huertas-González MD, Garcia-Maceira Fl, Méglecz E, Jiménez A, Caracuel Z, Sancho-Zapatero R, Hera C, Gómez-Gómez E, Ruiz-Rubio M, González- Verdejo Cl, Páez MJ. Role of cell wall-degrading enzymes in pathogenicity of Fusarium oxysporum. Rev Iberoam Micol. 2000 Mar;17(1):S47-53).
O fungo Botrytis cine a (Botryotinia fuckeliana) causa o "mofo cinzento" em mais de 200 espécies de plantas, podendo causar danos em temperaturas menores que 2°C o que afeta vegetais estocados. A infecção se dá na sequência: penetração pela superfície do hospedeiro, formação de lesão primária por morte do tecido vegetal, expansão da lesão com maceração dos tecidos vegetais e esporulação. O fungo expressa poligalacturona- ses durante a infecção para penetração e para criar espaço para a coloniza- ção na lamela média (M. Choquer, E. Fournier, C. Kunz, C. Levis, J.M. Pra- dier, A. Simon, M. Viaud, Botrytus cinerea virulence factors: new insights into a necrotrophic and polyphageous pathogen, minireview, Federation of Euro- pean Microbiological Letters, 277, 1-10, 2007). No tomate, a PG fúngica precisa estar presente para que ocorra infecção plena, porém na sua ausência a infecção ainda pode ocorrer, contudo com expansão muito mais lenta, (Have A, Mulder W, Visser J, van Kan JA. The endopolygalacturonase gene Bcpgl is required for full virulence of Botrytis cinerea. Mol Plant Microbe Inte- ract. 1998 Oct;11 (10):1009-16).
O Colletotrichum lupini é agente causador da antracnose, doen- ça favorecida pelo clima quente e úmido típico dos trópicos afetando as agriculturas que crescem nesse ambiente, como as mangueiras e pupunheira, por exemplo. Nas regiões temperadas é mais conhecido como patógeno do lupino. Infecta as plantas em todos os estágios de desenvolvimento, causando necrose de seus tecidos. Também produz enzimas poligalacturonases que colaboram na penetração da parede celular (H.l. Nirenberg, U. Feiler, G. Hagedorn, Description of Colletotrichum lupini comb. nov. in modern terms, Mycologia, 94(2), 307-320, 2002). O Cryphonectria parasitica afeta principalmente as castanheiras estando presente na maior parte dos países europeus, asiáticos, EUA e Canadá. Atinge os hospedeiros por meio do vento e da chuva e também é transmitido por besouros e pássaros. Causa gangrenas no caule e ferrugem nas castanhas, evidenciadas por alteração da coloração. Entre 1904 e 1950, esse fungo quase dizimou as castanheiras dos EUA. É considerado pelos European and Medierranean Plant Protection Organization (EPPO), North American Plant Protection Organization (NAPPO) e Interafrican Phytosanitary Council (IAPSC) como organismo de quarentena (EPPO quarantine pest, Cryphonectria parasitica, Datasheets on Quarantine Pests, www.eppo.org/QUARANTINE/fungi/Cryphonectria_parasitica/ENDOPA_ds. p df ).
O fitopatógeno Sclerotinia sclerotiorum, também conhecido por mofo branco, é o causador da doença "podridão branca", que acomete mui- tas espécies de plantas de interesse agrícola. Dentre as principais enzimas produzidas na ocasião da infecção da planta, para transpassar a barreira da parede celular está a endopoligalacturonase (K. Mendgen, M. Hahn e H. Deising, Morphogenesis and echanisms of Penetration by plant pathogenic fungi, Annul Reviews on Phytopathology, 34, 367-386, 1996).
O Aspergillus niger tem principal aplicação na indústria de alimentos e bebidas utilizando-se da ação de suas pectinases, endo e exopoli- galacturonases, metil e acetilesterases, pectinases e pectatoliases, ramno- galacturonases e liases. Bussink e colaboradores demonstraram em quatro estudos a presença de sete diferentes genes para poligalacturonases no Aspergillus niger N400, o que leva a crer que essas enzimas têm grande demanda e são de grande importância no processo de quebra da parede celular vegetal (Bussink, Kester e Visser, Molecular clonning, nucleotide se- quence and expression of the gene eonconding pre-pro-polygalacturonase II of Aspergillus niger, FEBS Lett. 273, 127-130, 1990; Bussink, Brouwer, de Graaf, Kester e Visser, Identification and characterization of a second polyga- lacturonase gene of Aspergillu niger, Curr. Genet., 20, 301-307, 1991 ; Bussink, van den Homberg, van den Ijssel e Visser, Characterization of polygalacturonase-overprocing Aspergillus niger transformants, Appl. Microbiol. Biotechnol. 37, 324-329; Bussink, Buxton, Fraaye, de Graaf e Visser, The polygalacturonases of Aspergillus niger are encoded by a family of diverged genes, eur. J. Biochem. 208, 83-90). Outros estudos conduzidos demonstraram que a PG foi requerida para a completa virulência de Aspergillus flavus nas infecções no algodão (Shieh MT, Brown RL, Whitehead MP, Cary JW, Cotty PJ, Cleveland TE, Dean RA. Molecular genetic evidence for the involvement of a specific polygalacturonase, P2c, in the invasion and spread of Aspergillus flavus in cotton bolls. Appl EnvironMicrobiol 1997; 63:3548-3552).
Com o intuito de se combater as fitopatogenias causadas pelos fungos, principalmente os supracitados, através do desenvolvimento e produção de estruturas com potenciais para inibição dessas enzimas, ao longo do trabalho foram utilizadas técnicas computacionais para desenho de com- postos ("computer-aided drug design" - CADD), através do desenho computacional de fármacos baseado na estrutura do ligante ("Ligand-Based Drug Design"-LBDD), sendo o ligante o Ácido Galacturônico. Avanços importantes na produção de fármacos já foram obtidos por meio de abordagens computacionais. O CADD pode predizer resultados experimentais com razoável precisão em tempo reduzido se comparado com os métodos mais clássicos. Métodos de CADD já são amplamente utilizados pela indústria farmacêutica com a finalidade de identificar novos compostos ou aperfeiçoar compostos já existentes que apresentam atividade contra um alvo biológico. Através de simulações de docking, que propõem predizer as interações proteína-ligante de interesse levando em consideração parâmetros físico-químicos que interferem na ligação (D.B. Kitchen, H. Decornez, J.R. Furr, J. Bajorath, Docking and scoring in virtual screening for drug discovery: methods and applications, Nature Reviews - Drug Discovery, 3, 935-949, 2004) é possível identificar compostos que potencialmente servirão como ligantes na proteína alvo.
O documento WO2001097098 descreve um método para obtenção de moléculas com potencial inibitório a partir de bancos de dados contendo as estruturas dos compostos químicos (PubChem), potenciais efetores da função das enzimas cuja atividade deve ser alterada, inibição ou potenci- alização, utilizando docking para selecionar entre as moléculas encontradas no PubChem, baseando-se em scores fornecidos pelos programas, tais como GOLD, que simulam o atracamento do ligante em sitio de ligação - alvo escolhido.
O documento RPI 2036 descreve o desenvolvimento de herbicidas contra uma enzima específica através da técnica de docking seguido de modificação molecular dos ligantes selecionados com melhores scores, considerando propriedades esféricas e eletrostáticas na interação ligante- proteína. Por fim, os resultados de docking foram corroborados pelos resultados experimentais.
O documento US2002/01509061 refere-se à utilização de método computacional para determinar homologia entre proteínas através de alinhamento de estruturas primárias entre pelo menos duas proteínas e deter- minação da estrutura terciária de uma delas a partir do alinhamento com a sequência de uma proteína molde com estrutura tridimensional já resolvida utilizando o programa MODELLER.
O documento US7383135 refere-se ao desenvolvimento de inibidores que agem em uma determinada região conservada entre as proteí- nas de uma família de quinases. O trabalho utiliza uma isoforma com estrutura tridimensional resolvida como molde para resolver a estrutura tridimensional de proteínas homólogas e para o desenho de compostos com potencial para se ligarem à isoforma ou aos homólogos.
Na presente patente, foi selecionada a estrutura tridimensional da enzima Endopoligalacturonase do fungo Fusarium moniliforme como alvo terapêutico para o desenho de novos compostos que atuariam como inibidores (código PDB: 1 HG8, cadeia A). Esta estrutura, publicada no Protein Data Bank foi resolvida através de cristalografia e difração de raios X, com resolução de 1 ,73 Â por Federici et al, 2001 (L. Federici, C. Caprari, B. Mattei, C. Savino, A. di Mateo, G. De Lorenzo, F. Cervone, D. Tsemoglou, Structural requirements of endopolygalacturonase for the interaction with PGIP, PNAS, 98(23), 13425-13430, 2001). A numeração dos aminoácidos adotada é a mesma usada pelos autores da estrutura de código 1 HG8. Foi escolhida a PG do F moniliforme (FmPG) por ser o único do género Fusarium com estrutura tridimensional resolvida além de apresentar identidade e similaridade maiores que 90% na análise do BLASTp (SF Altschul, TL Madden, AA Schãffer, Z Zhang, W Miller, DJ Lipman. 1997. Gapped BLAST and PSI- BLAST: a new generation of protein database search programs. Nucleic Acid Res. 1997 Sep 1 ;25(17):3389-402) com vários fungos do mesmo género e maiores que 66% para identidade e 78% para similaridade com a PG3 de Botrytionia fuckeliana (Botrytis cinerea) e Sclerotium sclerotiorum. Algumas PGs fúngicas são mais similares à outra enzima com estrutura resolvida e depositada no PDB, a PG de Colletotrichum lupini (CIPG), portanto esta foi usada como molde, "template", para a modelagem por homologia destas PGs.
O desafio do presente trabalho não reside apenas em produzir moléculas com potencial inibitório das Endopoligalacturonases de fungos fitopatogenos, mas também em produzir compostos de baixo risco para a população exposta e para o meio ambiente. Isso se deve principalmente à semelhança dos fungos com os tecidos de plantas e animais, também euca- riotos. Por essa razão, sempre foi bastante difícil o tratamento contra infec- ções causadas por fungos tanto no ambiente agrícola como na saúde humana e animal, já que os medicamentos geralmente empregados causam vários efeitos colaterais indesejáveis de grau moderado a grave. Portanto, é difícil realizar um controle eficaz destes fungos fitopatogenos para que estes não representem grande prejuízo para a agricultura e animais, incluindo o homem. Dessa forma, é proposto o desenho de novos compostos que atua- riam como inibidores da enzima Endopoligalacturonase destes fungos, descrita como essencial para o estabelecimento de suas patogenias e basean- do-se no fato de que experimentos que demonstraram a inibição desta enzima, ou deleção ou mutação para formas não ativas, indicaram expressiva redução na capacidade patogênica destes fungos. A presente patente apresenta uma solução na busca por novas possibilidades de transformar este conhecimento em inovação e em um produto por consequência. SUMÁRIO DA INVENÇÃO
A invenção refere-se ao desenho computacional de novos compostos com potencial inibitório para enzimas Endopoligalacturonases (PG) de fungos fitopatogênicos com o intuito de evitar ou diminuir a colonização desses microrganismos nos tecidos vegetais. A PG integra um grupo de enzimas secretadas por microrganismos fitopatogênicos durante o processo de invasão dos tecidos vegetais, participando na catálise da hidrólise da pectina, o que culmina na desestrutu ração do arcabouço da parede celular, o que favorece a invasão de hifas dos fungos. Uma gama de microrganismos fito- patogênicos utiliza essas enzimas como fatores de patogenicidade que levam a doenças em uma grande variedade de plantas de interesse económico como o trigo, a cevada, o tomate, o morango, a manga, o arroz, a cana- de-açúcar, dentre outros. Com o objetivo de minimizar as perdas causadas por estes patógenos, são desenhadas pequenas moléculas planejadas para se ligarem com alta afinidade aos resíduos do sítio de ligação ao substrato.
Assim sendo, o presente trabalho consistiu no desenho computacional de novos compostos com base em metodologias de "Ligand-Based Drug Design", onde o ligante natural (o substrato Galacturonato) é utilizado como referência para o desenho de compostos similares para atuação como inibidor competitivo das PGs. Além disso, metodologias de "Structure-Based Drug Design" são utilizadas, nas quais as interações das moléculas desenhadas com a proteína em sua região alvo são avaliadas por meio de doc- king e novos compostos são desenhados a partir destes resultados com o intuito de otimizar a ligação com os resíduos conservados do sítio catalítico. Estruturas similares ao ligante natural também são utilizadas para rodadas de docking. Adicionalmente, a estrutura de PGs de outros fungos é analisada para verificar se estruturalmente, a região-alvo é conservada.
BREVE DESCRIÇÃO DAS FIGURAS
Figura 1. Alinhamento das estruturas primárias das enzimas po- ligalacturonases usadas neste trabalho. As sequências de fungos usadas neste alinhamento (com fundo cinza), com seus respectivos identificadores do NCBI GenPept e códigos, foram: PG de Fusarium moniliforme, 17942538, FmPGA; hipotética proteína de Fusaríum graminearum, 46138993, FgPG; de Aspergillus niger, 39654258, AnPGAI e 6435555, AnPGA2; de Fusaríum oxysporum f. sp. lycopersici, 3348099, FoPG; Cryphonectria parasitica, 1208810, CpPGA; de Cochliobolus carbonum, 167221 , CcPG; de Sclerotinia sclerotiorum, 156044128, SsPG; de Botrytis cinerea (Botrytinia fuckeliana), 125629516, BfPG1 ; de Aspergillus flavus, 238490452, AfPG; de Stereum purpureum, 21465803, SpPG1 ; de Colletotridhum lupini, 159794838, CIPGA; e de Aspergillus aculeatus, 15988279, AaPGA. Além das sequências fúngicas, sequências de PGs de plantas (com fundo em branco) foram usadas com o intuito de verificar a conservação dos resíduos mais importantes envolvidos na catálise e a existência de outros resíduos que sejam exclusivos de PGs fúngicas e estejam espacialmente próximos ao sítio catalítico/ligante, o que poderia indicar a existência de alvos adicionais e preferenciais, pois um composto que se ligue fortemente a um resíduo específico de fungos provavelmente não causará efeitos quanto à ligação na PG de planta. As PGs vegetais usadas foram: de Arabidopsis thaliana, 15230328, AtPG_Plant; de Brassica rubra, 21530799, BrPG_Plant e de Solanum lycopersicum, 7381227, SIPG_Plant. Nota-se que os resíduos N189, D191 , D212, D213, H234.G235, R267, K269 e T302 apresentam-se bem conservados. Os resí- duos mais importantes na ligação ao substrato, altamente conservados dentre as diversas espécies de fungos fitopatogênicos e plantas estão destacados em barras longas em cinzas claro e escuro, sendo os cinza escuro a tríade catalítica composta pelos Aspartatos 191 , 212 e 213. Os resíduos destacados por barras transparentes com contorno preto (H188, D 194 e G305) são os resíduos considerados "alvos-preferenciais", uma vez que estão próximos aos resíduos catalíticos e de ligação ao substrato, porém possuem ocorrência restrita às PGs de fungos fitopatogênicos, não existindo em PGs de plantas.
Figuras 2 A e B. Alinhamento da estrutura da enzima do F. mo- niliforme (1 HG8) (em cinza) as enzimas dos fungos (em preto) Stereum purpureum ( K5C, figura 2a) e Colletotrichum lupini (2IQ7, figura 2b) obtidas do Protein Data Bank. Os alinhamentos foram feitos com o programa PyMol, também usado para gerar as imagens moleculares (W.L Delano, The PyMol molecular graphics system Delano Scientific, San Carlos, CA, USA, http://www.pymol.com.org) e TM-align, usado também para fornecer dados de RMSD e TM-score sobre a qualidade dos alinhamentos (Yang Zhang, J. Skolnick, TM-align: a protein structure alignment algorithm based on th TM- score, Nucleic Acid Research, 33(7): 2302-2309, 2005). Nas estruturas foram selecionados os resíduos H234, K244, R267, K269 e Y302 para mostrar a posição de cada um nas enzimas (cada resíduo está da mesma cor de sua enzima correspondente). O alinhamento demonstra alta similaridade estrutu- ral no que diz respeito às posições dos resíduos do sítio ligante, o que está de acordo com os resultados mostrados na tabela 6 (TM-Scores próximos de 1 e baixos RMSDs).
Figura 3. Alinhamento da estrutura terciária das enzimas FmPG (1 HG8.pdb) e SpPG (I KCD.pdb) feito no PyMol e importado pelo MVD para geração de imagem. Figura 3 A) apresenta em destaque o resíduo de mono- galacturonato posicionado no sitio catalítico (D191 , D213 e D213 aparecem como traços finos) e dos resíduos que fazem parte do sitio ligante (H234, R267 e K269, não mostrados na figura), estes últimos adotados como alvos para inibição. O monogalacturonato da SpPG (I KCD.pdb) é resultante da clivagem de oligogalacturonato (em preto) co-cristalizado com a enzima. Na FmPG (1 HG8.pdb), as moléculas de tri e mono galacturonato foram introduzidas na estrutura por docking (mostrado em cinza claro) e observa-se que os resíduos encontram-se em posição muito similar em ambas as enzimas. Essa constatação valida a técnica de docking para os resíduos de aminoáci- dos da região em que se encontram os monogalacturonatos.
Figura 4. Representação estrutural das moléculas desenhadas computacionalmente que obtiveram melhores resultados nos dockings com 1 HG8 e 2IQ7 (tabelas 6 e 7) e que provavelmente possuirão caráter inibitório para as PGs.
Figura 5. Ligante dh321 posicionado no sítio alvo da 1 HG8.pdb.
A figura, em escala de cinza, representa as regiões catalítica e ligante da enzima FmPG (1 HG8.pdb). Esse é o ligante que apresentou melhor resulta- do de interação entre os resíduos específicos de PGs fúngicas: D194, H188 e G305, tanto na 1 HG8 quanto na 2IQ7 (tabelas 6 e 7). Possui grupos químicos que conferem polaridades diferentes para cada extremidade da estrutura desta molécula o que o faz encaixar na região do sítio ligante e do cata- lítico através de complementaridade eletrostática. A região catalítica é predominantemente negativa e na imagem aparece como cinza de tonalidade média; a região ligante, majoritariamente positiva, aparece na imagem como o cinza de tonalidade mais escura; as regiões em cinza claro são apoiares.
Figura 6. Ligante 602 posicionado no sítio alvo da 1 HG8. Esse é o ligante que apresentou melhores resultados de interação com os resíduos conservados do sítio de ligação ao substrato: H234, R267, K 269 e Y302, apresentando energias bastante negativas com esses resíduos tanto no docking com a 1 HG8 quanto com a 2IQ7 (tabelas 6 e 7). Esse ligante também se destacou na análise de ADMET (tabela 8), apresentando bons valo- res de cLogP, solubilidade, Druglikeness, Drug-score e, principalmente, ausência de risco de efeito tóxico.
DESCRIÇÃO DETALHADA DA INVENÇÃO
A presente invenção refere-se a um método para desenhar com- putacionalmente novos compostos com potencial função inibitória da enzima endopoligalacturonase produzida por fungos fitopatgênicos e envolvida em processos de invasão destes fungos em células vegetais. Um enfoque especial é dado às enzimas de fungos patogênicos de solo envolvidos em uma série de fitopatogenias e responsáveis por amplo espectro de prejuízos à Agricultura.
O método proposto consiste das seguintes etapas:
1- Obter arquivos de coordenadas referentes às estruturas tridimensionais (a partir do banco PDB) da estrutura da PG do F. moniliforme e das PGs de outros fungos mencionados.
2- Fazer busca por sequências homólogas (que também possu- am estrutura depositada no PDB) às estruturas primárias das enzimas dos organismos de interesse usando o BLASTp contra o banco de dados de sequências primárias do PDB. O BLAST fornece os dados referentes às carac- terísticas do alinhamento de sequência primária, como: identidades (porcentagem de aminoácidos idênticos em posições correspondentes), positivos (são o número aminoácidos idênticos somado ao número de aminoácidos não são idênticos entre duas sequências numa determinada posição, mas que possuem propriedades similares, considerado como um "Positivo" por indicar substituições nas quais a matriz BLOSUM-62 pontua positivamente segundo Altshul e colaboradores (1997). Os gaps indicam o número de regiões que representam lacunas no alinhamento (seja devido a inserções e de- leções no histórico evolutivo dos genes) e, por último, a coluna e-value (Ex- pect Value) representa um parâmetro estatístico do programa BLAST que indica o número de diferentes alinhamentos que ocorreriam em um banco de dados por mero acaso com Score equivalentes ou melhores que o obtido para um determinado alinhamento. Quanto menor o e-value, mais significante é o score obtido no alinhamento em questão (S.F. Altschul, T.L. Madden, A.A. Schãffer, Z. Zhang, W. Miller, D.J. Lipman, Gapped BLAST and PSI- BLAST: a new generation of protein database search programs, Nucleic Acid Res, 25(17):3389-3402, 1997) para análise de homologia e com o programa ClustalW (M.A Larkin, G. Blackshields, N.P. Brown, R. Chenna, PA. McGet- tingan, H. McWillian, F. Valentin, I.M. Wallace, A. Wilm, R. Lopez, J.D. Thompson, T.J. Gibson, D.G. Higgins, Clustal W and Clustal X version 2.0, Bioinformatics, 23, 2947-2948, 2007).
3- Predizer modelos de estruturas tridimensionais das PGs que não possuírem estrutura depositada nos bancos públicos utilizando as sequências primárias das enzimas dos organismos de interesse e como molde (template) as estruturas cujas sequências primárias são homólogas à sequência de interesse e foram identificadas usando o BLASTp (como descrito no item 2). Programas como o Swiss-MODEL (Guex, N. e Peitsch, M. C. SWISS-MODEL and the Swiss-Pdb-Viewer: An environment for comparative protein modelling. Electrophoresis 18:2714-2723, 1997.) e o programa MODELLER 9v8 (N. Eswar, M.A. Marti-Renom, B. Webb, M.S. Madhusudhan, D. Eramian, M. Shen, U. Pieper, A. Sali, Comparative protein structure modeling with MODELLER, Current Protocols in Bioinformatics, John Wiley & Sons, Inc. Supp 15, 5.6.1-5.6.30, 2006) podem ser usados para a modelagem das proteínas de interesse. A finalidade dos modelos seria de comparar as posições dos aminoácidos de interesse nas estruturas terciárias. A partir do alinhamento entre a sequência a ser modelada e uma estru- tura conhecida similar a ela em termos de sequência primaria, o programa gera um modelo tridimensional (num procedimento de modelagem por ho- mologia).
4- Em seguida, usando o programa Deep-View, realiza-se a edição das estruturas otimizando a numeração de resíduos na sequência pri- maria, dentre outras ações (Guex, N. e Peitsch, M. C. SWISS-MODEL and the Swiss-Pdb-Viewer: An environment for comparative protein modelling. Electrophoresis 18:2714-2723, 1997). Adicionalmente, utiliza-se o GRO- MACS para minimizar energia dos modelos gerados. Com a minimização de energia os aminoácidos dos modelos adotam conformações mais favoráveis energeticamente, o que torna o modelo mais próximo de uma conformação real (D. Van Der Spoel, E. Lindhal, B. Hess, G. Groenhof, A.E. Mark, H.J Be- rendsen, GROMACS: fast, flexible, and free, J Comput Chem, 26(16), 1701- 18, 2005). As estruturas terciárias são visualizadas através do PyMol para análise da sobreposição das estruturas terciárias (W.L Delano, The PyMol molecular graphics system Delano Scientific, San Carlos, CA, USA, http://www.pymol.com.org), a avaliação da qualidade dos modelos gerados é feita pela análise de gráficos Ramachandran, que fornece o percentual de aminoácidos que possuem ângulos de torção aceitáveis (ψ e φ). Os dados de cada aminoácido são distribuídos em um gráfico subdividido em regiões. Isso é importante na análise dos modelos uma vez que durante a modelagem alguns aminoácidos podem adotar conformações teoricamente não permitidas (Ramachandran, G. N., Ramarkrishnan, C, Sasisekharan, V. Ste- reochemistry of polypeptide chain conformations. J. Mol Biol 7:95-99, 1963). Os dados do Ramachandran são gerados através do Java Protein Dossier da plataforma STING (Neshich, G., Togawa, R., Mancini, A. L, Kuser, P. R., Yamagishi, M. E. B., Pappas Jr., G., Torres, W. V., Campos, T R, Ferreira, L. L, Luna, R M., Oliveira, A. G., Miura, R. T, Inoue, M. K., Horita, L. G., de Souza, D. R, Dominiquini, R, Álvaro, A., Lima, C. S., Ogawa, R O., Gomes, B. G., Palandrani, J. C. R, dos Santos, G. R, de Freitas, E. M., Mattiuz, A. R., Costa, I. C, de Almeida, C. L, Souza, S., Baudet, C. and Higa, R. H. STING Millennium: a Web based suite of programs for comprehensive and simulta- neous analysis of protein structure and sêquence. Nucleic Acids Research, 31 :13, 3386-3392, 2003). Os modelos são analisados em relação a erros na estrutura tridimensional pelo ProSa-web, que calcula um valor (z-score) referente à qualidade geral de uma estrutura específica comparado com os valores de todas as cadeias de proteínas experimentalmente determinadas e depositadas no PDB (M. Wiederstein, MJ. Sippl, ProSa-web: interactive web service for the recognition of errors in three-dimensional structures of prote- ins, Nucleic acids Research, 35, 407-410, 2007).
5- Alinhar a FmPG (1 HG8.pdb) às estruturas depositadas no PDB com o TM-align para análise da sobreposição das estruturas terciárias e para analisar os desvios (RMSD - root-mean-square deviation) e TM- score. O RMSD fornece em A a média quadrática das distâncias entre pares de resíduos correspondentes, depois da sobreposição de uma estrutura sobre a outra. O TM-score utiliza o fator de Levitt-Gerstein que considera os pares de resíduos em menores distâncias como mais relevantes do que a- queles a maiores distâncias e também é mais sensível à topologia geral do que a variações estruturais localizadas. O TM-score é normalizado de forma a não ser dependente do tamanho da proteína, seu valor pode ir de 0.0 a 1.0, sendo valores maiores que 0.17 indicativos de similaridade estrutural elevada (Yang Zhang, J. Skolnick, TM-align: a protein structure alignment algorithm based on th TM-score, Nucleic Acid Research, 33(7): 2302-2309, 2005).
6- Fazer alinhamentos entre a estrutura primária de proteínas homólogas à proteína de interesse através do programa ClustalW 2.0 (Lar- kin, M. A., Blackshields, G., Brown, N. P, Chenna, R., McGettigan, P. A., McWillian, H., Valentin, F, Wallace, I. M., Wilm, A., Lopez, R., Thompson, J., D., Gibson, T J., Higgins, D. G. 2007. Clustal W and Clustal X version 2.0. Bioinformatics, 23, 2947-2948) e incluir proteínas de outros organismos, evi- denciando as similaridades e diferenças entre estes dois conjuntos de proteínas e buscando as correspondências no alinhamento de estrutura primária dos resíduos importantes. Seguindo certos critérios como: presença exclusivamente nas sequências de fungos fitopatogênicos, escolher os alvos tera- pêuticos preferenciais.
7- Buscar estruturas de compostos no PubChem (http://pubchem.ncbi.nlm.nih.gov/) por similaridade maior que 90% com o ligante natural (galacturonato) e proceder simulações de docking empregando o programa Molegro Virtual Docker (MVD). O docking consiste na predi- ção da orientação de uma molécula em relação a uma segunda quando elas se ligam para formar um complexo ligante-proteína. Há vários programas que realizam docking molecular, tais como DOCK, AUTODOCK, GOLD, FLEXX, ZDOCK, M-ZDOCK, MS-DOCK, Surflex, MCDOCK, MolDock, GemDock, entre outros. Os métodos usados por cada programa diferem ba- sicamente na busca pela conformação que melhor se liga a proteína. Há três principais tipos: Estocástico e Sistemático, por Dinâmica Molecular e Algoritmos Genéticos/Evolucionários. O método de busca Estocástica e Sistemática por ligantes é bastante empregado e variado. O programa DOCK, por exemplo, utiliza um método baseado em conformações randômicas; FLEXX é baseado no espaço conformacional do sítio ativo. O método por Dinâmica Molecular, utilizado pelo AUTODOCK, calcula as várias conformações que a proteína alvo pode adotar durante a interação com o ligante. O MVD utiliza o algoritmo MolDcok que é baseado em Algoritmo Evolucionário (uma variedade de Método Estocástico e Sistemático) para simular as interações ligante- proteína. Os algoritmos evolucionários podem ser definidos como um grupo de aproximações computacionais baseadas nos conceitos da Teoria da Evolução de Darwin. O MolDock é uma implementação do algoritmo evolucionário focado em simulações de docking molecular, onde aproximações computacionais de um processo evolutivo são aplicadas para simular a permanên- cia das características mais favoráveis (Thomsen R, Christensen MH.: MolDock: a new technique for high-accuracy molecular docking. J Med Chem. 2006 Jun 1 ;49(11):3315-21.;W.F. De Azevedo Jr, MolDock applied to struc- ture-based virtual screening, Current Drug Targets, 11 (3):327-334, 2010). Trabalhos que comparam os programas mais utilizados indicam que programas baseados em algoritmo evolucionário tais como GemDock e Mol- Dock apresentam melhor performance geral do que Flexx, GOLD e Surflex (R. Thomsen, M.H. Christensen, MolDock: a new technique for high-accuracy molecular docking, J Med Chem, 49, 3315-21 , 2006; J.M. Yang, C.C. Chen, GemDock: a generic evolutionary method for molecular docking, Proteins, 55, 288-304, 2004). Neste trabalho, os dockings foram feitos entre os ligan- tes obtidos no PubChem e a enzima do F. moniliforme para seleção de es- truturas com melhor afinidade com os resíduos do sítio alvo principalmente em relação aos aminoácidos conservados.
8- Uma análise detalhada do nano-ambiente do sitio alvo é realizada usando-se o programa STING Java Protein Dossier (Neshich G., Roc- chia W., Mancini A.L., Yamagishi M.E., Kuser P.R., Fileto R., Baudet C, Pinto I.P., Montagner A.J., Palandrani J.F., Krauchenco J.N., Torres R.C., Souza S-, Togawa R.C., Higa R.H. 2004. JavaProtein Dossier: a novel web-based data visualization tool for comprehensive analysis of protein structure. Nucle- ic Acids Res. Jul 1 ; 32 (Web Server issue):W595-601 , 2004) e a ferramenta "select". Desta forma, são determinados conjuntos de parâmetros físico- químicos e estruturais que descrevem o nano-ambiente que é composto pelos resíduos que compõem o sítio-alvo, no qual se espera que os ligantes atraquem. Estes conjuntos são usados não apenas para identificação nas estruturas estudadas, como também para melhor compreender o ambiente para qual o inibidor seria construído, tendo a eficácia necessária para sua aplicação final. Portando estes parâmetros indicam as características físico- químicas do alvo terapêutico para o adequado desenho computacional e modificação dos novos compostos.
9- As estruturas selecionadas no item "7" são modificadas racionalmente, de acordo com as características físico-químicas e estruturais en- contradas no item "8" (por exemplo, se o potencial eletrostático local é alto, adicionam-se os átomos adequados para diminuir este potencial no composto inicial), a fim de aumentar os valores de afinidade de ligação. As altera- ções nos compostos são feitas computacionalmente através do programa ChemBioDraw, no qual também são feitas minimização de energia e dinâmica das estruturas de ligantes desenhadas (Zhenjiang Li, Honggui Wan, Yuhu Shi, Pingkai Ouyang, Personal experience with four kinds of chemical struc- ture drawing software: review on ChemDraw, ChemWindows, ISIS/Draw, and ChemSketch, J. Chem. Inf. Comput. Sei., 44, 1886-1890, 2004). Além da busca por ligantes baseados na estrutura de galacturonatos no PubChem, também é realizada busca por ligantes baseados na forma da cavidade criada pelo MVD na região dos resíduos de interesse. Os demais passos de docking e modificações estruturais também são aplicados a esses ligantes.
10- Realizar predição de parâmetros moleculares que interferem na Absorção, Distribuição, Metabolismo, Excreção e Toxicidade utilizando a ferrametna online Osíris Property Explorer (Thomas Sander, Actelion Phar- maceuticals Ltd., http://www.organic-chemistry.org/prog/peo/) para orientar no desenho dos compostos. O programa Osiris fornece dados de risco de toxicidade: mutageninicade, tumorogenicidade, irritante e com efeito reprodutivo, baseados em fragmentos de moléculas conhecidas depositados no banco de dados RTECS. Também prediz valores de cLogP, solubilidade em água, peso molecular e fornece o Drug-score que é um valor geral resultante da combinação de todos os parâmetros anteriores mais o Druglikeness, que compara fragmentos do composto desenhado com base de dados de compostos comercializados e com base de dados de compostos que não servem como fármacos (Fluka).
EXEMPLO
A invenção será agora descrita em maiores detalhes por meio do exemplo a seguir, o qual não deve ser interpretado como limitativo do escopo da invenção.
Foram obtidos os arquivos de coordenadas referentes às estruturas tridimensionais existentes de fungos fitopatogênicos através do Protein Data Bank (http://www.pdb.org). As PGs fúngicas, cujas estruturas tridimensionais estão resolvidas e depositadas no PDB, são: Fusarium moniliforme (1 HG8), Aspergillus aculeatus (1AI5), Aspergillus niger (1 NHC, PG1 ; 1 CZF, PG2), Colletotrichum lupini (2IQ7) e Stereum purpureum (1 K5C; 1 KCD - PG em complexo com dois resíduos de galacturonato). Como o trabalho tem como alvo principal o estudo de PGs do género Fusarium para o desenvolvimento de drogas, foi executado o programa BLASTp usando como query a sequência da PG de F. moniliforme (FmPG) contra a database NR do NCBI filtrada para proteínas de outros fungos Ascomicetos. Foram evidenciados altos valores de identidade e similaridade, ambos acima de 90%, para a maioria das sequências de Fusarium obtidas como "hits" no BLASTp (Tabela 1), o que sugere alta conservação entre estas PGs. No entanto, foi obser- vado que sequências de PGs de alguns dos fungos discutidos anteriormente exibem valores de identidades baixos em relação à PG de Fusarium moniliforme e que estas sequências eram mais similares à PG de Colletotríchum lupini (CIPG). Os resultados de BLAST usando-se como query a CIPG contra o NR filtrado para Ascomicetos demonstram que os alinhamentos da CIPG com PGs de fungos como Gibberella zeae, Aspergillus niger, Fusarium oxysporum f. sp. lycopersici, Cryphonectria parasitica, Cochliobolus carbo- num, Sclerotinia sclerotiorum e Botrytis cinerea possuem maiores valores de identidade e positivos em relação ao alinhamento destes com a FmPG (Tabela 2). Foi também feito o BLASTp com enzimas de plantas (Tabela 3) cu- jos alinhamentos com as sequências "queries" FmPG (1 HG8_A) e CIPG (2iq7_A) apresentaram valores de similaridade e identidade menores. Além disso, não foi encontrada nenhuma estrutura disponível no PDB de poliga- lacturonase vegetal.
Tabela 1 : Resultados obtidos com o BLASTp entre a FmPG (1 HG8) e se- quências do banco NR do NCBI (www.ncbi.nlm.nih.gov), sendo reportados os hits obtidos contra Gibberella e outros Fusarium. São fornecidos os dados referentes às características do alinhamento de sequência primária realizado pelo BLAST, como: identidades (porcentagem de aminoácidos idênticos em posições correspondentes), positivos (são o número aminoácidos idênticos somado ao número de aminoácidos não idênticos entre duas sequências numa determinada posição, mas que possuem propriedades similares, considerado como um "Positivo" por indicar substituições nas quais a matriz BLOSUM-62 pontua positivamente segundo Altshul e colaboradores 1997; SF Altschul, TL Madden, AA Schãffer, Z Zhang, W Miller, DJ Lipman. 1997; Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acid Res. 1997 Sep 1 ;25(17):3389-402), a coluna gaps indica o número de regiões que representam lacunas no alinhamento (seja devido a inserções e deleções no histórico evolutivo dos genes) e, por último, a coluna e-value (Expect Value) que representa um parâmetro estatístico do programa BLAST que indica o número de diferentes alinhamentos que ocorreriam em um banco de dados por mero acaso com Score equiva- lentes ou melhores que o obtido para um determinado alinhamento. Quanto menor o e-value, mais significante é o score obtido no alinhamento em questão.
Figure imgf000027_0001
Tabela 2: Resultados de BLASTp contra o banco de sequências protéicas NR do NCBI usando-se como sequência de busca ("query sequen- ce") a sequência da PG de Colletotríchum lupini (CIPGA, PDB 2IQ7_A). São mostrados os resultados "hits" encontrados para as sequências de PGs dos fungos de importância económica descritos na seção "Estado da Técnica", sendo que alguns estão anotados com códigos PDB, o que indica que sua estrutura já foi resolvida. A descrição das colunas segue o padrão da tabela 1.
'
Figure imgf000028_0001
Tabela 3: Resultados obtidos com o programa BLASTp usando- se como sequência de busca a estrutura primária da FmPG (1 HG8.pdb) e da CIPGA (2IQ7.pdb) contra o banco de sequências protéicas NR do NCBI filtrado para sequências de Viridiplantae (taxid 33090).
Figure imgf000028_0002
Sabendo-se da importância destes fungos patogênicos na pro- dução agrícola e pensando-se no desenho de um fármaco de alta abrangência, foi feito um alinhamento de sequência primária usando o programa Clus- talW (Larkin, M. A., Blackshields, G., Brown, N. R, Chenna, R., McGettigan, P. A., McWillian, H., Valentin, F., Wallace, I. ., Wilm, A., Lopez, R., Thompson, J., D., Gibson, T. J., Higgins, D. G. Clustal W and Clustal X version 2.0. Bioinformatics, 23, 2947-2948, 2007) incluindo todos os fungos patogênicos citados anteriormente e este está mostrado na figura 1. Nesta figura também estão alinhadas três sequências de PGs vegetais (de Arabidopsis thaliana, Ricinus comunis e Brassica rubra) com o intuito de compará-las com sequências de PGs fúngicas e buscar por aminoácidos que sejam específicos de fungos em relação às plantas e que estejam envolvidos na ligação com o substrato estando próximos espacialmente a eles. Isso remete à discussão sobre como identificar um ideal alvo terapêutico para o desenho computacional de novos compostos. Anderson (2003) publicou uma descrição de como deve ser realizado o procedimento de desenho computacional de fár- maços baseado em estruturas protéicas, desde os critérios que devem ser adotados para a escolha do alvo terapêutico para tal desenho até os processos de desenvolvimento, docking e virtual screening (AC Anderson. The pro- cess of structure-based drug design. Chem Biol. Sep;10(9):787-97, 2003). O trabalho discute que o desenho de drogas antimicrobianas deve se basear em alvos que sejam essenciais, principalmente encontrados nos patógenos (em relação a organismos não-patogênicos, e ao hospedeiro), tenham uma função única no patógeno e que sejam passíveis de sofrerem inibição por pequenas moléculas. Pensando nisso, o alvo considerado, a proteína PG, é essencial para a patogenicidade destes fungos, é passível de inibição, já demonstrada praticamente através de estudos com a PGIP, e, sugerimos a seguir resíduos a serem usados como alvos preferenciais por existirem especificamente em PGs de fungos e ausentes nas de plantas.
Analisando-se o alinhamento e características estruturais de resíduos próximos aos envolvidos na catálise e ligação ao substrato, pode-se perceber a existência de três aminoácidos importantes, presentes exclusivamente nas PGs de fungos e, portanto, ausentes nas PGs vegetais: His188, Asp194 e G305. A estrutura da SpPG1 depositada no PDB (1 KCD) possui, co-cristalizada dois resíduos de ácido galacturônico e, através de visualização no programa Java Protein Dossier da plataforma STING (Ne- shich G., Rocchia W., Mancini A.L., Yamagishi M.E., Kuser PR., Fileto R., Baudet C, Pinto I.P., Montagner A.J., Palandrani J.F., Krauchenco J.N., Torres R.C., Souza S., Togawa R.C., Higa R.H. JavaProtein Dossier: a novel web-based data visualization tool for comprehensive analysis of protein s- tructure. Nucleic Acids Res. 2004 Jul 1 ;32 (Web Server issue):W595-601 , 2004), foi possível extrair informações de que aminoácidos estão interagindo por meio de contatos com estes resíduos glicídicos. Estes são os resíduos do sítio ativo Asp212, Asp213 e Asp191 , e sítio ligante: Asn189, His234, Gly239, Ser 240, Arg267, Lys269 e Tyr302 que, como exposto por Markovic e Janecek (2001), estão altamente conservados entre as PGs e possuem alta similaridade estrutural com os correspondentes nas estruturas de fungos já resolvidas (A niger (1 CZF e 1 NHC), F moniliforme (1 HG8), C. lupini (2IQ7), A. aculea- tus (1 IA5)) e, somados à similar estrutura geral, os fazem ser classificados como hidrolases da família 28, apesar da baixa identidade de sequência.
No alinhamento, o alto grau de identidade dos resíduos especificamente envolvidos na catálise e ligação do substrato e a alta similaridade nos leva a crer os compostos aqui desenhados para a PG de Fusarium mo- niliforme, por exemplo, seriam igualmente capazes de inibir as PGs destes outros fungos. Além disso, foram selecionados resíduos próximos (distância menor que 2Â) aos resíduos mencionados que participam do sítio catalítico e sítio ligante através do programa JavaProtein Dossier. Estes foram analisados cuidadosamente no alinhamento mostrado na figura 1 quanto à exclusi- va presença em PGs fúngicas em detrimento de PGs vegetais e também na presença em posições correspondentes no maior número possível de PGs de fungos o que vai de encontro à idéia de desenhar um composto que teria alta abrangência e não traria efeitos indesejáveis para o desenvolvimento da planta. Foram encontrados, portanto, os resíduos His188, Asp194 e G305, que foram escolhidos como "alvos preferenciais". Coincidentemente, o resíduo His188 é considerado um dos mais importantes quanto à interação do inibidor protéico de PGs (PGIP) na inibição das PGs, como é mostrado no trabalho de Federici et al (L. Federici, C. Caprari, B. Mattei, C. Savino, A. di Mateo, G. De Lorenzo, F. Cervone, D. Tsernoglou, Structural requirements of endopolygalac- turonase for the interaction with PGIP, PNAS, 98(23), 13425-13430, 2001 ).
Um alinhamento de estrutura primária já foi publicado contendo toda a família de 28 hidrolases glicosídicas a que pertencem essas enzimas (O. Markovic, S. Janecek, Pectin degradin glycoside hydrolases of family 28: sequence-structural features, specificities and evolution, Protein Engineering, 14(9):615-631 , 2001 ) onde foi evidenciado, pelo alinhamento das sequências de 115 enzimas dessa família oriundas de plantas, insetos, fungos e bacté- rias, que as regiões que compreendem os aminoácidos N189, T190 D191 , D212,D213, G233,H234, G235, R267, I268, K269 e o aminoácido Y302 (numeração da FmPG) estão altamente conservadas em todas as PGs, EPGs e EPGDs.
Para uma análise mais profunda acerca das posições estruturais dos resíduos destacados no alinhamento da figura 1 , optamos por modelar a estrutura tridimensional das PGs de outros fungos, como: Fusarium oxyspo- rum f. sp. lycopersici, F graminearum, Aspergillus flavus, Botrytis cinema, Cochliobus carbonum, Crypphonectria parasitica e Sclerotinia sclerotiorum a fim de se verificar as correspondências quanto às posições dos aminoácidos envolvidos na ligação. A estrutura que serviu de molde ("template") para modelagem por homologia usando o programa Modeller 9v8 (Eswar, N., Marti- Renom, M. A. , Webb, B. , Madhusudhan, M. S., Eramian, D., Shen, M., Pie- per, U., Sali., A. Comparative Protein Structure Modeling With MODELLER. Current Protocols in Bioinformatics, John Wiley & Sons, Inc., Supplement 15, 5.6.1-5.6.30, 2006), foi a PG do C. lupini (código PDB 2iq7) pois este apresentou maior identidade e similaridade com sequências dos fungos de importância económica citados (Tabela 2). Após a modelagem, uma rodada de minimização de energia foi efetuada usando o programa Gromacs (D. Van Der Spoel, E. Lindhal, B. Hess, G. Groenhof, A.E. Mark, H.J Berendsen, GROMACS: fast, flexible, and free, J Comput Chem, 26(16), 1701-18, 2005). Adicionalmente, usando o programa Deep-View (Guex, N. e Peitsch, M. C. SWISS-MODEL and the Swiss-Pdb-Viewer: An environment for comparative protein modelling. Electrophoresis 18:2714-2723, 1997), foi realizada edição das estruturas otimizando a numeração de aminoácidos na estrutura prima- ria, dentre outras ações.
Foi feita a validação das PG modeladas usando a análise de gráficos de Ramachandran (Ramachandran, G. N., Ramarkrishnan, C, Sasi- sekharan, V. Stereochemistry of polypeptide chain conformations. J. Mol Biol 7:95-99, 1963) em uma interface gráfica da plataforma STING (Neshich, G., Togawa, R., Mancini, A. L, Kuser, P. R., Yamagishi, M. E. B., Pappas Jr., G., Torres, W. V, Campos, T. , Ferreira, L. L, Luna, F. M., Oliveira, A. G., Miu- ra, R. T, Inoue, M. K., Horita, L. G., de Souza, D. F., Dominiquini, F., Álvaro, A., Lima, C. S., Ogawa, F. O., Gomes, B. G., Palandrani, J. C. F., dos Santos, G. F., de Freitas, E. M., Mattiuz, A. R., Costa, I. C, de Almeida, C. L, Souza, S., Baudet, C. and Higa, R. H. STING Millennium: a Web based suite of programs for comprehensive and simultaneous analysis of protein structu- re and sequence. Nucleic Acids Research, 31 :13, 3386-3392, 2003), que indicou que, para todos os modelos obtidos, cerca de 84-86% dos resíduos se encontravam em regiões permitidas, o que não difere muito da estrutura que serviu de molde (CIPG, PDB: 21Q7_A, resolução 1.94 A), que teve 85.55% de resíduos em regiões permitidas. Considerando que a qualidade dos modelos está muito próxima da qualidade do molde, os modelos são considerados aceitáveis. A validação através do ProsaWeb indicou que os valores de z-score equivaleram a -7.75, -7.54, -7.29, -7.04, -7.88, -7.58, - 7.59, respectivamente para as PGs modeladas de Fusarium oxysporum f. sp. lycopersici, F graminearum, Aspergillus flavus, Botrytis cinerea, Cochlio- bus carbonum, Crypphonectria parasitica e Sclerotinia sclerotiorum; e o z- score da enzima do Colletotrichum lupini (CIPG) foi de -7.59. Estes z-scores estão contidos no intervalo de resultados normalmente encontrados para as proteínas nativas de tamanho similar (Whiederstein, M., Sippl, M. J. ProSA- web: interactive web service for the recognition of errors in three-dimensional structures of proteins. Nucleic Acid Research, Web Server issue: W407-10, 2007). Portanto, os modelos foram considerados aceitáveis para a continuação das análises.
Para uma análise comparativa das posições estruturais dos aminoácidos relevantes ao presente estudo, foram efetuadas sobreposições estruturais dos modelos gerados com a estrutura molde e entre as diversas estruturas resolvidas e depositadas no PDB (Tabelas 4 e 5). Foram calculados os valores de desvio no alinhamento entre as estruturas terciárias alinhadas através do programa TM-align (Yang Zhang, J. Skolnick, TM-aiign: a protein structure alignment algorithm based on th TM-score, Nucleic Acid Research, 33(7): 2302-2309, 2005). Observa-se que os valores de RMSD e TM-score são satisfatórios entre os modelos e a enzima 1 HG8 e entre os modelos e seu "template", a enzima 2IQ7. A visualização e confecção de imagens foram feitas com o programa PyMol (W.L Delano, The PyMol molecular graphics system Delano Scientific, San Carlos, CA, USA, http://www.pymol.org) e MVD (Thomsen R, Christensen MH.: MolDock: a new technique for high- accuracy molecular docking. J Med Chem. 2006 Jun 1 ;49(11):3315-21.;W.F. De Azevedo Jr, MolDock applied to structure-based virtual screening, Current Drug Targets, 11(3):327-334, 2010). Os alinhamentos estruturais entre a PG do F. moniliforme e as estruturas depositadas no PDB são mostradas nas figuras 2a, 2b, 2c, 2d e 2e com enfoque nos resíduos importantes do sítio ligante (H234, R267, K269 e Y302) e na sobreposição geral das estruturas. Os valores fornecidos pelo TM-align são o RMSD e o TM-score, sendo que o primeiro calcula a média quadrática da distância entre os resíduos correspondentes considerando apenas as distâncias entre pares de resíduos e sendo influenciado pelo tamanho da proteína, não levando em conta sua topologia. Já o TM-Score é calculado levando em conta a topologia das es- truturas sobrepostas, o que é bastante importante uma vez que a maioria das interações entre proteínas são influenciadas pela topologia. Foi observado, nestas sobreposições, que as posições dos aminoácidos nos sítios ligantes das proteínas são bastante conservadas estruturalmente, o que reforça a idéia de que um ligante que funcione como inibidor da PG ligando-se a esses aminoácidos pode ter grandes chances de também ter atividade inibitória para as outras PGs fúngicas. A finalidade em se obter modelos tridimensionais das enzimas que não possuem estrutura resolvida por métodos experimentais é o de fornecer resultados adicionais para a modelagem dos ligantes além daqueles fornecidos pelas simulações entre ligantes e PGs que possuem estrutura depositada no PDB. Os valores de RMSD e TM- score foram considerados satisfatórios, pois como pode ser visto nas figuras (Figura 2) e no alinhamento (Figura 1 ), as enzimas são muito semelhantes estruturalmente.
Tabela 4: Valores de RMSD e TM-Score resultantes de alinhamento estrutural entre as estruturas de PGs fúngicos e enzima FmPG (1 HG8.pdb). O RMSD fornece a média quadrática das distâncias entre pares correspondentes de resíduos depois da sobreposição de uma estrutura sobre a outra. O TM-score utiliza o fator de Levitt-Gerstein que considera os pares de resíduos em menores distâncias como mais relevantes do que a- queles a maiores distâncias e também é mais sensível à topologia geral do que a variações estruturais localizadas. O TM-score é normalizado de forma a não ser dependente do tamanho da proteína, seu valor pode ir de 0.0 a 1.0, sendo valores maiores que 0.17 indicativos de similaridade estrutural elevada (Yang Zhang, J. Skolnick, TM-align: a protein structure alignment algorithm based on th TM-score, Nucleic Acid Research, 33(7): 2302-2309, 2005). Como o TM-score leva em consideração principalmente a topologia, esses resultados indicam que todas as enzimas possuem alta correlação estrutural com a FmPG (1 HG8.pdb).
Figure imgf000034_0002
Tabela 5: Valores de RMSD e TM-Score resultantes de alinhamento estrutural entre as estruturas modeladas de PGs fúngicas e as estru-
Figure imgf000034_0001
Figure imgf000034_0003
Adicionalmente, foi feita sobreposição da PG de F. moniliforme (FmPG) com a PG do S. Purpureum (SpPG), sendo que esta última foi cris- talizada em complexo com galacturonato no trabalho de Shimizu et al (T. Shimizu, T. Nakatsu, K. Miyairi, T. Okuno, H. Kato, Active-site architecture of endopolygalacturonase I from Stereum purpureum revealed by crystal struc- tures in native and ligand-bound forms at atomic resolution, Biochemistry, 41 , 6651-6659, 2001). Foi observado que a FmPG sobreposta à de S. purpureum apresentou boa sobreposição de aminoácidos no sítio de interesse; e também que a posição do galacturonato cristalizado em complexo com a SpPG1 corresponde à posição obtida pelos ligantes no docking com a FmPG, o que valida a técnica para atracamento de ligantes no sítio alvo da proteína (Figura 3) e pode ser considerada um controle positivo da metodologia.
Um adicional trabalho foi realizado para a análise da conser- vância de parâmetros físico-químicos e estruturais dentre os resíduos importantes entre as estruturas de PGs fúngicas. Sabe-se que a função da proteí- na é mais conservada com relação à estrutura 3D do que em relação à sequência primária (Chothia C, Lesk AM. The relation between the divergence of sequence and structure in proteins. EMBO J. Apr;5(4):823-6, 1986), havendo várias proteínas com pouca ou nenhuma similaridade de sequência que, mesmo assim, têm similaridade estrutural. Conhecer a estrutura permi- te-nos explicar o mecanismo bioquímico pelo qual a proteína implementa sua funcionalidade. Os fatores que determinam a funcionalidade do sítio ati- vo de uma proteína são muito complexos e dependem da estrutura tridimensional, além das propriedades bioquímicas e biofísicas.
É possível analisar os sítios funcionais como um nano- ambiente físico-químico que acompanha uma função, ao invés de considerá- los como um grupo de resíduos fixos. Assim, buscamos uma caracterização mais genérica do sítio ativo (e/ou conjunto dos aminoácidos que constroem o chamado sítio de ligação ao substrato), a partir de descritores estruturais, sem considerar necessariamente a conservação como o principal fator e sim a geometria específica, que sejam úteis para a previsão dos resíduos catalíticos das enzimas.
Aplicamos um método para seleção de descritores da estrutura contidos no STING_DB (Neshich, G., Togawa, R., Mancini, A. L., Kuser, P. R., Yamagishi, M. E. B., Pappas Jr., G., Torres, W. V., Campos, T. E, Ferreira, L. L, Luna, F. M., Oliveira, A. G., Miura, R. T., Inoue, M. K., Horita, L. G., de Souza, D. E, Dominiquini, E, Álvaro, A., Lima, C. S., Ogawa, E O., Go- mes, B. G., Palandrani, J. C. E, dos Santos, G. E, de Freitas, E. M., Mattiuz, A. R., Costa, I. C, de Almeida, C. L, Souza, S., Baudet, C. and Higa, R. H. STING Millennium: a Web based suite of programs for comprehensive and simultaneous analysis of protein structure and sequence. Nucleic Acids Research, 31 :13, 3386-3392, 2003), projetado especificamente para previsão do sítio catalítico e do sítio de ligação ao substrato de enzimas. Apenas alguns resíduos da enzima participam da catálise, ao passo que a grande maioria dos resíduos são não reativos. Outros resíduos são caracterizados como aqueles que servem para o atracamento de ligante ou substrato e estes também tem suas características que podem ser usadas para sua sele- ção e consequentemente, para descrição do nano-ambiente criado por este conjunto de resíduos que compõem o sítio de ligação. Com a identificação de um conjunto dos descritores de nano ambiente, estamos habilitados para a construção de uma tabela de assinaturas (consulta sobre os descritores estruturais dos resíduos restringindo seus intervalos de valores) para os di- versos membros de famílias enzimáticas. Estas assinaturas devem funcionar em todos os membros se identificadas com rigor. No caso da proteína PG, identificamos apenas dois parâmetros que com sucesso foram capazes de selecionar em todas as estruturas existentes no PDB o conjunto de resíduos que compõem o sítio catalítico que, como já foi mencionado anteriormente, é constituído por três aminoácidos idênticos - ácidos aspárticos (Glu), que tem numerações 191 , 212 e 213 no FmPG 1 HG8.
Foram examinadas 7 estruturas de PGs fúngicas (em parêntesis a numeração dos aminoácidos da tríade catalítica correspondentes em cada estrutura) 1hg8 (191 , 212,213), 1kcd (153, 173,174), 1k5c (153, 173,174), 1 ia5 (159,180,181), 1czf (180,201 ,202), 2iq7 (178,199,200) e 1bhe (202,223,224). Usando a ferramenta Select do Java Protein Dossier. O conjunto de descritores e seus intervalos de valores que caracterizam única- mente estes resíduos foram: Valor do parâmetro Conservation HSSP Relati- ve Entropy <= 2 e do parâmetro Electrostatic Potencial no último átomo pesado (LHA) num intervalo de [-300,-167 kT/e], o que indica a característica do potencial eletrostático medido em volta de último átomo pesado da cadeia lateral, sendo este negativo e os resíduos possuem alta conservação na evolução deste aminoácido no contexto da estrutura desta enzima (indicado pelo baixo valor de "Conservation HSSP Relative Entropy").
Em adição, foram identificados os aminoácidos constituintes de sitio de ligação ao substrato para estas estruturas, de acordo com a sua pre- sença estabelecendo interações com a molécula de galacturonato na estrutura da SpPG (PDB 1 KCD). O conjunto de descritores e seus respectivos valores, usados para identificar o nano ambiente criado na estrutura protéica por eles, são bem mais complexos e diversos. É constituído pelos seguintes parâmetros STING, com seus respectivos intervalos: Conservation HSSP Relative Entropy <= 4; Reliability (x100) >= 80; Rotamers Percent <= 8; E- lectrostatic Potencial Average Range:[-12,50]; Unused Contacts Total >= 62; Unused Contacts Energy Total >= 127; Hydrophobic Scale Isolation < 1 ; Sur- face Accessibility Isolation < 33. Pode-se observar que estes aminoácidos, além de conservados altamente, têm baixo teor de rotâmetros, também pos- suem baixo valor de intervalo de potencial eletrostático médio (calculado como uma media em volta de todos os átomos) bem mais positivo que aquele calculado em volta do LHA para resíduos do sitio catalítico. Outra característica observada foi o alto número de contatos não usados (indicando alto potencial em fazer contatos com molécula de substrato) e tendo hidrofobici- dade baixa e acessibilidade das moléculas ao solvente não expressiva porém existente. Estes conjuntos foram usados não apenas para identificação nas estruturas estudadas, como também para melhor compreender o ambiente para qual o inibidor seria construído, tendo a eficácia necessária para sua aplicação final. Portanto, estes parâmetros indicam as características físico-químicas do alvo terapêutico para o adequado desenho dos novos compostos.
Para o desenho computacional de ligantes partiu-se da estrutu- ra do ligante natural, galacturonato. A partir dele foram feitas buscas por compostos que possuíam similaridade na estrutura química acima de 90% na base de dados PubChem (http://pubchem.ncbi.nlm.nih.gov/) através do "PubChem Structure Search" (Junguk Hur, David J Wild: PubChemSR: A se- arch and retrieval tool for PubChem, Chemistry Central Journal, 2:11 doi: 10.1186/1752-153X-2-11 , 2008) e, ao todo, foram obtidas 2004 estruturas. Também foi feito o desenho de ligantes tendo como alvo principal os resíduos D194, H188 e G305, que são conservados apenas nos fungos; as plantas possuem prolina/leucina no lugar da histidina e histidina/treonina no lugar do aspartato. A estratégia para o desenho desses ligantes partiu da observação da posição de todos os aminoácidos do sítio ligante e confirmação de conservação estrita a fungos através de vários alinhamentos feitos usando o CLUSTALw entre estruturas primárias de fungos e plantas (apenas algumas sequências de plantas são mostradas na Figura 1). Todas as estru- turas desenhadas foram então submetidas a simulações de docking com a estrutura da FmPG, código PDB 1 HG8. O docking foi realizado com o programa Molegro Virtual Docking (MVD) (Thomsen R, Christensen MH.: Mol- Dock: a new technique for high-accuracy molecular docking. J Med Chem. Jun 1 ;49(11):3315-21 , 2006.), que é baseado em algoritmo evolutivo para simular as interações ligante-proteína.
As simulações de docking (com ligante flexível) usando-se o programa MVD, foram efetuadas centralizando-se nos resíduos do sítio ativo mencionado e com um raio de esfera de espaço de busca de 30Ã (que envolveu quase toda a proteína). O algoritmo de cálculo de score usado foi o MolDock Score [GRID], usando uma resolução de Grid de 0,3Â (avaliando- se o ligante por meio de Interações internas de pontes de hidrogénio, interações eletrostáticas e torções Sp2-Sp2). O algoritmo de busca e docking usado foi o MolDock Optimizer (que é uma implementação de uma variação do algoritmo evolutivo), com 10 rodadas, tamanho de população igual a 50 e com 2000 iterações. Após o docking, o MVD realizou Minimização de energia e otimização de pontes de Hidrogénio das "poses" (sendo que uma pose é um modo de ligação candidato) obtidas. Com o MVD é possível visualizar os resultados das simulações em modelos tridimensionais, o que torna possível eliminar facilmente as "poses" que adotaram posições visualmente erróneas, não tendo de levar apenas em consideração os valores numéricos fornecidos pelo programa para isso. Dada a importância dos resíduos preferenciais H188, D 94 e G305 e os envolvidos na interação ligante-proteína D194, H188, H234, R234, K269, T302 e G305, os compostos foram então selecionados de acordo com os valores de energia, em relação a esses resíduos, fornecidos pelo programa através do módulo "Ligand Energy Inspector". Foi também considerado o MolDock score, que é a energia total da pose, como parâmetro secundário na seleção de ligantes.
A cada docking seguiu-se a seleção de ligantes e modificações estruturais nos mesmos a fim de melhorar a interação com os resíduos-alvo. As modificações foram feitas com o programa ChemBioDraw (http://www. cambridgesoft.com/software/ChemBioDraw/) e as estruturas foram energeticamente minimizadas com o mesmo.
Foram obtidas 11 estruturas (Figura 4) derivadas daquelas que apresentaram melhores resultados nas rodadas de dockings anteriores e que se sugere que podem apresentar atividade inibitória para a(s) enzima(s) poligalacturonase(s). Nas tabelas 6 e 7 são demonstrados os resultados de docking dos ligantes desenhados e de duas simulações de docking executadas usando os ligantes naturais trigalacturonato e monogalacturonato, contra as enzimas FmPG e CIPGA, sendo que foi feito também docking com esta última devido a maiores identidade e similaridade com as enzimas modela- das do que o apresentado pela FmPG. Os valores de energia na interação com os resíduos escolhidos como alvo (numeração da CIPGA: H234, R267, K269 e soma das energias dos resíduos D194, H188 e G305 e segundo numeração da FmPG; H221 , R254, K256 e soma das energias dos resíduos D181 , H175 e G292, numeração da CIPGA) são menores para os ligantes desenhados, bem como os valores de MolDock score, interação com proteína, interações de hidrogénio e o LE1 (divisão do valor do MolDock score pelo número de átomos do ligante, exceto hidrogênios), significando que o complexo formado entre os compostos desenhados computacionalmente e até mais estável.
Tabela 6: Valores de energias de interação (em Kcal/mol) entre os ligantes e os resíduos conservados entre todas as PGs (H234, R267, K269 e Y302), soma das energias de interações estabelecidas entre os ligantes e os resíduos específicos de fungo (H188, D194 e G305) e valores de Moldock score (energia total do ligante), Protein (total energia de interação do ligante com a proteína), Hbond (energia decorrente de interações de Hidrogénio) e LE1 (valor do MolDock score dividido pelo número de átomos pesados, exceto hidrogênios) fornecidos pelo Molegro Virtual Docker, no módulo Ligand Energy Inspector. Estes resultados foram obtidos da simulação de docking dos ligantes desenhados com o espaço de busca centralizado no sítio catalítico da FmPG. Para o desenho das moléculas foram especi- almente consideradas as interações com os resíduos especificados. A soma das energias de interação entre os ligantes e esses resíduos foi o primeiro parâmetro de avaliação para exclusão e modificação das estruturas dos compostos. O segundo parâmetro utilizado foi o MolDock score. Também foram consideradas as energias de interação com proteína, de ligação de hidrogénio e o LE1. Observa-se então que são menores os valores de energia total entre esses resíduos e os ligantes desenhados se comparados aos valores encontrados no docking das moléculas de galacturonatos, o que sugere que a ligação dos ligantes desenhados a esses resíduos pode ser mais estável.
Figure imgf000040_0001
Tabela 7: Valores fornecidos pelo docking dos ligantes desenhados com espaço de busca centralizado no sítio catalítico da CIPGA (2IQ7.pdb), conforme padrão da tabela 6. Foi feito um docking com essa en- zima, pois ela serviu de molde para a confecção de modelos para as sequências enzimáticas que não possuíam estrutura terciária resolvida e devido à sua maior similaridade e identidade. Observa-se que são menores os valores de energia total de interação entre os resíduos H221 , R254, K256, Y289 (mesmos resíduos da 1 HG8 citados na tabela 6, mas com numeração diferente, agora correspondentes a numeração encontrada no 2IQ7.pdb) e os ligantes desenhados comparado com os valores dos galacturonatos, o que sugere que a ligação dos compostos desenhados a esses resíduos pode ser mais estável. No entanto, os valores de energia de interação entre os ligantes e os resíduos D181 , G292 e H175, não foram muito diversos dos valores dos galacturonatos, exceto no caso dos ligantes dh3211 , 204 e 402, que apresentaram menores valores de energia.
Figure imgf000041_0001
Considerando que os compostos serão para uso agrícola e seus resíduos poderão ser consumidos por humanos e animais é fundamental que o desenho de novos compostos seja analisado em relação ao potencial de risco de produção de efeitos indesejáveis. Pensando nisso, foi feita predição de parâmetros moleculares que influenciam na Absorção, Distribuição, Metabolismo, Excreção e Toxicidade (ADMET) utilizando-se o Osiris Pro- perty Explorer (Thomas Sander, Actelion Pharmaceuticals Ltd., http://www.organic-chemistry.org/prog/peo ). Essa ferramenta permite analisar cLogP, solubilidade em água, peso molecular e riscos de toxicidade; a- lém disso, fornece dois parâmetros: Druglikeness e Drug-score. O Druglike- ness baseia-se na comparação do composto desenhado com compostos de base de dados de compostos comercializados e de base de dados de com- postos sem propriedades farmacológicas (Fluka). O Drug-score fornece um valor geral que considera todos os parâmetros anteriores. Os resultados da análise constam na Tabela 8. Como não é interessante que os compostos sejam absorvidos pelo trato gastrointestinal dos consumidores, valores menores de cLogP são desejáveis. Alta solubilidade em água também é desejável, pois favorece a aplicação do produto na agricultura e se mantém superficialmente na planta, o que é interessante, pois vários fungos chegam à planta pela superfície. Também é possível uma aplicação com água no solo, que seria absorvida pelas raízes (outra porta de entrada às infecções fúngica) e disseminar-se para outros pontos da planta pelo Xilema. Ademais, alta solubilidade em água também favorece a difusão através da rede vascular vegetal quando for de interesse que o composto atue na inibição das PGs vegetais. O Osíris fornece dados de toxicidade animal tais como risco de mutagenicidade, tumorogenicidade, efeito reprodutivo e irritação baseado em fragmentos moleculares com toxicidades conhecidas armazenadas em base de dados (RTECS).
Tabela 8: Resultados da análise de ADMET, feita pelo programa Osíris Property Explorer (http://www.organic-chemistry.org/prog/peo/) com os dados de risco de toxicidade tais como mutagenicidade, tumorgenicidade, irritabilidade e eventuais efeitos colaterais reprodutivos, baseados em fragmentos de moléculas conhecidas depositados no banco de dados RTECS. Este programa fornece um valor de LogP, o coeficiente de partição entre á- gua e n-octanol, que mede a hidrofobicidade (quanto maior o valor, maior a solubilidade do composto em lipídeos). No caso das plantas e tratando-se de um composto de uso superficial (não precisa ser absorvido para agir), ter um LogP baixo pode ser algo positivo pois será menos absorvido e menos distribuído em tecidos animais. Fornece um valor de LogS (solubilidade), parâ- metro que afeta tanto absorção e distribuição, cujo valor deve ser maior que -4, baseado no LogS médio dos medicamentos comercializados. Fornece o Drug-score que é um valor geral resultante da combinação de todos os parâmetros anteriores mais o Druglikeness, que compara fragmentos do composto desenhado com base de dados de compostos comercializados e com base de dados de compostos que não servem como fármacos (Fluka). É desejável que tanto Druglikeness quanto o Drug-score sejam positivos.
Figure imgf000043_0001
Temos 2 ligantes que se destacam:
-dh3211 , nome IUPAC (3S,Z)-3-amino-4-((3S,4S,E)-6-(2- aminoethylidene)-4-(hydroxymethyl)hexahydropyridazin-3-yl)-1-((3R,4R)-4- (3,3-dihydroxyallyl)-2-hydroxy-6-((E)-3-hydroxyprop-1-en-1-yl)-3,4-dihydro- 2H-pyran-3-yl)but-1-ene-2,3-diol, SMILE C1 (=0)OC(=C(C(C1 (\C(=C(/0[H])C(0[H])(N([H])[H])C(C2(C(C(\C(N(N2[H])[H ])=C([H])/C(N([H])[H])([H])[H])([H])[H])([C](0[H])[H])[H])[H])([H])[H])[H])[H])([H] )\C(=C(\C(=0)0[H])[H])[H])[H])\C(=C(\C(0[H])([H])[H])[H])[H] (este ligante, atracado ao sítio alvo, está mostrado na figura 5)
-602, nome IUPAC (3S,4S,E)-2,6-bis((1 ,1 ,4,4-tetrahydroxybutan- 2-yl)oxy)hex-5-ene-1 , ,3,4,5-pentaol, SMILE O(C(C(0[H])(C(0[H])(C(/0[H])=C(\OC(C(C(0[H])(0[H])[H])([H])[H])(C(O[H])( 0[H])[H])[H])[H])[H])[H])(C(0[H])(0[H])[H])[H])C(C(C(0[H])(0[H])[H])([H])[H])( C(0[H])(0[H])[H])[H] (este ligante, atracado ao sítio alvo, está mostrado na figura 6).
O primeiro composto, dh3211 , obteve ótimas interações com os resíduos H188, D194 e G305, que são específicos para fungos e o segundo, 602, com os resíduos H234, R267 e K269, que são resíduos conservados inclusive em plantas, como pode ser visto nas tabelas 6 e 7. Além disso, o 602 também obteve destaque na análise de ADMET (tabela 8). Ambos podem ser considerados como bons potenciais para inibição das enzimas fúngicas, porém a maior afinidade específica à PGs Fúngicas pelo dh3211 nas simulações feitas são indicativo de que esse composto tem um potencial de uso mais seguro em relação ao 602, pois os resíduos com os quais interage melhor não estão presentes em plantas. Porém, se considerarmos outras aplicações para esses compostos além da fungicida, como por exemplo, retardamento da maturação de frutos ou mesmo da germinação de sementes (funções fitofisiológicas essas que tem relação direta com a expressão de PG vegetal) todos os compostos, inclusive aqueles que são potencialmente inibidores de enzimas vegetais, podem contribuir para a produção agrícola. Além disso, outras funções das PGs vegetais poderão ser manipuladas u- sando estes compostos caso seja confirmada sua ação inbitória sobre as PGs de plantas, tais como: processos de separação de células, germinação, abscisão de órgãos, deiscência das anteras, maturação do grão de pólen, amadurecimento do fruto, formação das células do xilema e crescimento do tubo polínico (Kim J, Shiu SH, Thoma S, Li WH, Patterson SE. Patterns of expansion and expression divergence in the plant poiygalacturonase gene family. Genome Biol. 7(9):R87, 2006). Acreditamos que o composto desenhado dh3211 , por ter apresentado fortes interações com resíduos específi- cos de PGs fúngicas, terá maior especificidade à ligação sobre estas enzimas em detrimento das PGs vegetais (que possuem resíduos com propriedades físico-químicas antagónicas aos resíduos específicos de PGs fúngicas). Possivelmente o composto dh3211 seria um bom candidato para aplicação em campo sem causar inibição da enzima vegetal.

Claims

REIVINDICAÇÕES
01. Método para desenhar computacionalmente novos compostos com potencial função inibitória da enzima endopoligalacturonase caracterizado pelas seguintes etapas: (i) obtenção de arquivos de coordenadas re- ferentes às estruturas tridimensionais, a partir do banco PDB, da estrutura da enzima endopoligalacturonase (PG); (ii) busca por sequências homólogas, que também possuam estrutura depositada no PDB, às estruturas primárias das enzimas dos organismos de interesse usando o BLASTp contra o banco de dados de sequências primárias do PDB; (iii) predição de modelos de estruturas tridimensionais das PGs que não possuírem estrutura depositada nos bancos públicos utilizando as sequências primárias das enzimas dos organismos de interesse e como molde (template) as estruturas cujas sequências primárias são homólogas à sequência de interesse; (iv) edição das estruturas otimizando a numeração de resíduos na sequência primaria usando o programa Deep-View, minimização da energia dos modelos gerados através do programa GROMACS, visualizadas das estruturas terciárias para análise da sobreposição das estruturas terciárias através do PyMol, avaliação da qualidade dos modelos gerados através da análise de gráficos Ramachandran, gerados através da utilização do Java Protein Dossier e da plataforma STING, e analise dos modelos em relação a erros na estrutura tridimensional pelo ProSa-web; (v) alinhar a FmPG (1 HG8.pdb) às estruturas depositadas no PDB com o TM-align; (vi) fazer alinhamentos entre a estrutura primária de proteínas homólogas à proteína de interesse através do programa ClustalW 2.0 e incluir proteínas de outros organismos, evidenciando as similaridades e diferenças entre estes dois conjuntos de proteínas e buscando as correspondências no alinhamento de estrutura primária dos resíduos importantes, seguindo certos critérios como: presença exclusivamente nas sequências de fungos fitopatogênicos; (vii) buscar estruturas de compostos no PubChem por similaridade maior que 90% com o ligante natural e proceder simulações de docking empregando o programa Molegro Virtual Docker (MVD); (viii) analisar detalhadamente o nano-ambiente do sitio alvo usando-se o programa STING Java Protein Dossier e a ferramenta "select"; (ix) modificar computacionalmente através do programa ChemBioDraw as estruturas selecionadas na etapa vii de acordo com as características físico- químicas e estruturais encontradas na etapa viii a fim de aumentar os valores de afinidade de ligação e buscar por ligantes baseados na forma da cavidade criada pelo MVD na região dos resíduos de interesse; e (x) realizar predição de parâmetros moleculares que interferem na Absorção, Distribuição, Metabolismo, Excreção e Toxicidade utilizando a ferrametna online Osíris Property Explorer.
02. Método de inibição ou inativação das enzimas poligalacturo- nases por meio de ligação parcial ou total de inibidor desenvolvido de acordo com a reivindicação 1.
03. Método de prevenção ou tratamento contra microrganismos que utilizam as enzimas poligalacturonases para invadir os tecidos do hospedeiro utilizando-se compostos de acordo com a reivindicação 2.
PCT/BR2012/000540 2011-12-30 2012-12-27 Inibidores das enzimas poligalacturonases de fungos fitopatogênicos WO2013097012A1 (pt)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
BR11074329 2011-12-30
BRP1107432-9 2011-12-30

Publications (1)

Publication Number Publication Date
WO2013097012A1 true WO2013097012A1 (pt) 2013-07-04

Family

ID=48696127

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/BR2012/000540 WO2013097012A1 (pt) 2011-12-30 2012-12-27 Inibidores das enzimas poligalacturonases de fungos fitopatogênicos

Country Status (1)

Country Link
WO (1) WO2013097012A1 (pt)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105320847A (zh) * 2015-10-26 2016-02-10 广东药学院 一种基于模式分析研究中药物质基础和作用机制的方法
CN108629151A (zh) * 2018-03-22 2018-10-09 浙江工业大学 一种基于拉氏图的群体蛋白质结构预测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010000807A1 (en) * 1997-06-02 2001-05-03 Ernesto Freire Method for prediction of binding targets and the design of ligands
US20050004766A1 (en) * 1999-11-10 2005-01-06 Kalyanaraman Ramnarayan Use of computationally derived protein structures of genetic polymorphisms in pharmacogenomics for drug design and clinical applications
WO2012031343A2 (pt) * 2010-09-08 2012-03-15 Emresa Brasileira De Pesquisa Agropecuária - Embrapa Identificação de alvos terapêuticos para desenho computacional de drogas contra bactérias dotadas da protéina pilt

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010000807A1 (en) * 1997-06-02 2001-05-03 Ernesto Freire Method for prediction of binding targets and the design of ligands
US20050004766A1 (en) * 1999-11-10 2005-01-06 Kalyanaraman Ramnarayan Use of computationally derived protein structures of genetic polymorphisms in pharmacogenomics for drug design and clinical applications
WO2012031343A2 (pt) * 2010-09-08 2012-03-15 Emresa Brasileira De Pesquisa Agropecuária - Embrapa Identificação de alvos terapêuticos para desenho computacional de drogas contra bactérias dotadas da protéina pilt

Non-Patent Citations (8)

* Cited by examiner, † Cited by third party
Title
ANDERSON, AC.: "The Process of Structure-Based Drug Design.", CHEMISTRY & BIOLOGY, vol. 10, no. 9, September 2003 (2003-09-01), pages 787 - 797 *
BERENDSEN, HJC ET AL.: "GROMACS: A message-passing parallel molecular dyhamics implemeiitation.", COMPUTER PHYSICS COMMUNICATIONS, vol. 91, 1995, pages 43 - 56 *
CHO, SW ET AL.: "The (. X-ray Structure of Aspergillus aculeatus Modeled polygalacturonase and the structure of the polygalacturonase- Octagalacturonate Complex", J. MOL., vol. 314, 2001, pages 863 - 878 *
FEDERICI, L ET AL.: "Structural of endopolygalacturonase for the requirerrients interaction with PGIP (polygalacturonase-inhibiting protein).", PROCEEDINGS OF THE NATIONAL ACADEMY OF SCIENCES OF THE UNITED-STATES OF AMERICA, vol. 98, no. 23, 2001, pages 13425 - 13430 *
MAULIK, A ET AL.: "Comparative study of protein-protein interaction Observed in Polygalacturonase-Inhibiting Proteins from Phaseolus vulgaris and Glycine max and polygalacturonase from Fusarium moniliforme.", BMC GENOMICS, vol. 10, no. 3, 2009, pages S19 *
NESHICH, G ET AL.: "The Star STING server: a multiplataform environment is Protein structure analysis.", GENETICS AND MOLECULAR RESEARCH, vol. 5, no. 4, 2006, pages 717 - 722 *
ROCCHIA W ET AL.: "Electrostatic potential calculation is biomolecules - creating a database of pre-calculated values Reported on the per residue basis is there PDB protein structures.", GENET. MOL RES, vol. 6, no. 4, 2007, pages 923 - 936 *
YAMAMOTO K ET AL.: "Synthesis of the analogue mimicking trigalacturonic acid the expected transition state in the glycosidases.", CARBOHYDRATE RESEARCH, vol. 345, 2010, pages 572 - 585 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105320847A (zh) * 2015-10-26 2016-02-10 广东药学院 一种基于模式分析研究中药物质基础和作用机制的方法
CN108629151A (zh) * 2018-03-22 2018-10-09 浙江工业大学 一种基于拉氏图的群体蛋白质结构预测方法
CN108629151B (zh) * 2018-03-22 2021-06-18 浙江工业大学 一种基于拉氏图的群体蛋白质结构预测方法

Similar Documents

Publication Publication Date Title
Thomazella et al. Loss of function of a DMR6 ortholog in tomato confers broad-spectrum disease resistance
Rampersad Pathogenomics and management of Fusarium diseases in plants
Cao et al. Genome-wide identification and evolutionary analyses of the PP2C gene family with their expression profiling in response to multiple stresses in Brachypodium distachyon
Wibberg et al. Genome analysis of the sugar beet pathogen Rhizoctonia solani AG2-2IIIB revealed high numbers in secreted proteins and cell wall degrading enzymes
Hanada et al. Importance of lineage-specific expansion of plant tandem duplicates in the adaptive response to environmental stimuli
Ileperuma et al. High-resolution crystal structure of plant carboxylesterase AeCXE1, from Actinidia eriantha, and its complex with a high-affinity inhibitor paraoxon
Gaballah et al. Genetic diversity of selected rice genotypes under water stress conditions
Mittal et al. Comparative analysis of CDPK family in maize, Arabidopsis, rice, and sorghum revealed potential targets for drought tolerance improvement
Neupane et al. Identification and characterization of mitogen-activated protein kinase (MAPK) genes in sunflower (Helianthus annuus L.)
Verma et al. Genome-wide identification of the Alba gene family in plants and stress-responsive expression of the rice Alba genes
Castiblanco et al. Candidate genes for aggressiveness in a natural Fusarium culmorum population greatly differ between wheat and rye head blight
Abdelaziz et al. Unravelling the Role of Piriformospora indica in combating water deficiency by modulating physiological performance and chlorophyll metabolism-related genes in Cucumis sativus
Zhao et al. Transcriptomic and evolutionary analyses of white pear (Pyrus bretschneideri) β-amylase genes reveals their importance for cold and drought stress responses
Yang et al. Genome-wide identification and analysis of chitinase GH18 gene family in Mycogone perniciosa
Singh et al. In silico identification and characterization of 1-aminocyclopropane-1-carboxylate deaminase from Phytophthora sojae
Tandon et al. Evidence of salicylic acid pathway with EDS1 and PAD4 proteins by molecular dynamics simulation for grape improvement
WO2013097012A1 (pt) Inibidores das enzimas poligalacturonases de fungos fitopatogênicos
Singh et al. Unraveling the potential role of bioactive molecules produced by Trichoderma spp. as inhibitors of tomatinase enzyme having an important role in wilting disease: an in-silico approach
Nene et al. Plant catalase in silico characterization and phylogenetic analysis with structural modeling
He et al. Genome-wide identification and expression analysis of the polygalacturonase gene family in sweetpotato
Luo et al. Genome-wide identification and expression analysis of Rosa roxburghii autophagy-related genes in response to top-rot disease
Martins et al. Transcriptome responses of wild Arachis to UV-C exposure reveal genes involved in general plant defense and priming
Han et al. Genome-wide survey and expression analyses of hexokinase family in poplar (Populus trichocarpa)
Xiao et al. Genome-wide identification, classification and expression analysis of GHMP genes family in Arabidopsis thaliana
Ilyas et al. Molecular characterization of Germin-like Protein Genes in Zea mays (ZmGLPs) using various in silico approaches

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 12862077

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 12862077

Country of ref document: EP

Kind code of ref document: A1