Utilize este identificador para referenciar este registo: https://hdl.handle.net/1822/60059

TítuloImproving predictions in metabolic engineering problems by incorporating enzyme structural information
Autor(es)Resende, Tiago Filipe Coelho
Orientador(es)Soares, Cláudio Manuel
Rocha, I.
Data7-Dez-2018
Resumo(s)Systems biology foundations in this post-genomic era broadly rely upon well performed gene functional annotations. However, the experimental determination of a protein function is a laborious and expensive process, being its application unfeasible for the growing amount of sequences annotated. Current methodologies are based on computational tools that predict protein function over sequence similarity, but neglect a significant part of the putative proteins, ignore structural features and propagate annotation errors. The present thesis focuses in the improvement of predictions in metabolic engineering problems by incorporating enzyme structural information. The uncertainty on the usage of NADP(H) or NAD(H) as co-factors was addressed due to the major impact in metabolic engineering applications these molecules have, severely affecting both predictions and strain design results. The molecular determinants for cofactor specificity were unveiled, using enzyme structural information from a representative dataset of enzymes present in Protein DataBank with NAD(P)(H) as cofactors, and support vector machines. The integration of homology modelling tools and a support vector machine predictive model allowed a process automation for predicting cofactor specificity. The resulting software was made available online in the form of a webserver. Cofactor prediction of a curated dataset of structurally uncharacterized enzymes was performed with success, validating the developed method. The analysis and curation of the use of these cofactors in genome-scale metabolic models (GEM) was also performed through the cofactor prediction of sequences from 59 GEMs associated to reactions using NAD(P)(H). Results show some inconsistencies in GEM curation that can impair the correct simulation of the models, with an overall estimate of 28% of the genes implemented in the model being misclassified for cofactor specificity. The most recent GEM from Saccharomyces cerevisiae, Yeast 7.6, was corrected following the predictions performed and generally showed considerably improved results compared with the original version in the central metabolism, particularly for the flux in the pentose phosphate pathway. With the information on NAD(P)(H) cofactor specificity generated, a method was also developed and implemented to automatically predict the set of optimal gene mutations necessary for changing the NAD(P)(H) cofactor specificity of enzymes with unknown structure. Preliminary data shows promising results for the development of a tool for the automatic prediction of cofactor changing mutations, but experimental validation and further development are still a requirement.
A fundação da biologia de sistemas depende amplamente numa correta anotação de genes por homologia. Contudo, a determinação experimental da função de uma proteína é um processo moroso e dispendioso, sendo a sua aplicação inexequível para o crescente número de sequências anotadas. Metodologias atuais são baseadas em ferramentas computacionais que preveem a função de uma proteína de acordo com a similaridade da sua sequência com outras sequências caracterizadas, mas negligenciam uma parte significativa das proteínas putativas, assim como ignoram características estruturais e propagam erros de anotação. A presente tese foca-se no melhoramento de previsões em problemas de engenharia metabólica através da incorporação de informação sobre estrutura enzimática. A incerteza da utilização de NAD(H) ou NADP(H) como cofatores foi abordada, devido ao enorme impacto em aplicações de engenharia metabólica que estas moléculas possuem. Os determinantes moleculares da especificidade de cofator foram desvendados através da utilização de informação estrutural presente numa base de dados representativa de enzimas com cofatores NAD(P)(H) presentes na PDBe da aplicação de support vector machines (SVM). A integração de ferramentas de modelação por homologia e um modelo preditivo de SVM permitiram a automatização do processo de previsão da especificidade de cofator. O software resultante foi disponibilizado online na forma de um webserver. A previsão dos cofatores de uma base de dados curada de enzimas sem informação estrutural foi efetuada com sucesso, validando o método desenvolvido. A análise e curação do uso deste cofatores em modelos metabólicos à escala genómica (GEM) foi efetuada através da previsão de cofator das sequências associadas a NAD(P)(H) de 59 GEM. Os resultados mostraram algumas inconsistências na curação destes modelos que podem impedir a sua correta simulação, com cerca de 28% dos genes estando tendo o cofator mal classificado. O modelo mais recente de S. cerevisiae, Yeast 7.6, foi corrigido e simulado tendo mostrado resultados gerais melhorados no metabolismo central, particularmente na via da pentose fosfato, quando comparados com o modelo original. Com a informação sobre especificidade de cofatores gerada, um método foi desenvolvido e implementado para a previsão do conjunto ótimo de mutações necessárias para a alteração do cofator de enzimas sem informação estrutural. Os dados preliminares indicam resultados promissores para o desenvolvimento de uma ferramenta para a previsão automática de mutações para alteração de cofatores, embora seja ainda necessária validação experimental das hipóteses geradas.
TipoTese de doutoramento
DescriçãoTese de Doutoramento em Bioengenharia
URIhttps://hdl.handle.net/1822/60059
AcessoAcesso aberto
Aparece nas coleções:BUM - Teses de Doutoramento
CEB - Teses de Doutoramento / PhD Theses

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato 
Tiago Filipe Coelho Resende.pdf5,3 MBAdobe PDFVer/Abrir

Partilhe no FacebookPartilhe no TwitterPartilhe no DeliciousPartilhe no LinkedInPartilhe no DiggAdicionar ao Google BookmarksPartilhe no MySpacePartilhe no Orkut
Exporte no formato BibTex mendeley Exporte no formato Endnote Adicione ao seu ORCID