Utilize este identificador para referenciar este registo:
https://hdl.handle.net/1822/81195
Título: | Biochemical complex data generation and integration in genome-scale metabolic models |
Autor(es): | Ribeiro, João Manuel Capela Araújo |
Orientador(es): | Dias, Oscar Liu, Filipe Alexandre Wang |
Palavras-chave: | Genome-scale metabolic models Biochemistry Lipid metabolism Biosynthesis Bioinformatics Chemoinformatics Modelos metabólicos à escala genómica Bioquímica Gap-filling Ontologias |
Data: | 2021 |
Resumo(s): | The (re-)construction of Genome-Scale Metabolic (GSM) models is highly dependent on
biochemical databases. In fact, the biochemical data within these databases is limited, lacking,
most of the times, in structurally defined compounds’ representations. In order to circumvent
this limitation, compounds are frequently represented by their generic version. Lipids are
paradigmatic cases: given that a multitude of lipid species can occur in nature, not only is
their storage in databases hampered, but also their integration into GSM models. Accordingly,
converting one lipid version, in GSM models, into another can be tricky, as these compounds
possess side chains that are likely to be transferred all across their biosynthetic network.
Hence, converting a lipid implies that all its precursors have to be converted as well, requiring
information on lipid specificity and biosynthetic context.
The present work represents a strategy to tackle this issue. Biochemical cOmplex data
Integration in Metabolic Models at Genome scale (BOIMMG)’s pipeline encompasses the
integration and processing of biochemical data from different sources, aiming at expanding the
current knowledge in lipid biosynthesis, and its integration in GSM models.
Generic reactions retrieved from MetaCyc were handled and transformed into reactions with
structurally defined lipid species. More than 30 generic reactions were fully (and 27 partially)
characterized, allowing to predict over 30000 new lipid structures and their biosynthetic context.
The integration of BOIMMG’s data into GSM models was conducted for electron-transfer
quinones, glycerolipids, and phospholipids metabolism. The validation accounted on the
comparison of models with different versions of these metabolites. BOIMMG’s conversion
modules were applied to Escherichia coli’s iJR904 model [1], generating 53 more matching lipids
and 38 more matching reactions with iJR904 model’s iteration iAF1260b [2, 3], in which the
conversion was performed and curated manually.
To the best of our knowledge, BOIMMG’s database is the only with biosynthetic information
regarding structurally defined lipids. Moreover, there is no other state-of-the-art tool capable
of automatically generating complex lipid-specific networks. A reconstrução de modelos metabólicos à escala genómica (GSM na língua inglesa) depende grandemente da informaçãoo bioquímica presente em bases de dados. De facto, esta informação é muitas vezes limitada, podendo não conter representações de compostos estruturalmente definidos. Como tentativa de contornar esta limitação, os compostos químicos são frequentemente representados pela sua representação genérica. Os lípidos são casos paradigmáticos, dado que uma multitude de diferentes espécies químicas de lípidos ocorrem na natureza, dificultando o seu armazenamento em bases de dados, assim como a sua integração em modelos GSM. Desta forma, o processo de converter lípidos de uma versão genérica para uma versão estruturalmente definida não é trivial, dado que estes compostos possuem cadeias laterais que são transferidas ao longo das suas vias de biossíntese. Consequentemente, essa conversão implica que todos os precursores desses lípidos também sejam convertidos, requerendo haver informação relativa a lípidos específicos e às suas relações biossintéticas. O presente trabalho representa uma estratégia para resolver esse problema. A pipeline do software desenvolvido no âmbito deste trabalho, Biochemical cOmplex dataIntegration in Metabolic Models at Genome scale (BOIMMG), engloba a integração e processamento de dados bioquímicos de diferentes fontes, visando a expansão do conhecimento atual na biossíntese de lípidos, assim como a sua integração em modelos GSM. Relativamente à segunda fase, reações genéricas extraídas da base de dados MetaCyc foram processadas e transformadas em reações com lípidos estruturalmente definidos. Mais de 30 reações genéricas foram completamente (e 27 parcialmente) caracterizadas, permitindo prever mais de 30000 novas estruturas de lípidos, assim como os seus contextos biossintéticos. A integração dos dados nos modelos GSM foi conduzido para o metabolismo das quinonas transportadoras de eletrões, glicerolípidos e fosfolípidos. A validação teve em conta a comparação entre modelos com diferentes versões destes metabolitos. Os módulos de conversão do BOIMMG foram aplicados ao modelo iJR904 de Escherichia coli [1], gerando mais 53 lípidos e 38 reações que se encontram no modelo iAF1260b [2, 3], uma iteração do modelo iJR904 cuja conversão de lípidos se procedeu manualmente. A base de dados gerada pelo método BOIMMG é a única que contém informação biossintética relata a lípidos estruturalmente definidos. Adicionalmente, BOIMMG é uma ferramenta única que permite gerar redes complexas de lípidos automaticamente. |
Tipo: | Dissertação de mestrado |
Descrição: | Dissertação de mestrado em Bioinformatics |
URI: | https://hdl.handle.net/1822/81195 |
Acesso: | Acesso aberto |
Aparece nas coleções: | BUM - Dissertações de Mestrado |
Ficheiros deste registo:
Ficheiro | Descrição | Tamanho | Formato | |
---|---|---|---|---|
João-Manuel-Capela-Araújo-Ribeiro-provas-dissertação.pdf | 3,15 MB | Adobe PDF | Ver/Abrir |
Este trabalho está licenciado sob uma Licença Creative Commons