Utilize este identificador para referenciar este registo:
https://hdl.handle.net/1822/82451
Título: | A model validation pipeline for healthy tissue genome-scale metabolic models |
Autor(es): | Monteiro, Maria Adília Balacó Chócha Pessoa |
Orientador(es): | Rocha, Miguel Ferreira, Pedro G. |
Palavras-chave: | Modelação baseada em restrições Modelos metabólicos contextualizados Package troppo Tarefas metabólicas Tecido humano saudável Constraint-based modelling Context-specific models Healthy human tissue Metabolic tasks Troppo package |
Data: | 22-Dez-2021 |
Resumo(s): | Nos últimos anos, os métodos de alto rendimento disponibilizaram dados ómicos referentes a várias
camadas da organização biológica, permitindo a integração do conhecimento de componentes individuais
em modelos complexos, como modelos metabólicos à escala genómica (GSMMs). Estes podem ser
analisados por métodos de modelação baseada em restrições(CBM), que facilitam abordagens preditivas
in silico.
Os modelos metabólicos humanos têm sido usados para estudar tecidos saudáveis e as suas
doenças metabólicas associadas, como obesidade, diabetes e cancro. Modelos humanos genéricos
podem ser integrados com dados contextuais por meio de algoritmos de reconstrução, com vista a
produzir modelos metabólicos contextualizados (CSMs), que são normalmente melhores a capturar a
variação entre diferentes tecidos e tipos de células. Como o corpo humano contém uma grande variedade
de tecidos e tipos de células, os CSMs são frequentemente adotados como um meio de obter modelos
metabólicos mais precisos de tecido humano saudável.
No entanto, ao contrário de modelos de microrganismos e cancro, que acomodam vários
métodos de validação, como a comparação de fluxos in silico ou de previsões de genes essenciais com
dados experimentais, os métodos de validação facilmente aplicáveis a CSMs de tecido humano saudável
podem ser mais limitados. Consequentemente, apesar de esforços continuados para atualizar os
modelos humanos genéricos e algoritmos de reconstrução para extrair CSMs de alta qualidade, a sua
validação continua a ser uma preocupação.
Este trabalho apresenta uma pipeline para a extração e validação básica de CSMs de tecidos
humanos normais derivados da integração de dados transcriptómicos com um modelo humano genérico.
Todos os CSMs foram extraídos do modelo genérico Human-GEM publicado recentemente por Robinson
et al. (2020), usando o package Troppo em Python e nos algoritmos de reconstrução fastCORE e tINIT
nele implementados. Os CSMs extraídos correspondem a 11 tecidos saudáveis disponíveis no conjunto
de dados GTEx v8.
Antes da extração, métodos de aprendizagem máquina foram aplicados à seleção de um limiar
para conversão em gene scores. Os modelos de maior qualidade foram obtidos com um limite mínimo
global aplicado diretamente aos dados ómicos. A estratégia de validação focou-se no número de tarefas
metabólicas passadas como um indicador de desempenho. Por último, este trabalho é acompanhado
por Jupyter Notebooks, que incluem um guia de extração de modelos para novos utilizadores. n the past few years, high-throughput experimental methods have made omics data available for several layers of biological organization, enabling the integration of knowledge from individual components into complex modelssuch as genome-scale metabolic models (GSMMs). These can be analysed by constraint based modelling (CBM) methods, which facilitate in silico predictive approaches. Human metabolic models have been used to study healthy human tissues and their associated metabolic diseases, such as obesity, diabetes, and cancer. Generic human models can be integrated with contextual data through reconstruction algorithms to produce context-specific models (CSMs), which are typically better at capturing the variation between different tissues and cell types. As the human body contains a multitude of tissues and cell types, CSMs are frequently adopted as a means to obtain accurate metabolic models of healthy human tissues. However, unlike microorganisms’ or cancer models, which allow several methods of validation such as the comparison of in silico fluxes or gene essentiality predictions to experimental data, the validation methods easily applicable to CSMs of healthy human tissue are more limited. Consequently, despite continued efforts to update generic human models and reconstruction algorithms to extract high quality CSMs, their validation remains a concern. This work presents a pipeline for the extraction and basic validation of CSMs of normal human tissues derived from the integration of transcriptomics data with a generic human model. All CSMs were extracted from the Human-GEM generic model recently published by Robinson et al. (2020), relied on the open-source Troppo Python package and in the fastCORE and tINIT reconstruction algorithms implemented therein. CSMs were extracted for 11 healthy tissues available in the GTEx v8 dataset. Prior to extraction, machine learning methods were applied to threshold selection for gene scores conversion. The highest quality models were obtained with a global threshold applied to the omics data directly. The CSM validation strategy focused on the total number of metabolic tasks passed as a performance indicator. Lastly, this work is accompanied by Jupyter Notebooks, which include a beginner friendly model extraction guide. |
Tipo: | Dissertação de mestrado |
Descrição: | Dissertação de mestrado em Bioinformática |
URI: | https://hdl.handle.net/1822/82451 |
Acesso: | Acesso aberto |
Aparece nas coleções: | BUM - Dissertações de Mestrado |
Ficheiros deste registo:
Ficheiro | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Maria Adilia Balaco Chocha Pessoa Monteiro.pdf | 2,35 MB | Adobe PDF | Ver/Abrir |
Este trabalho está licenciado sob uma Licença Creative Commons