Utilize este identificador para referenciar este registo: https://hdl.handle.net/1822/79794

TítuloDevelopment of bioinformatics tools for the classification of transporter systems
Autor(es)Lagoa, Davide Rafael Santos
Orientador(es)Dias, Oscar
Palavras-chaveTranSyT
Transporter systems
TRIAGE
Transport reactions
Genome-scale metabolic models
Transporters inference
Bioinformatics
Data14-Dez-2018
Resumo(s)The Transport Systems Tracker (TranSyT) is a new approach to the problem of identifying genome-wide transmembrane transport systems, annotating these with reactions. TranSyT is the next iteration of TRIAGE (29), though more efficient and designed to overcome its limitations. This new approach still relies on the TCDB (118) to perform the annotation of transporters systems; however, TranSyT automatically retrieves and processes information from this source. The information available in TCDB allows determining which metabolites are carried by each transporter system and the respective reactions. In TranSyT, these metabolites are assigned with identifiers and hierarchies through Biosynth (81), which combines in formation retrieved from several sources such as ModelSEED, KEGG, MetaCyc and BiGG. TranSyT generates new transport reactions using automatic text processing to determine the direction (in/out or out/in), reversibility and most suitable transport type (e.g. symport, antiport, etc) for each reaction retrieved from TCDB. All information is stored in a Neo4j graph database. The identification of the genes encoding transporter systems is the only module with user’s interaction, as the database is available for remote access, without the need of storing it in the users’ machine. Users start the identification of the transporters af ter loading a genome and the respective taxonomy identifier. TranSyT uploads the genome to its remote service and performs the homology search using BLAST against all records available in TCDB. Afterwards, it selects the correct Transporter Classification (TC) family to annotate each transport system and associates transport reactions to the encoded pro tein, creating Gene-Protein-Reaction (GPR) associations. The integration with genome-scale models filters metabolites not available in the reconstructed network. The localization of the reactions can be inferred from third-party tools such as PSORTb 3.0 or LocTree3. Other tools that determine whether the genes encoding transport proteins have transmembrane domains, allow assigning confidence levels to the systems. The iAF1260 Escherichia coli model (38) was used to validate the developed framework. TranSyT was able to automatically create reactions for nearly 75% of the metabolites de scribed in iAF1260 model transporters. Moreover, it allowed identifying transport reactions incorrectly assigned to genes that do not encode reactions transporting such metabolites. TranSyT is an open-source JavaTM software available at https://gitlab.bio.di.uminho. pt/TranSyT, currently being implemented in merlin and KBase.
O Transport Systems Tracker (TranSyT) é uma nova abordagem ao problema de identificação de sistemas de transporte transmembranares em genomas. O TranSyT e a próxima iteração da ferramenta TRIAGE (29), embora mais eficiente e desenvolvido para ultrapassar as limitações existentes. Tal como o TRIAGE, ainda depende da TCDB (118) para a anotação de sistemas, no entanto, o TranSyT recolhe e processa automaticamente a informação desta fonte. A informação disponível na TCDB permite determinar quais os metabolitos que são transportados por cada sistema de transporte e quais as respectivas reacções. No TranSyT, identificadores e descendentes hierárquicos são atribuídos aos metabolitos utilizando o Biosynth (81), que combina informação de várias fontes, como o ModelSEED, KEGG, MetaCyc e BiGG. O TranSyT gera reações de transporte utilizando processamento automático de texto para determinar a direção (interior/exterior ou exterior/interior), reversibilidade, e o tipo de transporte adequado (e.g. symport, antiport, etc) para cada reacção recolhida da TCDB. Todas as informações recolhidas são guardadas numa base de dados de grafos Neo4j. A identificação de sistemas transportadores codificados por genes e o único módulo com o qual o utilizador tem interação, visto que a base de dados está disponível remotamente, não havendo a necessidade de armazená-la na máquina do utilizador. Ao carregar um genoma e o respectivo identificador taxonómico, o utilizador é capaz de começar a identificação dos transportadores. O TranSyT carrega o genoma para o seu serviço remoto e executa a procura de homologias utilizando BLAST (3) contra todos os registos da TCDB. De seguida, selecciona a família TC correcta para anotar cada sistema transportador e associa reacções de transporte à proteína codificada, criando associações Gene-Proteína-Reacção (GPR). A integração com o modelo a escala genómica usada para filtrar metabolitos que não estão indisponíveis na rede. A localização dos sistemas pode ser inferida utilizando ferramentas de terceiros, tais como PSORTb 3.0 ou LocTree3. Outras ferramentas que determinam se os genes que codificam proteínas de transporte têm domínios transmembranares, permitem a atribuição de graus de confiança às classificações. O modelo iAF1260 da Escherichia coli (38) foi utilizado para validar a plataforma desenvolvida. O TranSyT foi capaz de criar automaticamente reacções para aproximadamente 75% dos metabolitos associados a transportadores do modelo. Permitiu ainda identificar reacções de transporte associadas a genes que não codificam reacções que transportam os metabolitos que lhes são atribuídos. TranSyT é um software open-source JavaTM disponível em https://gitlab.bio.di.uminho. pt/TranSyT, actualmente a ser implementado no merlin e na KBase.
TipoDissertação de mestrado
DescriçãoDissertação de mestrado em Bioinformatics
URIhttps://hdl.handle.net/1822/79794
AcessoAcesso aberto
Aparece nas coleções:BUM - Dissertações de Mestrado
CEB - Dissertações de Mestrado / MSc Dissertations

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato 
Davide Rafael Santos Lagoa.pdfDissertação de Mestrado4,41 MBAdobe PDFVer/Abrir

Partilhe no FacebookPartilhe no TwitterPartilhe no DeliciousPartilhe no LinkedInPartilhe no DiggAdicionar ao Google BookmarksPartilhe no MySpacePartilhe no Orkut
Exporte no formato BibTex mendeley Exporte no formato Endnote Adicione ao seu ORCID