Please use this identifier to cite or link to this item:
https://hdl.handle.net/1822/79891
Title: | In silico characterization of microbial communities interaction in soil samples |
Author(s): | Gomes, Marta Lopes |
Advisor(s): | Dias, Oscar Rocha, Ulisses Nunes da |
Keywords: | Clustering Orthologous Homology Annotation Microbial communities Functional potencial Ortólogos Homologia Anotação Comunidades microbiais Potencial funcional |
Issue date: | 13-Dec-2019 |
Abstract(s): | Mlicrobial communities, besides its many applications, can represent a solution for pollution problems with reduced costs. However, to explore them in our favor, it is necessary to understand how they work and be able to infer their potential regarding specific metabolic networks. Because of the continuous growth of genomic data, various tools have been developed for homology and metabolic pathway inference, however new and improved strategies and algorithms still being required. In this work, it has been developed a pipeline that makes use of clusters of orthologous data to perform the annotation of unknown sequences, and after that, the prediction of species' functional potential and microbial interactions. For that were developed two tools, OrtScraper, for the download of bulk organized data from specif pathways of interest, and OrtAn that performs the annotation on clusters of orthologous groups. The test and evalua-tion of the pipeline were focused on the well-known transformation of benzoate to acetyl-CoA (BTA) pathway. Two different genome sets were used, set A, from whose the annotation of the sequences was known, and set B, from whose the capacity regarding the benzoate degradation was known. Both tools successfully performed the desired goal and for the annotation, the best cases presented an FL score over 0.90. The recall values of the annotation showed to be the weakest point of this pipeline, which led, possibly, to the unsatisfactory results on the prediction of the species functional potential. Some improvements to the developed tools and pipeline were proposed to improve the annotation and species functional potential inference. As comunidades microbianas, além das suas várias aplicações, podem representar uma solução, de custos reduzidos, para problemas de poluição. No entanto, para explorá-las a nosso favor, é necessário entender como funcionam e poder inferir seu potencial em relação a redes metabólicas específicas. Devido ao crescimento contínuo dos dados genómicos, várias ferramentas têm sido desenvolvidas para a inferência de homologia e de vias metabólicas, no entanto, estratégias e algoritmos novos e melhorados ainda são necessários. Neste trabalho, foi desenvolvida uma pipeline que faz uso de clusters de ortólogos para a realização de anotação de sequências desconhecidas e, posteriormente, a previsão do potencial funcional das espécies e previsão de interações microbianas. Para isso foram desenvolvidas duas ferramentas, o OrtScraper, para o download de dados em massa organizados pertencentes a vias metabólicas de interesse, e o OrtAn, que realiza a anotação a partir de clusters de ortólogos. O teste e a avaliação da pipeline foram focados na bem conhecida transformação do benzoato em acetilCoA (BTA). Foram utilizados dois conjuntos de genomas diferentes, o conjunto A, de onde se conhecia a anotação das sequências, e o conjunto B, de onde se conhecia a capacidade de degradação do benzoato. Ambas as ferramentas realizaram com sucesso o objetivo desejado e, para a anotação, os melhores casos apresentaram pontuação F1 acima de 0,90. Os valores de recai! da anotação mostraram-se o ponto mais fraco desta pipeline, o que levou, possivelmente, aos resultados insatisfatórios na previsão do potencial funcional das espécies. Foram propostas algumas melhorias nas ferramentas e pipeline desenvolvidas para melhorar a anotação e a inferência do potencial funcional das espécies. |
Type: | Master thesis |
Description: | Dissertação de mestrado em Bioinformática |
URI: | https://hdl.handle.net/1822/79891 |
Access: | Open access |
Appears in Collections: | BUM - Dissertações de Mestrado |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Marta Lopes Gomes.pdf | 1,77 MB | Adobe PDF | View/Open |
This item is licensed under a Creative Commons License