Utilize este identificador para referenciar este registo:
https://hdl.handle.net/1822/82764
Título: | PhagePro: prophage finding tool |
Autor(es): | Dias, João Pedro Porto |
Orientador(es): | Dias, Oscar Melo, Luís Daniel Rodrigues |
Palavras-chave: | Virus Bacteriophages Machine learning Galaxy PhagePro Bacteriofagos Aprendizagem de máquina |
Data: | 1-Nov-2021 |
Resumo(s): | Bacteriophages are viruses that infect bacteria and use them to reproduce. Their
reproductive cycle can be lytic or lysogenic. The lytic cycle leads to the bacteria death,
given that the bacteriophage hijacks hosts machinery to produce phage parts necessary
to assemble a new complete bacteriophage, until cell wall lyse occurs. On the other
hand, the lysogenic reproductive cycle comprises the bacteriophage genetic material in
the bacterial genome, becoming a prophage. Sometimes, due to external stimuli, these
prophages can be induced to perform a lytic cycle. Moreover, the lysogenic cycle can
lead to significant modifications in bacteria, for example, antibiotic resistance.
To that end, PhagePro was created. This tool finds and characterises prophages
inserted in the bacterial genome. Using 42 features, three datasets were created and
five machine learning algorithms were tested.
All models were evaluated in two phases, during testing and with real bacterial cases.
During testing, all three datasets reached the 98 % F1 score mark in their best result. In
the second phase, the results of the models were used to predict real bacterial cases
and the results compared to the results of two tools, Prophage Hunter and PHASTER.
The best model found 110 zones out of 154 and the model with the best result in dataset
3 had 94 in common.
As a final test, Agrobacterium fabrum strC68 was extensively analysed. The results
show that PhagePro was capable of detecting more regions with proteins associated
with phages than the other two tools.
In the ligth of the results obtained, PhagePro has shown great potential in the discovery
and characterisation of bacterial alterations caused by prophages. Bacteriófagos são vírus que infetam bactérias usando-as para garantir a manutenção do seu genoma. Este processo pode ser realizado por ciclo lítico ou lipogénico. O ciclo lítico consiste em usar a célula para seu proveito, criar bacteriófagos e lisar a célula. Por outro lado, no ciclo lipogénico o bacteriófago insere o seu código genético no genoma da bactéria, o que pode levar à transferência de genes de interesse, tornando-se importante uma monitorização dos profagos. Assim foi desenvolvido o PhagePro, uma ferramenta capaz de encontrar e caracterizar bacteriófagos em genomas bactérias. Foram criadas features para distinguir profagos de bactérias, criando três datasets e usando algoritmos de aprendizagem de máquina. Os modelos foram avaliados durante duas fases, a fase de teste e a fase de casos reais. Na primeira fase de testes, o melhor modelo do dataset 1 teve 98% de F1 score, dataset 2 teve 98% e do dataset 3 também teve 98%. Todos os modelos, para teste em casos reais, foram comparados com previsões de duas ferramentas Prophage Hunter e PHASTER. O modelo com os melhores resultados obteve 110 de 154 zonas em comum com as duas ferramentas e o modelo do dataset 3 teve 94 zonas. Por fim, foi feita a análise dos resultados da bactéria Agrobacterium fabrum strC68. Os resultados obtidos mostram resultados diferentes, mas válidos, as ferramentas comparadas, visto que o PhagePro consegue detectar zonas com proteínas associadas a fagos que as outras tools não conseguem. Em virtude dos resultados obtidos, PhagePro mostrou que é capaz de encontrar e caracterizar profagos em bactérias. |
Tipo: | Dissertação de mestrado |
Descrição: | Dissertação de mestrado em Bioinformática |
URI: | https://hdl.handle.net/1822/82764 |
Acesso: | Acesso aberto |
Aparece nas coleções: | BUM - Dissertações de Mestrado |
Ficheiros deste registo:
Ficheiro | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Joao Pedro Porto Dias.pdf | 1,56 MB | Adobe PDF | Ver/Abrir |
Este trabalho está licenciado sob uma Licença Creative Commons