Utilize este identificador para referenciar este registo: https://hdl.handle.net/1822/79890

TítuloComparative analysis and characterization of industrial Streptococcus thermophilus genomes
Autor(es)Isabelinho, Tiago Filipe Pereira
Orientador(es)Dias, Oscar
Demirci, Huseyin
Rau, Martin Holm
Zeidan, Ahmad
Palavras-chaveStreptococcus thermophilus
Pan-genome
Melhoramento
Síntese de aminoácidos
Protéases
Transportadores
Identificação
Motifs
Improvement
Amino acids biosynthesis
Transporters
Identification
Data22-Jul-2019
Resumo(s)A evolução de técnicas de sequenciação de nova geração originou um crescimento exponencial do número de genomas sequenciados. O pan-genoma permite uma visão global de múltiplos genomas. Este é definido como o completo conjunto de genes presente nos genomas em estudo, sobre os quais estabelecem-se relações de ortologia. Neste trabalho, uma visão geral e avaliação da performance de quatro diferentes ferramentas (FindMyFriends, OrthoMCL, Proteinortho e Roary) de deteção de ortólogos foi efectuada com uma similaridade de 0.95 e a não separação de parálogous em 21 genomas públicos. As ferramentas apresentaram uma performance global positiva com diferentes aplicabilidades dependendo do objectivo do trabalho. Streptococcus thermophilus é uma bactéria ácido-láctica amplamente usada na produção de iogurte e queijo, associada com o seu sabor e textura. O estudo do seu pan-genoma envolvendo 333 genomes foi estabelecido pelo FindMyFriends com o objectivo da caracterização genómica para perceber a diversidade da espécie e características para o seu desenvolvimento. Correspondência entre o pan-genome e a base de dados KEGG foi efectuada através do K number, de modo a, identificar e/ou reconstruir o metabolismo dos carbohidratos, vias de biossíntese dos aminoácidos, transportadores ABC de aminoácidos e enzimas proteolíticas. A disrupção do gene glucokinase nas estirpes S e GA faz delas bons candidatos a aumentar a doçura do iogurte. Cerca de 21% das estirpes são auxotróficas para a histidina. Situações pontuais de auxotrofia foram encontradas em relação a outros aminoácidos. A protease extracelular PrtS não foi identificada em 153 estirpes, devendo estas ser co-cultivadas ou depender de outras proteases extracelular para atingir uma taxa de crescimento ótimo e acidificação. Em relação às peptidases intracelulares, quatro estirpes podem ter uma menor taxa de crescimento e menor composição de aminoácidos, percussores de compostos aromáticos. Uma maior capacidade de transporte de polipeptídeos poderá ser notória em 10 estirpes pela identificação de uma terceira cópia do gene oppA. Existe sequências de DNA que influenciam e ajudam na iniciação do processo de transcrição e tradução de genes. Identificação dos promotores, caixa de pribnow e sequência -35, e da sequencia de Shine-dalgarno (SDS), dos genes pertencentes ao pan-genoma mostrou que a localização dos promotores é variável ao invés da SDS que se localiza nos 20bp a montante do sítio de iniciação da tradução. Este estudo do pan-genoma facilitará estudos fenotípicos para a fermentação do leite, melhorando os produtos lácteos.
The evolution of next-generation sequencing techniques gave rise to an exponential growth of the number of sequenced genomes. Pan-genome allows a global vision of multiple genomes. It is defined as the entire set of genes present in a group of genomes under study, on which orthology relationships are established. In this work, an overview and performance assessment of four different orthologous detection tools (FindMyFriends, OrthoMCL, Proteinortho e Roary) was done with a 0.95 similarity parameter and not splitting paralogous, in 21 public genomes. Tools show a good overall performance with different applicabilities depending on the work’ goals. Streptococcus thermophilus is a lactic acid bacterium widely used as a dairy starter to yogurt and cheese production, associated with their flavour and texture. Pan-genome study involving 333 genomes was stablished by FindMyFriends with the goal of genomic characterization to understand strain diversity and characteristics for their development. Matching between pan-genome and KEGG database through K numbers was done in order to identified and/or reconstructed carbohydrate metabolism, amino acid biosynthesis pathways, amino acid ABC transporters and proteolytic enzymes. Glucokinase gene disruption on strain S and GA make them good candidates to increase naturally yogurt sweetness. About 21% strains are histidine auxotrophic. Other residual auxotrophic situations were found regarding other amino acids. Extracellular protease PrtS was not identified in 153 strains, which must be co-cultivated or rely in other extracellular proteases to reach an optimal growth rate and acidification. Regarding intracellular peptidases, four strains could have a lower growth rate and a low amino acid composition, precursors of aromatic compounds. A greater transport capacity may be notorious in 10 strains by the identification of a thirth copy gene oppA. There are DNA sequences that affect and help in the start of the gene transcription and translation process. Identification of the promoters, pribnow box and sequence -35, and Shine-Dalgarno sequence (SDS) from genes belonging to pan-genome show that promoters’ location is variable instead of SDS that is in the 20bp upstream of the translation initiation site. This pan-genome study will facilitate phenotypic studies for milk fermentation, improving dairy products.
TipoDissertação de mestrado
DescriçãoDissertação de mestrado em Bioinformática
URIhttps://hdl.handle.net/1822/79890
AcessoAcesso aberto
Aparece nas coleções:BUM - Dissertações de Mestrado
CEB - Dissertações de Mestrado / MSc Dissertations

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato 
Tiago Filipe Pereira Isabelinho.pdfDissertação de Mestrado2,41 MBAdobe PDFVer/Abrir

Partilhe no FacebookPartilhe no TwitterPartilhe no DeliciousPartilhe no LinkedInPartilhe no DiggAdicionar ao Google BookmarksPartilhe no MySpacePartilhe no Orkut
Exporte no formato BibTex mendeley Exporte no formato Endnote Adicione ao seu ORCID