Utilize este identificador para referenciar este registo:
https://hdl.handle.net/1822/84077
Título: | Regressão logística para dados correlacionados (GEE): desenvolvimento de aplicações dinâmicas em R |
Autor(es): | Moncaixa, Luís Nuno dos Santos |
Orientador(es): | Braga, A. C. |
Palavras-chave: | Regressão logística Dados correlacionados GEE Shiny R SAGA Logistic regression Correlated data |
Data: | 2022 |
Resumo(s): | Os modelos de regressão logística procuram identificar a influência de diferentes variáveis/fatores numa variável
resposta de interesse. Estes são normalmente utilizados na àrea da medicina pois permite verificar quais os
fatores que influênciam a presença de determinadas patologias.
Os estudos longitudinais, onde se verifica uma repetição de observações ou medições registadas ao longo do
tempo, são os mais utilizados para aplicação dos modelos de regressão logística, no entanto grande parte deste
modelos não consideram a correlação entre as variáveis em estudo. De modo a ultrapassar este problema foram
desenvolvidos os modelos GEE (Generalized Estimating Equations) que consideram a correlação existente nos
dados, possibilitando assim uma análise mais rigorosa da influência de diferentes factores.
Esta dissertação procura identificar e explorar diferentes packages em R para aplicação dos modelos GEE
através da sua aplicação a um caso de estudo.
Ao longo desta dissertação será desenvolvida uma nova aplicação web designada SAGA, desenvolvida utilizando
o package Shiny na linguagem R. Esta aplicação encontra-se disponível no seguinte link: https:
//geemodelapp2022.shinyapps.io/Shiny_App/ .
A aplicação SAGA tem como principal objetivo a análise de modelos GEE utilizando um conjunto de dados
selecionado pelo utilizador, sendo possível identificar as diferentes variáveis de interesses que serão descritas ao
longo da dissertação, bem como validar os modelos desenvolvidos através da validação por curvas ROC. Para
além dos resultados dos modelos GEE, demonstrados na aplicação, também estão representadas as curvas
ROC de cada modelo desenvolvido. Logistic regression models seek to identify the influence of different variables/factors on a response variable of interest. These are normally used in the field of medicine as it allows to verify which factors influence the presence of certain pathologies. Longitudinal studies, where there is a repetition of observations or measurements recorded over time, are the most used to apply logistic regression models, however most of these models do not consider the correlation between the variables under study. In order to overcome this problem, GEE (Generalized Estimating Equations) models were developed, which consider the existing correlation in the data, resulting in a more rigorous analysis of the influence of different factors. This dissertation, in a first phase, explores the different existing R packages for the application of GEE models, in order to identify differences or similarities between them using a case study for the application of GEE models. Throughout this dissertation, a new web application called SAGA will be developed, the application will be developed using the Shiny package in R language. This application is available at the following link: https: //geemodelapp2022.shinyapps.io/Shiny_App/. The main purpose of the SAGA application is to develop and analyse GEE models using a dataset selected by the user, where it will be possible to describe all the variables of interest in the development of the model as will be described in the course of this dissertation, as well as to validate the models developed through validation by ROC analysis. In addition to the results of the GEE models, shown in the application, the ROC curves of each model developed are also represented. |
Tipo: | Dissertação de mestrado |
Descrição: | Dissertação de mestrado em Bioinformática |
URI: | https://hdl.handle.net/1822/84077 |
Acesso: | Acesso aberto |
Aparece nas coleções: | BUM - Dissertações de Mestrado |
Ficheiros deste registo:
Ficheiro | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Luís-Nuno-dos-Santos-Moncaixa-dissertação.pdf | 1,81 MB | Adobe PDF | Ver/Abrir |
Este trabalho está licenciado sob uma Licença Creative Commons