Utilize este identificador para referenciar este registo: https://hdl.handle.net/1822/55163

TítuloForecasting na previsão da incidência de pneumonia em Portugal Continental
Autor(es)Veloso, Sara Isabel Ferreira
Orientador(es)Santos, Maribel Yasmina
Palavras-chaveTime-series forecasting
Data mining
Séries temporais
Modelos preditivos
Time-series
Predictive models
Data2017
Resumo(s)A incidência de pneumonia tem vindo a aumentar na última década e, em Portugal, é a principal causa de morte e de internamentos hospitalares, representando um sério problema para o qual é necessário um estudo mais aprofundado de forma a obter novos conhecimentos e perceções sobre este fenómeno. É neste sentido que a Fundação Portuguesa do Pulmão em parceria com a Universidade do Minho tem vindo a desenvolver vários estudos, com o objetivo de caraterizar a população Portuguesa no que diz respeito a doenças respiratórias. O trabalho a realizar nesta dissertação de mestrado surge com o objetivo de dar seguimento aos estudos já realizados através da aplicação de técnicas de time-series forecasting para a previsão deste fenómeno, nomeadamente, o número de casos de pneumonias e vítimas mortais em Portugal Continental, onde foram utilizados algoritmos de Data Mining para identificar modelos preditivos. Este conhecimento poderá ser útil para uma tomada de decisão mais eficaz, por parte da Fundação Portuguesa do Pulmão, ao possibilitar a identificação de padrões temporais sobre a doença. Numa primeira parte, o trabalho resultou na realização de um enquadramento conceptual, baseado em literatura relevante, acerca de conceitos associados ao Data Mining, dando relevância ao conceito e técnicas de forecasting e algoritmos disponíveis que podem ser aplicados em contextos de séries temporais. Apesar de existir uma grande variedade de literatura sobre a aplicação de técnicas de Data Mining em contextos de previsão, quando se fala sobre previsão de séries temporais a informação é mais limitada. Além disso, apesar de existirem alguns de trabalhos realizados neste contexto, não são percetíveis na literatura, trabalhos relacionados com a previsão de fenómenos associados à pneumonia. Posto isto, o trabalho prosseguiu com a aplicação de metodologia CRISP-DM para a determinação de modelos preditivos para a série do número de casos de pneumonias e para a série do número de vítimas mortais. Primeiramente foi realizada uma caracterização dos dados, numa perspetiva temporal, para tentar identificar relações destas séries com outras variáveis incluídas no Data Warehouse, de onde resultou a identificação de algumas relações com outras variáveis. Tendo em conta esta informação, foram testados vários algoritmos com diferentes condições de teste e, posteriormente, foram comparados e avaliados de acordo com a precisão dos mesmos. Daqui foi possível identificar um modelo preditivo, para cada uma das séries, capaz de prever os respetivos fenómenos com elevado desempenho e os quais podem ser utilizados para fazer inferências sobre outras variáveis com as quais são visíveis padrões de relacionamento.
The incidence of pneumonia has been increasing in the last decade and in Portugal is a leading cause of death and hospital admissions, representing a serious problem for which further study is needed in order to obtain new knowledge and perceptions about this phenomenon. It is in this sense that the Fundação Portuguesa do Pulmão in partnership with the Universidade do Minho has been developing several studies aiming to characterize the Portuguese population with respect to respiratory diseases. The work to be carried out in this master's thesis arises with the objective of following up the studies already carried out by applying time-series forecasting techniques to predict this phenomenon, namely the number of cases of pneumonia and fatalities in Portugal where Data Mining algorithms were used to identify predictive models. This knowledge may be useful for a more effective decision making by the Fundação Portuguesa do Pulmão by enabling the identification of temporal patterns of the disease. In the first part, the work resulted in the realization of a conceptual framework, based on relevant literature, about concepts associated with Data Mining giving relevance to the concept and forecasting techniques and available algorithms that can be applied in time series contexts. Although there is a wide variety of literature on the application of Data Mining techniques in prediction contexts when we talk about time series prediction the information is more limited. In addition, although there are some studies carried out in this context, studies related to the prediction of phenomena associated with pneumonia are not perceptible in the literature. After this, the work continued with the application of CRISP-DM methodology for the determination of predictive models for the series of the number of cases of pneumonia and for the series of the number of fatalities. Firstly, a data characterization was carried out in a temporal perspective to try identify relations of these series with other variables included in the Data Warehouse from which resulted the identification of some relations with other variables. Considering this information, several algorithms with different test conditions were tested and subsequently compared and evaluated according to their accuracy. From this it was possible to identify a predictive model, for each of the series, able to predict the respective phenomena with high performance and which can be used to make inferences about other variables with which patterns of relationship are visible.
TipoDissertação de mestrado
DescriçãoDissertação de mestrado em Sistemas de Informação
URIhttps://hdl.handle.net/1822/55163
AcessoAcesso restrito UMinho
Aparece nas coleções:BUM - Dissertações de Mestrado
DSI - Engenharia e Gestão de Sistemas de Informação

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato 
MSI_SaraVeloso_PG26532_Repositorium.pdf
Acesso restrito!
6,04 MBAdobe PDFVer/Abrir

Partilhe no FacebookPartilhe no TwitterPartilhe no DeliciousPartilhe no LinkedInPartilhe no DiggAdicionar ao Google BookmarksPartilhe no MySpacePartilhe no Orkut
Exporte no formato BibTex mendeley Exporte no formato Endnote Adicione ao seu ORCID