Utilize este identificador para referenciar este registo:
https://hdl.handle.net/1822/54478
Título: | Data Mining e Data Quality em dados da saúde |
Autor(es): | Correia, Carlos Daniel Dias |
Orientador(es): | Santos, Manuel Portela, Filipe |
Palavras-chave: | Data mining Data science Descoberta de conhecimento em base de dados Sistemas de informação na saúde Business intelligence Qualidade das reclamações na saúde Knowledge discovery in database Health information systems Quality of health complaints |
Data: | 2017 |
Resumo(s): | Este trabalho enquadra-se no desenvolvimento do projeto de dissertação de mestrado em Engenharia e
Gestão de Sistemas de Informação da Universidade do Minho, sobre o tema – Data Mining e Data Quality
em dados da Saúde. Este tema surge da interação entre um grupo de Investigação da Universidade do
Minho e a Entidade Reguladora da Saúde.
Atualmente qualquer assunto relacionado com a saúde é sempre um tema muito sensível na sociedade,
já que interfere diretamente no bem-estar das pessoas. Neste sentido, com o intuito de melhorar a
qualidade dos serviços de saúde, é fundamental uma boa gestão da qualidade das reclamações.
Devido ao volume de reclamações, surge a necessidade de exploração de modelos de Data Science com
o intuito de automatizar processos internos de qualidade das reclamações. Assim, o objetivo principal
deste projeto passa pela melhoria da qualidade do processo de análise das reclamações na saúde, bem
como a análise de conhecimento ao nível dos sistemas de informação aplicados à referida saúde.
Este documento desenvolvido no âmbito da dissertação de mestrado tem como objetivo apresentar uma
contextualização do tema, bem como a motivação do desenvolvimento do mesmo.
Numa primeira fase do desenvolvimento deste projeto foi adquirido conhecimento científico útil no
contexto do problema e também nas áreas de Data Mining e Data Science. De forma a garantir uma
melhor resposta a este caso de estudo sentiu-se a necessidade de estudar e conjugar três metodologias,
nomeadamente Case Study, Design Science Research Methodology e Kimball Lifecycle. No mesmo
contexto, foi ainda realizado um estudo de viabilidade da aplicação de modelos de Data Mining através
da metodologia Crisp-DM.
Numa segunda fase do desenvolvimento deste projeto foram adquiridos conhecimentos relativos aos
dados fornecidos para estudo assim como desenhado e pensado todo o processo de desenvolvimento
da solução. É observável o desenvolvimento do tratamento dos dados em duas etapas: carregamento
dos dados para uma base de dados auxiliar e tratamento dos mesmos através do processo de Extract,
Transform e Load (ETL). Com o data warehouse criado foi desenvolvido o cubo Online Analytical
Processing (OLAP) que posteriormente foi interligado no Power BI possibilitando a criação e análise de
dashboards. This project is part of the development of the master thesis in Engineering and Management of Information Systems from the University of Minho, about the subject – Data Mining and Data Quality in health data. This subject occurs from the interaction between a research group from the University of Minho and the Health Regulatory Entity. Nowadays, any health-related issue is always a very sensitive issue in the society as it interferes directly in the people well-being. In this sense, in order to improve the quality of health services, a good quality management of complaints is essential. Due to the volume of complaints, there is a need to explore Data Science models in order to automate internal quality complaints processes. Thus, the main objective of this project is to improve the quality of the health claims analysis process, as well as the knowledge analysis at the level of information systems applied to referred health. This document developed within the scope of the master thesis has as the main objective the presentation of a contextualization of the theme, as well as the motivation of the development of the theme in question. In the first phase of the development of this project was acquired useful scientific knowledge in the context of the problem and also in the areas of Data Mining and Data Science. In order to guarantee a better response to this case study, it was necessary to study and combine three methodologies, namely Case Study, Design Science Research Methodology and Kimball Lifecycle. In the same context, a feasibility study of the application of Data Mining models through the Crisp-DM methodology was also performed. In a second phase of the development of this project were acquired knowledge about the data provided for study as well as designed and thought the entire process of developing the solution. It is observable the development of data treatment in two stages: loading the data to an auxiliary database and processing them through the Extract, Transform and Load (ETL) process. With the data warehouse created, the Online Analytical Processing (OLAP) cube was developed that was later interconnected in Power BI enabling the creation and analysis of dashboards. |
Tipo: | Dissertação de mestrado |
Descrição: | Dissertação de mestrado integrado em Engenharia e Gestão de Sistemas de Informação |
URI: | https://hdl.handle.net/1822/54478 |
Acesso: | Acesso aberto |
Aparece nas coleções: | BUM - Dissertações de Mestrado DSI - Engenharia e Gestão de Sistemas de Informação |
Ficheiros deste registo:
Ficheiro | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Carlos Daniel Dias Correia.pdf | 5,69 MB | Adobe PDF | Ver/Abrir |