Utilize este identificador para referenciar este registo:
https://hdl.handle.net/1822/65489
Título: | Modelos de previsão com Big Data proveniente de transações financeiras |
Outro(s) título(s): | Forecasting models from Big Data financial transactions |
Autor(es): | Simões, Joana Patrícia da Silva |
Orientador(es): | Castro, Cecília Campos, Pedro |
Palavras-chave: | Economia colaborativa Dados em painel Modelos de efeitos mistos Árvores de regressão Amostra de treino / amostra de teste Collaborative economy Panel data Mixed models Regression trees Train / test set |
Data: | 2019 |
Resumo(s): | A troca de serviços, por determinado período de tempo, com compensação monetária ou
outra, através de plataformas digitais é um fenómeno bastante recente, designado por economia
colaborativa. Esta realidade é ainda pouco compreendida, e o tipo de trocas/ transações incluídas
neste conceito, ainda não são consideradas no cálculo de indicadores macroeconómicos como, por
exemplo, o PIB. No entanto, há necessidade de estudar mais pormenorizadamente este tipo de
economia para poder englobá-la no cálculo de indicadores de atividade económica, ou outros, já
existentes. É este o principal objetivo do projeto ESSNet Big Data II – Financial Transactions Data,
onde este trabalho se insere, sob a alçada do INE Porto.
Nesta tese, utilizam-se variáveis que podem ser consideradas dentro de um conceito de
economia colaborativa. Tais variáveis foram introduzidas em modelos de efeitos fixos e em modelos
de efeitos aleatórios, conseguindo explicar o PIB além de proporcionarem modelos com elevado
poder preditivo. Uma vez que o foco se encontra na previsão, propõem-se aqui modelos de machine
learning bastante recentes, árvores de regressão com inclusão de efeitos aleatórios, que
demonstram também elevado poder preditivo, embora em comparação com os modelos de efeitos
mistos apresentados, ficam ligeiramente aquém pela natureza linear dos dados utilizados.
Para a execução deste trabalho, recorreu-se a dados de levantamentos nacionais em caixas
de multibanco, de compras através de terminais de pagamento automático e de dormidas nos
estabelecimentos hoteleiros, ou seja, dados de transações financeiras que, em abstrato, são dados
de economia colaborativa, pelo menos numa definição lata deste paradigma. Estes dados
encontram-se agregados por regiões NUTS III e por ano, o que impõe que sejam tratados como
dados em painel, tendo em conta a heterogeneidade entre as regiões. A new paradigm arises in economy, consisting in the exchange of services, for a certain period of time, with monetary compensation or other, through digital platforms. It’s a recent phenomenon, called collaborative economy. This reality is still poorly understood, and the type of transactions included in this definition are not yet considered in the calculation of macroeconomic indicators such as GDP. However, it is necessary to study this type of economy in more detail in order to be able to include it in indicators of economic activities. This is the focus of the ESSNet Big Data II project - Financial Transactions Data, where this work is included under the guidance of NSI, Porto, Portugal. In this thesis, we use variables that can be considered within a concept of collaborative economy. These variables were introduced in fixed effects models and random effects models, being able to explain the GDP and provide models with high predictive power. Since the focus is on prediction, very recent machine learning models are used here, like regression trees with random effects, which also show high predictive power. Although these models compared with mixed effects models, are slightly less powerful because of the linear nature of the data handled. In this work, we used data from national withdrawals at ATMs, purchases through automatic payment terminals and overnight stays in hotel establishments, i.e. financial transaction data that, in abstract, are “collaborative economy” data, at least in a broad definition of this paradigm. These data are aggregated by regions and by year, which requires the use of a panel data approach, taking into account the heterogeneity between regions. |
Tipo: | Dissertação de mestrado |
Descrição: | Dissertação de mestrado em Estatística |
URI: | https://hdl.handle.net/1822/65489 |
Acesso: | Acesso aberto |
Aparece nas coleções: | BUM - Dissertações de Mestrado DMA - Dissertações de mestrado |
Ficheiros deste registo:
Ficheiro | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Dissertacao+33694.pdf | 756,51 kB | Adobe PDF | Ver/Abrir |