Utilize este identificador para referenciar este registo: https://hdl.handle.net/1822/64277

TítuloData analytics in IoT FaaS with DataFlasks
Autor(es)Araújo, Paulo Ricardo Cunha Correia
Orientador(es)Pereira, José
Paulo, João Tiago Medeiros
Data2018
Resumo(s)The current exponential growth of data demands new strategies for processing and analyzing information. Increased Internet usage, as well as the everyday appearance of new sources of data, is generating data volumes to be processed by Cloud applications that are growing much faster than available Cloud computing power. These issues, combined with the appearance of new devices with relatively low computational power (such as smartphones), have pushed for the development of new applications able to make use of this power as a complement to the Cloud, pushing the frontier of computing applications, data storage and services to the edge of the network. However, the environment in Edge computing is very unstable. It requires leveraging resources that may not be continuously connected to a network and device failure is a certainty. The system has to be aware of the processing capabilities of each node to achieve proper task distribution as it may exist a high level of heterogeneity between the system devices. A recent approach for developing applications in the Cloud, named Function as a Service (FaaS), proposes a way to enable data processing in these environments. FaaS services adhere to the principles of serverless architectures, providing stateless computing containers that allow users to run code without provisioning or managing servers. In this dissertation we present OpenFlasks, a new approach to the management and processing of data in a decentralized manner across Cloud and Edge. We build upon these types of architectures and other data storage tools and combine them in a novel way to create a flexible system capable of balancing data storage and data analytics needs in both environments. In addition, we call for a new approach to provide task execution both in Edge and Cloud environments that is able to handle high churn and heterogeneity of the system. Our evaluation shows an increase in the percentage of task execution success under high churn environments of up to 18%withOpenFlasks relatively to other FaaS systems. In addition, it denotes improvements in load balancing and average resource usage in the system for the execution of simple analytics at the Edge.
O atual crescimento exponencial de dados exige novas estratégias para processar e analisar informação. O aumento do uso da Internet, assim como o aparecimento diário de novas fontes de dados, produz volumes de dados a ser processados por aplicações Cloud que crescem a umamaior velocidade do que o poder de computação aí disponível. Este problema, combinado com o surgir de novos dispositivos com poder computacional relativamente baixo (como smartphones), tem motivado o desenvolvimento de novas aplicações capazes de usar esse poder como complemento a Cloud computing, expandindo a fronteira dos serviços de processamento e armazenamento de dados atuais para o limite da rede (Edge). No entanto, o ambiente de Edge computing é muito instável. Requer a gestão de recursos que podem não estar continuamente conectados à rede e a falha de dispositivos é uma certeza. O sistema deve estar ciente das capacidades de processamento de cada dispositivo para obter uma distribuição de tarefas adequada, dado que pode existir um alto nível de heterogeneidade entre os dispositivos do sistema. Uma abordagem recente para o desenvolvimento de aplicações de Cloud computing, denominada Function as a Service (FaaS), propõe uma forma de permitir o processamento de dados neste tipo de ambientes. Os serviços FaaS aderem aos princípios de arquiteturas serverless, fornecendo containers de computação que nãomantêmestado e que permitemaos utilizadores executar código sem a necessidade de instanciar e gerir servidores. Nesta dissertação apresentamos OpenFlasks, uma nova abordagem para a gestão e processamento de dados de forma descentralizada em ambientes Cloud e Edge. Baseamo-nos neste tipo de arquiteturas, assimcomo outros serviços atuais de armazenamento de dados e combinamo-los de forma a criar um sistema flexível, capaz de equilibrar o armazenamento e as necessidades de análise de dados em ambos ambientes. Além disso, propomos uma nova abordagem para possibilitar a execução de tarefas tanto em ambientes de Edge como de Cloud, capaz de lidar com o elevado dinamismo e heterogeneidade do sistema. A nossa avaliação mostra um aumento na percentagem de sucesso da execução de tarefas sob ambientes de elevado dinamismo de até 18% relativamente a outros sistemas FaaS. Além disso, denotamelhorias na distribuição de carga e no uso médio de recursos do sistema para a execução de data analytics simples em ambientes Edge.
TipoDissertação de mestrado
DescriçãoDissertação de mestrado em Computer Science
URIhttps://hdl.handle.net/1822/64277
AcessoAcesso aberto
Aparece nas coleções:BUM - Dissertações de Mestrado
DI - Dissertações de Mestrado

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato 
Paulo-Ricardo-Cunha-Correia-Araújo-dissertacao-final_a58925.pdf3,06 MBAdobe PDFVer/Abrir

Partilhe no FacebookPartilhe no TwitterPartilhe no DeliciousPartilhe no LinkedInPartilhe no DiggAdicionar ao Google BookmarksPartilhe no MySpacePartilhe no Orkut
Exporte no formato BibTex mendeley Exporte no formato Endnote Adicione ao seu ORCID