Utilize este identificador para referenciar este registo: https://hdl.handle.net/1822/62116

TítuloComputação segura em bases de dados NoSQL
Autor(es)Macedo, Ricardo Gonçalves
Orientador(es)Oliveira, Rui Carlos Mendes de
Paulo, João Tiago Medeiros
Data2017
Resumo(s)Hoje em dia é usual as empresas necessitarem de analisar e processar quantidades massivas de dados, levando-as a optar pela utilização de serviços de bases de dados na nuvem, tirando proveito do poder de armazenamento e computação da nuvem reduzindo, desta forma, os custos de aquisição e administração de uma infraestrutura privada. No entanto, os serviços de nuvem têm vindo a sofrer ataques (p.e., ataque à Sony Pictures Entertainment, fuga de 68 milhões de passwords da Dropbox, fuga de fotos de celebridades da iCloud), onde grandes quantidades de informação crítica e privada, seja de grandes empresas ou do utilizador final, são comprometidas e muitas vezes divulgadas à comunidade geral. Da mesma forma, as empresas que fornecem estes serviços (p.e., Google), efetuam análises sobre os dados armazenados com o objetivo de capturar o máximo de informação do utilizador de modo a traçar um perfil, e por fim vender estas informações a empresas por motivos de publicidade. Dada esta falha de privacidade, esta dissertação visa explorar e implementar mecanismos de computação segura sobre bases de dados NoSQL fornecendo armazenamento, processamento e transmissão de dados de forma segura e transparente. Em detalhe, esta dissertação apresenta as seguintes contribuições: uma revisão extensa e detalhada do estado da arte atual dos sistemas de computação segura sobre bases de dados SQL e NoSQL, bem como sobre os esquemas criptográficos mais frequentes e relevantes suportados por estes sistemas seguros. Deste estudo é ainda proposta uma arquitetura genérica e taxonomia dos sistemas de computação segura atuais. Como segunda contribuição é proposto um sistema denominado SafeNoSQL que apresenta uma arquitetura modular e extensível de computação segura sobre bases de dados NoSQL. Ainda, esta arquitetura é concretizada num protótipo que suporta a base de dados Apache HBase e inclui quatro técnicas criptográficas que permitem o armazenamento e processamento seguro sobre informação sensível armazenada em serviços de terceiros não confiáveis. De forma a validar o protótipo é efetuada uma avaliação experimental detalhada com micro e macro testes e testes de carga com múltiplos clientes, sendo feita não só a avaliação do desempenho mas também da utilização de recursos computacionais (p.e., CPU, memória) para cada um dos testes. Os resultados mostram que é possível atingir uma solução segura e funcional para workloads realistas, obtendo um custo no desempenho da base de dados inferior a 15%. Como contribuição final, é proposta a integração do sistema SafeNoSQL com um componente de tradução de SQL para NoSQL de forma a extender as vantagens de segurança a aplicações tradicionais que apenas suportam o modelo e interface SQL.
Companies are increasingly dependent on storage and processing solutions that can handle massive amounts of data. Cloud database services are a good fit for this challenge as they provide both capabilities in a remote cloud infrastructure, thus alleviating enterprises from buying and managing their own private data center. However, cloud services are now a popular target for malicious attacks (e.g., Sony Pictures Entertainment hack, Dropbox leak of 68 million passwords, iCloud leak of celebrity photos) in which large amounts of private and sensitive information, from either large companies or end-users, have been leaked. Also, cloud providers (e.g., Google) have access to clients’ data and are able to process it to extract meaningful information that may be sold to companies for publicity purposes. Cloud data privacy is thus a main concern that needs to be addressed. This thesis aims to explore and apply secure computation schemes over NoSQL databases while delivering secure data storage, processing and transmission. In detail, the following contributions are presented: a detailed state-of-the-art revision was made for the current secure SQL and NoSQL database systems, as well as, for the most relevant cryptographic techniques adopted by these systems. Moreover, this review proposes a generic architectural abstraction and a taxonomy for classifying all these solutions. As a second contribution, a generic framework called SafeNoSQL is proposed and provides a modular and extensible design that enables secure data processing over NoSQL databases. Also, a prototype of SafeNoSQL, based on Apache HBase, is implemented along with a set of four distinct cryptographic libraries that leverage secure storage and computation over sensible data stored on untrusted third-party infrastructures. The prototype is validated with an extensive experimental evaluation resorting to both micro, macro and multi-client experiments. These experiments validate not only the performance of the solution but also its resource usage (e.g., CPU, RAM). The results show that it is possible to achieve a practical and secure solution for realistic workloads with a database throughput and latency overhead inferior to 15%. As a final contribution, we propose the integration of SafeNoSQL with a query engine in order to further extend the secure computation and storage guarantees to traditional SQL applications.
TipoDissertação de mestrado
DescriçãoDissertação de mestrado integrado em Engenharia Informática
URIhttps://hdl.handle.net/1822/62116
AcessoAcesso aberto
Aparece nas coleções:BUM - Dissertações de Mestrado
DI - Dissertações de Mestrado

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato 
Ricardo-Gonçalves-Macedo-dissertação-final.pdf1,77 MBAdobe PDFVer/Abrir

Partilhe no FacebookPartilhe no TwitterPartilhe no DeliciousPartilhe no LinkedInPartilhe no DiggAdicionar ao Google BookmarksPartilhe no MySpacePartilhe no Orkut
Exporte no formato BibTex mendeley Exporte no formato Endnote Adicione ao seu ORCID