Utilize este identificador para referenciar este registo: https://hdl.handle.net/1822/84322

TítuloMetabolomics-based approaches for food authentication and traceability
Outro(s) título(s)Abordagens metabolómicas para autenticação alimentar e rastreabilidade
Autor(es)Santos, Rebeca Tatiana Souto
Orientador(es)Rocha, Miguel
Maraschin, Marcelo
Palavras-chaveAutenticação de vinho e mel
Metabolómica
Ferramentas estatísticas e aprendizado máquina
Wine and honey authentication
Metabolomics
Statistical and machine learning tools
Data24-Mar-2023
Resumo(s)Nos últimos anos, a procura do consumidor por produtos alimentares naturais autênticos aumentou consideravelmente, assim como a ocorrência de eventos de adulteração. Paralelamente, a conscientização sobre a responsabilidade de produtores e vendedores no combate à fraude alimentar tem vido a crescer. O uso de ferramentas estatísticas (ST) e algoritmos de aprendizado de máquina (ML), em conjunto com abordagens metabolómicas, podem ajudar numa ampla gama de aplicações na área da autenticação alimentar. Os modelos de ML permitem identificar e entender quais os fatores com maior influência na autenticação alimentar, tais como as condições biológicas e ambientais. A Ressonância Magnética Nuclear (NMR) e metodologias metabolómicas espectrais são técnicas analíticas avançadas e abrangentes amplamente utilizadas na autenticação de alimentos. No entanto, existe a necessidade de construir modelos mais precisos de forma a prever a autenticidade dos produtos alimentares, garantindo a sua segurança e qualidade para o bem-estar dos consumidores e da economia. Esta dissertação foca-se no uso da análise estatística multivariada (MSA) em dados metabolómicos de produtos alimentares naturais de alto valor, como o vinho e o mel, com recurso à aplicação de modelos de ML a vários problemas de classificação, incluindo a determinação de origens botânicas e geográficas. Modelos de ML foram construídos para discriminar e prever variáveis relacionadas com os problemas de autenticação dos alimentos estudados, incluindo a previsão de diferentes influências climáticas e a previsão da idade de armazenamento com base em análises de dados metabolómicos. Diferentes estratégias de pré-processamento, seleção de variáveis, técnicas de redução de dimensionalidade e métricas de avaliação foram testadas. Foi avaliado o impacto de diferentes métodos utilizados no desempenho desses modelos. Com base nessas análises, foram identificados os modelos com melhor desempenho preditivo. A interpretação dos modelos foi realizada comprovando que com o uso de modelos de ML é possível associar características químicas importantes com a classificação de alimentos naturais no processo de autenticação. ST e ML com tratamentos de pré-processamento adequados e métricas de avaliação são um pipeline adequado para diferentes problemas em autenticação de alimentos, como demonstrado neste trabalho. Apesar de algumas limitações, tais como, o tamanho dos conjuntos de dados dos nossos estudos, as nossas descobertas são úteis para orientar o desenvolvimento de novas abordagens usando a metabolómica para diversos problemas existentes em autenticação alimentar conjugando com ST e ML em amostras de vinho e mel. Para realizar análises de dados metabolómicos, diferentes abordagens MSA e de ML foram usadas, testadas e validadas usando o package da linguagem de programação R specmine, um software desenvolvido pelo grupo de investigação, e um conjunto de bibliotecas da linguagem de programação Python.
In recent years, the consumer demand for authentic natural food products has increased concurrently with an expand of adulteration events. At the same time, the awareness regarding the responsibility of retailers and producers to combat food fraud has also grown. The use of statistical tools (ST) and machine learning (ML) algorithms, in conjunction with highthroughput metabolomic-based approaches, can help in a wide range of applications in food authentication. ML models allow to identify and understand the most influential factors in food product authentication, such as biological and environmental conditions. Nuclear Magnetic Resonance (NMR) and other spectral metabolomic methodologies are advanced and comprehensive analytical techniques widely used in food authentication. Nonetheless, there is a need to construct more accurate models to predict the authenticity of food products to ensure their safety and quality for the well-being of the consumers and the economy. This dissertation is focused on the use of multivariate statistical analysis (MSA) of metabolomics data from high-value natural food products, as wine and honey, addressing the application of ML models to several classification problems, including the botanical and geographical origins. ML models were also built to discriminate and predict variables related to food authentication problems studied, including the prediction of different climatic influences on production samples, and the prediction of the age of storage based on metabolomics data analyses. Different preprocessing strategies, feature selection, dimensionality reduction techniques, and evaluation metrics were tested. The impact of different methods used on the performance of these models was evaluated. Based on these analyses, the models with better predictive performance were identified. Models interpretability was performed showing that by using ML models it is possible to associate important chemical features with food authentication classification. ST and ML with adequate preprocessing treatments and evaluation metrics are a suitable pipeline for different food authentication problems, as shown in this work. Despite some limitations of the datasets sizes of our studies, our findings are useful to guide the development of new metabolomics based approaches for different food authentication issues using ST and ML algorithms in wine and honey samples. To perform metabolomic-data analyses, different MSA and ML approaches were used, tested, and validated using the open source R package specmine, a software developed by the host group, and a set of open source Python libraries.
TipoTese de doutoramento
DescriçãoPrograma doutoral em Chemical and Biological Engineering
URIhttps://hdl.handle.net/1822/84322
AcessoAcesso aberto
Aparece nas coleções:BUM - Teses de Doutoramento
CEB - Teses de Doutoramento / PhD Theses

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato 
Rebeca Tatiana de Souto Santos.pdfTese de doutoramento6,02 MBAdobe PDFVer/Abrir

Este trabalho está licenciado sob uma Licença Creative Commons Creative Commons

Partilhe no FacebookPartilhe no TwitterPartilhe no DeliciousPartilhe no LinkedInPartilhe no DiggAdicionar ao Google BookmarksPartilhe no MySpacePartilhe no Orkut
Exporte no formato BibTex mendeley Exporte no formato Endnote Adicione ao seu ORCID