Utilize este identificador para referenciar este registo:
https://hdl.handle.net/1822/84322
Título: | Metabolomics-based approaches for food authentication and traceability |
Outro(s) título(s): | Abordagens metabolómicas para autenticação alimentar e rastreabilidade |
Autor(es): | Santos, Rebeca Tatiana Souto |
Orientador(es): | Rocha, Miguel Maraschin, Marcelo |
Palavras-chave: | Autenticação de vinho e mel Metabolómica Ferramentas estatísticas e aprendizado máquina Wine and honey authentication Metabolomics Statistical and machine learning tools |
Data: | 24-Mar-2023 |
Resumo(s): | Nos últimos anos, a procura do consumidor por produtos alimentares naturais autênticos aumentou
consideravelmente, assim como a ocorrência de eventos de adulteração. Paralelamente, a conscientização
sobre a responsabilidade de produtores e vendedores no combate à fraude alimentar tem vido
a crescer. O uso de ferramentas estatísticas (ST) e algoritmos de aprendizado de máquina (ML), em
conjunto com abordagens metabolómicas, podem ajudar numa ampla gama de aplicações na área da
autenticação alimentar. Os modelos de ML permitem identificar e entender quais os fatores com maior
influência na autenticação alimentar, tais como as condições biológicas e ambientais. A Ressonância
Magnética Nuclear (NMR) e metodologias metabolómicas espectrais são técnicas analíticas avançadas e
abrangentes amplamente utilizadas na autenticação de alimentos. No entanto, existe a necessidade de
construir modelos mais precisos de forma a prever a autenticidade dos produtos alimentares, garantindo
a sua segurança e qualidade para o bem-estar dos consumidores e da economia.
Esta dissertação foca-se no uso da análise estatística multivariada (MSA) em dados metabolómicos
de produtos alimentares naturais de alto valor, como o vinho e o mel, com recurso à aplicação de modelos
de ML a vários problemas de classificação, incluindo a determinação de origens botânicas e geográficas.
Modelos de ML foram construídos para discriminar e prever variáveis relacionadas com os problemas de
autenticação dos alimentos estudados, incluindo a previsão de diferentes influências climáticas e a previsão
da idade de armazenamento com base em análises de dados metabolómicos. Diferentes estratégias
de pré-processamento, seleção de variáveis, técnicas de redução de dimensionalidade e métricas de avaliação
foram testadas. Foi avaliado o impacto de diferentes métodos utilizados no desempenho desses modelos.
Com base nessas análises, foram identificados os modelos com melhor desempenho preditivo. A
interpretação dos modelos foi realizada comprovando que com o uso de modelos de ML é possível associar
características químicas importantes com a classificação de alimentos naturais no processo de autenticação.
ST e ML com tratamentos de pré-processamento adequados e métricas de avaliação são um pipeline
adequado para diferentes problemas em autenticação de alimentos, como demonstrado neste trabalho.
Apesar de algumas limitações, tais como, o tamanho dos conjuntos de dados dos nossos estudos, as nossas
descobertas são úteis para orientar o desenvolvimento de novas abordagens usando a metabolómica
para diversos problemas existentes em autenticação alimentar conjugando com ST e ML em amostras de
vinho e mel. Para realizar análises de dados metabolómicos, diferentes abordagens MSA e de ML foram
usadas, testadas e validadas usando o package da linguagem de programação R specmine, um software
desenvolvido pelo grupo de investigação, e um conjunto de bibliotecas da linguagem de programação
Python. In recent years, the consumer demand for authentic natural food products has increased concurrently with an expand of adulteration events. At the same time, the awareness regarding the responsibility of retailers and producers to combat food fraud has also grown. The use of statistical tools (ST) and machine learning (ML) algorithms, in conjunction with highthroughput metabolomic-based approaches, can help in a wide range of applications in food authentication. ML models allow to identify and understand the most influential factors in food product authentication, such as biological and environmental conditions. Nuclear Magnetic Resonance (NMR) and other spectral metabolomic methodologies are advanced and comprehensive analytical techniques widely used in food authentication. Nonetheless, there is a need to construct more accurate models to predict the authenticity of food products to ensure their safety and quality for the well-being of the consumers and the economy. This dissertation is focused on the use of multivariate statistical analysis (MSA) of metabolomics data from high-value natural food products, as wine and honey, addressing the application of ML models to several classification problems, including the botanical and geographical origins. ML models were also built to discriminate and predict variables related to food authentication problems studied, including the prediction of different climatic influences on production samples, and the prediction of the age of storage based on metabolomics data analyses. Different preprocessing strategies, feature selection, dimensionality reduction techniques, and evaluation metrics were tested. The impact of different methods used on the performance of these models was evaluated. Based on these analyses, the models with better predictive performance were identified. Models interpretability was performed showing that by using ML models it is possible to associate important chemical features with food authentication classification. ST and ML with adequate preprocessing treatments and evaluation metrics are a suitable pipeline for different food authentication problems, as shown in this work. Despite some limitations of the datasets sizes of our studies, our findings are useful to guide the development of new metabolomics based approaches for different food authentication issues using ST and ML algorithms in wine and honey samples. To perform metabolomic-data analyses, different MSA and ML approaches were used, tested, and validated using the open source R package specmine, a software developed by the host group, and a set of open source Python libraries. |
Tipo: | Tese de doutoramento |
Descrição: | Programa doutoral em Chemical and Biological Engineering |
URI: | https://hdl.handle.net/1822/84322 |
Acesso: | Acesso aberto |
Aparece nas coleções: |
Ficheiros deste registo:
Ficheiro | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Rebeca Tatiana de Souto Santos.pdf | Tese de doutoramento | 6,02 MB | Adobe PDF | Ver/Abrir |
Este trabalho está licenciado sob uma Licença Creative Commons