Utilize este identificador para referenciar este registo: https://hdl.handle.net/1822/34396

TítuloMethods for analysis of multi-state survival data
Autor(es)Moreira, Ana Cristina
Orientador(es)Machado, Luís Meira
Data7-Mai-2014
Resumo(s)This thesis is concerned with multi-state survival analysis. In this context, we propose methods for the analysis of multi-state survival data. The methods developed in this thesis are motivated by the applications to the medical sciences. However, they can also be applied to economics, astronomy, and engineering, among other elds. This is an exciting and full potential area of research, with many interesting problems. Survival Analysis is concerned with studying inter-event times. In a classical setup, the focus is on the elapsed time between two well-de ned events: the starting event (\alive"), and the terminating event (\death"). Multi-state models can be considered as a generalization of the survival process where \death" is the ultimate outcome, but where intermediate states are identi ed. If the events are of the same nature, this is usually referred as recurrent events, whereas if they represent di erent states they are usually modelled through their intensity functions. When analyzing recurrent event data, the inter-event times are referred to as the gap times, and they are of course determined by the times at which the recurrences take place (i.e. the recurrence times). The statistical analysis of consecutive gap times is an issue of much importance. Most of the times, one will be interested in describing not only the marginal distribution of the gap times but also the bivariate distribution of the joint gap times. This will be considered in Chapter 2. Speci cally, we propose methods for estimate the bivariate distribution under right censoring and conditional bivariate distribution given a quantitative covariate. Alternatively, we may think the gap times as arising from a particular multi-state model such as the progressive three-state model or the progressive k-state model. A multi-state model is a model for a stochastic process, which is characterized by a set of states and the possible transitions among them. The states represent di erent stages of the disease course along a follow-up. Several multi-state models that have been widely used in biomedical applications but the three-state progressive model and the illness-death model are certainly the most common. The illness-death model is a generalization of the three-state progressive model in which a direct transition from the\alive"state to the nal, absorbing\dead"state is possible. In this model one of the major goals is the estimation of the so-called transition probabilities. Traditionally, this estimation is performed under a Markov assumption, which leads to the socalled Aalen-Johansen estimator. Unfortunately, the variance of this estimator may be large in heavily censored scenarios. The possibility of improving this estimator via presmoothing is explored in Chapter 3. For the practical application of the methods presented in Chapters 2 and 3, we developed several functions in R (R Development Core Team, 2013). Some of these functions were used to build an R package for the estimation of the bivariate distribution function. Details about this and other packages for multi-state modelling are given in Chapter 4. All methods are illustrated by means of its application to real biomedical datasets.
Esta tese está focada na análise de sobrevivência multiestado. Neste contexto, propusemos métodos para a análise de dados de sobrevivência multiestado. Os métodos desenvolvidos nesta tese foram motivados pelas aplicações na medicina. No entanto, estes podem ser aplicados à economia, astronomia e engenharia entre outros campos. É uma área excitante e de grande potencial de investigação, com muitos problemas interessantes. A análise de sobrevivência preocupa-se com o estudo de tempos entre eventos. Numa versão clássica, o foco é sobre o tempo decorrido entre dois eventos bem definidos: o evento inicial ("vivo"), e o evento nal ("morte"). Os modelos multiestados podem ser considerados como uma generalização de um processo de sobrevivência onde "morte" é o resultado final, mas onde estados intermédios são identificados. Se os eventos são da mesma natureza, estamos no contexto de eventos recorrentes; se os estados representam diferentes eventos então eles são habitualmente modelados através de funções de intensidade. Na análise de dados de eventos recorrentes, os tempos entre eventos são usualmente referidos como "gap times", e são determinados pelos tempos onde as recorrências ocorrem (ou seja, tempos de recorrência). A análise estat ística de "gap times" consecutivos é um tema que tem recebido muita atenção nos últimos anos. Na maioria das vezes, não estão só interessados em descrever a distribuição marginal dos "gap times", mas também a distribuição bivariada conjunta dos mesmos. Isto será considerado no Capítulo 2. Especificamente, propusemos métodos para estimar a distribuição bivariada na presença de censura e a distribuição bivariada condicional, dada uma covariável quantitativa. Alternativamente, pensamos nos "gap times" como resultado de um modelo multiestado particular tal como modelo progressivo de três estados ou modelo progressivo de k-estados. Um modelo multiestado é um modelo para um processo estocástico, que é caracterizado por um conjunto de estados e possíveis transições entre eles. Os estados representam diferentes etapas do percurso da doença ao longo de um acompanhamento "follow up". Vários modelos multiestados têm sido amplamente utilizados em aplicações biomédicas, mas o modelo progressivo de três estados e o modelo doença-morte são os mais comuns. O modelo doença-morte e a generalização do modelo progressivo de três estados em que uma transição direta do estado "vivo" para o final, estado absorvente "morte" é possível. Neste modelo um dos principais objetivos é a estimativa das probabilidades de transição. Tradicionalmente, esta estimativa é calculada sob o pressuposto de Markov, que tradicionalmente recorre ao estimador de Aalen-Johansen. Infelizmente, a variância deste estimador pode ser elevada em cenários com elevadas taxas de censura. A possibilidade de melhorar este estimador com pré-suavização é explorada no Capí tulo 3. Para aplicações práticas dos métodos presentes no Capítulo 2 e 3, desenvolvemos várias funções em R (R Development Core Team, 2013). Algumas dessas funções foram usadas para construir um package no R para estimar a função distribuição bivariada. Detalhes sobre este package e outros packages para modelação multiestado são dados no Capítulo 4. Todos os m étodos serão ilustrados por meio da sua aplicação em dados reais em medicina.
TipoTese de doutoramento
DescriçãoTese de doutoramento em Ciências (área de especialização em Matemática)
URIhttps://hdl.handle.net/1822/34396
AcessoAcesso aberto
Aparece nas coleções:BUM - Teses de Doutoramento
DMA - Teses de doutoramento

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato 
Tese_Ana_Moreira_2014.pdf1,78 MBAdobe PDFVer/Abrir

Partilhe no FacebookPartilhe no TwitterPartilhe no DeliciousPartilhe no LinkedInPartilhe no DiggAdicionar ao Google BookmarksPartilhe no MySpacePartilhe no Orkut
Exporte no formato BibTex mendeley Exporte no formato Endnote Adicione ao seu ORCID