Deteção e validação de comportamento desviante no combate à fraude em modelos de publicidade pay-per-click

Utilize este identificador para referenciar este registo: https://hdl.handle.net/1822/28285

Título:	Deteção e validação de comportamento desviante no combate à fraude em modelos de publicidade pay-per-click
Autor(es):	Festa, Paulo Sérgio de Almeida
Orientador(es):	Azevedo, Paulo J.
Palavras-chave:	Análise estatística Comportamento desviante Detecção de fraude Mineração de dados Pagamento por clique Publicidade Advertising Data Mining Fraud detection Pay-per-click Outlier detection Statistical analysis
Data:	5-Dez-2012
Resumo(s):	O modelo pay-per-click apresenta-se como um dos principais modelos de negócio que acautela a sustentabilidade financeira de vários serviços online (e.g. motores de busca e redes sociais) através dos proveitos gerados pela impressão de publicidade. Assim, os anunciantes interessados em divulgar e lucrar com os seus produtos ou serviços pagam comissões dos seus anúncios aos editores (e.g. sites) que os difundam. O montante pago pelo anunciante é calculado com base no número de cliques realizado nos anúncios. Infelizmente, a veracidade deste modelo é colocado frequentemente em causa pela existência de um conjunto de incentivos desonestos (i.e. situações de fraude) que favorecem parte dos intervenientes. Nesta dissertação é proposta uma solução para detecção e validação em tempo real, sem intervenção humana, de situações fraudulentas que envolvam a inflação de cliques em anúncios classificados. Com principal foco na postura do utilizador, são definidas variáveis numéricas para caracterizar o seu comportamento geral. São, igualmente, derivadas regras de associação que permitam detectar padrões de utilização e estimadas as distribuições de valores de cada uma das variáveis consideradas. As suspeitas de fraude surgem se o valor dessas variáveis, para um dado utilizador, se desviar de forma significativa dos valores esperados (i.e. obtidos pelos restantes utilizadores). A proposta para validação destas suspeitas baseia-se na criação e implementação de cenários que visam dificultar, propositadamente, o comportamento suspeito até aí demonstrado pelo utilizador. Se mesmo nestas circunstâncias o comportamento se mantiver inalterado, as suspeitas são consideradas fundamentadas, o utilizador considerado fraudulento e os seus cliques invalidados. O método proposto foi testado através de um protótipo desenvolvido especialmente para esta problemática. Os resultados permitem concluir que a combinação de padrões de utilização obtidos por técnicas de mineração de dados e uma análise estatística criteriosa são uma mais valia para identificar situações suspeitas em modelos pay-per-click. Evidencia, igualmente, que as situações suspeitas podem ser fundamentadas com base no comportamento e postura do utilizador perante os cenários adversos que lhe são colocados. The pay-per-click advertising model appears as one of the main business models that guarantees the financial sustainability of several online services (e.g. search engines and social networks) through the profits generated by advertising impression. For that reason, the advertisers interested in disclosing and profit from their own products or services pay commissions of their own advertisements to the publishers that disseminate them (e.g. sites). The amount paid by each advertiser is calculated in regard to the number of mouse clicks done in each advertisement. Unfortunately, the integrity of this model is usually questioned by the existence of a set of dishonest incentives (known as fraudulent situations) that favour part of the stakeholders. In this dissertation, a solution is proposed to detect and validate in real time, with no human intervention, fraudulent situations that involve the inflation of mouse clicks in classified ads. The main focus relies on the user attitude by defining a number of numerical variables that describe his general behaviour. The fraud suspicions arise if the value of those variables for a given user deviates significantly from the expected values (i.e. obtained by the remaining users). The validation of these suspicions is based on the creation and development of scenarios that want to hamper the suspected behaviours revealed so far. If, even under these circumstances, the behaviour remains unchanged, then those suspicions are deemed as legit, considering that same user as fraudulent and his own clicks are therefore invalidated. The proposal method as been tested through a prototype specially developed for this purpose. The results allow to conclude that the pattern combination obtained by data mining techniques and a careful statistical analysis are indeed accurate and able to identify the suspicious situations in pay-per-click advertising model. It also shows that the suspicious situations can be grounded in regard to the user behaviour and posture for the adverse scenarios that he have to face with the objective of detecting frauds.
Tipo:	Dissertação de mestrado
Descrição:	Dissertação de mestrado em Engenharia Informática
URI:	https://hdl.handle.net/1822/28285
Acesso:	Acesso aberto
Aparece nas coleções:	BUM - Dissertações de Mestrado

Ficheiros deste registo:

Ficheiro	Descrição	Tamanho	Formato
eeum_di_dissertacao_pg17557.pdf		29,73 MB	Adobe PDF	Ver/Abrir

Ver registo completo Sugerir correção Estatísticas