Utilize este identificador para referenciar este registo: https://hdl.handle.net/1822/92494

TítuloDicionários dinâmicos multi-fonte
Autor(es)Almeida, J. J.
Orientador(es)Henriques, Pedro Rangel
Palavras-chaveDicionários
PLN
DSL
Ontologias
Bibliotecas digitais
Dictionaries
NLP
Ontologies
Digital libraries
Data2003
Resumo(s)O tema central desta dissertação é a especi cação de dicionários. Defende-se a aproximação de de nir consultas a Dicionário com base na activação de consultas a várias fontes (capazes de produzir informação diferente, mas com plementar, referente a um termo) e junção dos resultados delas provenientes. As fontes a colar têm por base ferramentas várias de processamento de linguagem natural (funções) e recursos de linguagem natural (constantes). Chamaremos fonte de informação a algo capaz de produzir informação as sociada a um termo. Uma fonte pode ser um simples recurso de processamento de linguagem natural ou envolver um conjunto de ferramentas e recursos. A especi cação formal das ferramentas é um procedimento de abstracção que, para além de permitir entender e discutir as ferramentas, cria uma plata forma comum a todas elas e portanto um domínio sintáctico-semântico onde possam cooperar. Além disso, a abstração facilita a comunicação e a cooperação. A especificação formal das ferramentas vai permitir descrever o seu funcionamento e encapsular detalhes menos relevantes. Permitirá também definir uma álgebra de ferramentas, recursos gerais, recursos locais, e um tipo de dados comum. Para se conseguir juntar as informações há necessidade de usar um tipo de dados comum e definir funções de conciliação que permitam harmonizar informações provenientes das várias fontes. A definição de funções estratégia capazes de descrever o modo como serão consultadas as diversas fontes de informação é também um elemento indispensável para que se possa escolher um compromisso aceitável de custo/qualidade, completude. Para descrição da interpelação às várias fontes de informação será utilizada a linguagem de especificação Camila. Para fazer a adaptação de formatos e encapsular detalhes sintácticos será utilizada linguagem de scripting Perl. Sempre que possível, tentou-se construir e disponibilizar recursos e ferramentas de processamento de linguagem natural de modo a ajudar a colmatar algumas necessidades gerais existentes.
The subject of this thesis is the speci cation of dictionaries. The approach used here is to de ne dictionary lookup as the consultation of several sources (capable of producing di erent but complementary information about a term) and merging their results. The sources to join are based on several natural language processing tools (functions) and natural language resources (constants). We will call source to anything that can produce information about a given term. A source can be as simple as a natural language processing resource, or as complex as a result of the collaboration of several tools and resources. Formal speci cation of tools is an abstraction process that helps the process of understanding and discussing. At the same time, it builds a common platform, where all the tools share the same syntactic-semantic domain and collaborate, thus helping in communication and cooperation. The formal speci cation of the tools builds a description of their behavior but hides their less relevant details. It allows the de nition of an algebra of tools, general resources, local resources, and a common datatype. To join all the results it is necessary to use a common universal datatype and de ne conciliation functions to merge the information built from all the information sources. It is crucial to be able to de ne strategy functions capable of describing how the sources should be consulted in order to achieve a trade-off between cost, quality and completeness. To describe functions and processes, the Camila specification language will be used. To adapt and change formats, the Perl scripting language will be used. Due to the sparse availability of resources and tools, an e ort has been made to open-source all the resources developped during this work.
TipoTese de doutoramento
DescriçãoTese de Doutoramento em Informática
URIhttps://hdl.handle.net/1822/92494
AcessoAcesso aberto
Aparece nas coleções:BUM - Teses de Doutoramento
DI - Teses de doutoramento

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato 
Jose Joao Dias de Almeida.pdfTese de Doutoramento2,1 MBAdobe PDFVer/Abrir

Partilhe no FacebookPartilhe no TwitterPartilhe no DeliciousPartilhe no LinkedInPartilhe no DiggAdicionar ao Google BookmarksPartilhe no MySpacePartilhe no Orkut
Exporte no formato BibTex mendeley Exporte no formato Endnote Adicione ao seu ORCID