TrabalhosGratuitos.com - Trabalhos, Monografias, Artigos, Exames, Resumos de livros, Dissertações
Pesquisar

O Resumo das bases

Por:   •  18/5/2016  •  Dissertação  •  290 Palavras (2 Páginas)  •  236 Visualizações

Página 1 de 2

Aelius

        

        Aelius é um software livre, projeto open source que visa o desenvolvimento de um conjunto de módulos e interfaces, com base em NLTK Python para ferramentas externas para análise superficial do Português Brasileiro. Ele também inclui recursos de linguagem, como modelos de linguagem, textos de amostra e padrões de ouro, consegue etiquetar morfossintaticamente textos com base em three tagger e vários algoritmos de aprendizagem de máquina, Atualmente, Aelius já oferece instalações para POS-tagging e chunking corpora e anotações outputting em formatos diferentes, como em XML no esquema de codificação TEI P5. Aelius é mantido por Leonel Figueiredo de Alencar, um linguista teórica e computacional na Universidade Federal do Ceará, no Brasil, coordenador do Grupo de Pesquisa "Natural Linguagem e Computação" (Grupo Complin - Computação e Linguagem Natural) e os corpus utilizados para treiná-lo foram :

-Tycho Brahe Corpus de Português histórico (TBCHP) [http://www.tycho.iel.unicamp.br/~tycho/corpus/en/index.html].

-
MAC-MORPHO Corpus do Português Brasileiro (versão preparada para o treinamento tagger [http://www.nilc.icmc.usp.br/lacioweb/macmorpho.php] e adaptado para distribuição com NLTK).

Freeling

        O Projeto open source foi criado e é liderado por Lluís Padró, Freeling é uma biblioteca C ++ que fornece funcionalidades para análise de linguagem (análise morfológica, detecção entidade nomeada, pos-tagging, parsing, Word Sense desambiguação, Semantic Rotulagem papel, etc.) para uma variedade de línguas (Inglês, Espanhol, Português, Italiano, Francês, Geman, Russo, Catalão, galego, croata, esloveno, entre outros). Freeling também fornece um front-end de linha de comando que pode ser usado para analisar textos e obter a saída no formato desejado (XML, JSON, CoNLL). O dicionário Português contém cerca de 909 mil formulários correspondentes a 105.000 Lemma-PoS combinations, os dados para WordNet Português foram extraidos do brazilian-wn project .

...

Baixar como (para membros premium)  txt (2 Kb)   pdf (334.8 Kb)   docx (9.5 Kb)  
Continuar por mais 1 página »
Disponível apenas no TrabalhosGratuitos.com