CONTRIBUIÇÕES EM LINGUÍSTICA COMPUTACIONAL PARA O PORTUGUÊS

Authors:MARCELO RODRIGO DE SOUZA PITA 1, MARCELO GOMES PEREIRA DE LACERDA 3, FLÁVIO ROSENDO DA SILVA OLIVEIRA 2
Institution1 SERPRO - Serviço Federal de Processamento de Dados (PE/Brasil), 2 IFPE Campus Paulista - Instituto Federal de Educação Ciência e Tecnologia de Pernambuco (PE/Brasil), 3 UFPE - Universidade Federal de Pernambuco (PE/Brasil)

Abstract

A Linguística Computacional é um campo interdisciplinar de pesquisa que estuda problemas de processamento automatizado da linguagem natural e propõe modelos computacionais que capturam os mais diversos fenômenos linguísticos. Sendo um rebuscado produto da inteligência humana, a linguagem natural e sua evolução estão intimamente relacionadas com as dimensões antropológica, sociológica e cognitiva de nossas sociedades. Portanto, sua complexidade traz grandes desafios para a automação de processamento de linguagem natural. As dificuldades a esse campo associadas se devem em parte à ambiguidade presente nas linguagens naturais, o que exige a incorporação nos modelos de conceitos de Pragmática. Portanto, avanços nestas linhas de pesquisa passam por métodos estatísticos, de aprendizado de máquina e de inteligência artificial, inspirados por modelos cognitivos da Linguística. Isto pressupõe a criação de times multidisciplinares: cientistas da computação, linguistas, estatísticos, especialistas em aprendizado de máquina, neurocientistas, além de outros perfis relacionados. Nas últimas décadas, a quantidade de informação produzida que envolve linguagem natural cresceu vertiginosamente, porém o inglês é a língua mais falada. Como consequência, a maior  parte das contribuições científicas na área são voltadas para este idioma, o que representa uma grande dificuldade na construção de ferramentas computacionais para solução de problemas em cenários onde o português é o idioma utilizado. Este Simpósio objetiva reunir contribuições originais, teóricas e práticas, em Linguística Computacional para o Português para apresentação e discussão, nos seguintes temas (lista não exaustiva): análise de discurso, análise de sentimento, análise sintática, arcabouços para processamento de Português, compreensão de linguagem natural, marcação de classes gramaticais, mineração de texto (e.g. classificação, agrupamento), modelos cognitivos, modelos de tópicos, vetores de palavras e documentos, reconhecimento de entidades nomeadas, reconhecimento de fala, recuperação de informação, resolução de perguntas, segmentação morfológica e de fala, síntese de linguagem natural, sistemas interativos para diálogo (e.g. chatbots), sumarização de texto e tradução automatizada.

Keywords: Linguística Computacional, Inteligência Artificial, Processamento de Linguagem Natural


Minicurrículo:

MARCELO RODRIGO DE SOUZA PITA

Marcelo Pita é engenheiro e mestre em Engenharia da Computação pela UPE e doutorando em Ciência da Computação no DCC-UFMG. Trabalha no SERPRO Regional Recife, onde atua como cientista de dados, tendo experiência nas áreas de simulações sociais e aprendizado de máquina. Atualmente realiza pesquisas em processamento de linguagem natural e modelagem de tópicos. Seus interesses giram em torno das temáticas mais centrais da inteligência artificial.



MARCELO GOMES PEREIRA DE LACERDA

Mestre e bacharel em Engenharia de Computação pela Universidade de Pernambuco (UPE) (2014.1 e 2012.2, respectivamente) e doutorando em Ciência da Computação na Universidade Federal de Pernambuco (UFPE) com foco em Inteligência Artificial, Marcelo Lacerda é atualmente docente na UFPE e consultor em Inteligência Artificial para empresas. Desde março de 2016 vem participando de projetos de Pesquisa e Desenvolvimento em Processamento e Entendimento de Linguagem Natural na área jurídica.



FLÁVIO ROSENDO DA SILVA OLIVEIRA

Flávio Oliveira é Mestre em Engenharia da Computação (2009.2) e graduado pela Escola Politécnica de Pernambuco. Foi Diretor de Ensino no IFPE Campus Paulista e atualmente é docente pesquisador com interesse nas áreas Inteligência Computacional, Sistemas da Informação e Aprendizagem Profunda. Suas principais contribuições estão na área de Sistemas Inteligentes Híbridos, aplicados em Apoio à Decisão em Agricultura e Medicina, já tendo participado em projetos financiados pelo CNPq e FINEP