Author: Erick Fonseca

Formado em computação, com doutorado em NLP, e fazendo pesquisa nessa área. Fascinado pelas línguas humanas, e de vez em quando tenta aprender mais uma delas. Twitter: https://twitter.com/Erick404

A Capacidade (e Limitação) de Máquinas Entenderem a nossa Língua

Esse é o primeiro texto do Intervalo de Confiança sobre NLP (Natural Language Processing), as técnicas computacionais para fazer sistemas capazes de entender as línguas humanas. Essa área abrange diversas aplicações: o Google Translate, a Siri, o teclado do seu celular, entre muitas outras que são menos visíveis. No do NLP, está o aprendizado de máquina, permitindo que modelos estatísticos aprendam diversas nuances linguísticas. Neste texto, não vou entrar nas técnicas de NLP em si, mas falar de algumas características comuns a praticamente todas elas que acabam impondo certas limitações práticas. Mais especificamente, em como certas coisas são óbvias e