A relação entre IA e linguística computacional
Entendendo a relação da linguística computacional e a ia e como elas interagem no dia-a-dia
Antes de ir a resposta da pergunta que intitula este artigo, vamos começar pelo básico: O que é uma linguagem? Parece óbvio, mas muitas vezes não sabemos o que, de fato, é uma linguagem e para que ela serve. Segundo o dicionário diz:
“(lin.gua.gem) sf.
1. Ling. Sistema de sinais us. pelo homem para expressar seu pensamento tanto na fala quanto na escrita.
2. Qualquer conjunto de símbolos us. para codificar e decodificar dados (linguagem de computação)
3. Forma de expressão própria de um grupo social ou profissional; JARGÃO
4. Fala, linguajar.
5. Língua (5).
6. Tudo que serve para exprimir sensações ou ideias (linguagem corporal).
7. Voz dos animais.” (Fonte: https://aulete.com.br/linguagem)
Assim, para a linguagem ser efetiva, é necessária comunicação efetiva com os elementos: emissor (quem fala), receptor (quem ouve), canal (meio pelo qual se fala), mensagem/código (língua falada). Observe a seguir:
Fonte: blogdoenem.com.br
De acordo com o pai da Linguística, Ferdinand de Saussure (1857-1913), em seu livro “Curso de Linguística Geral”, signo é a representação de um código e significado é o que visualizamos de um signo. Exemplo: a palavra “mesa” é o signo, e o que imaginamos sobre a “mesa” é o significado. Logo, a junção de signo + significado é a linguagem!
Fonte: infolaboratorio.blogspot.com
Para ter uma linguagem, é preciso ter um emissor e um receptor com o contexto da mensagem, trazendo para o ambiente computacional. O emissor seria o humano e o receptor seria a máquina. Assim, e como seria possível fazer a máquina entender o “pensamento humano”?
A afirmação de que “a Linguística é a ciência da linguagem” surgiu por meio do conceito de Saussure e, ao avançar, abriu amplo leque de possibilidades, fazendo com que a linguística se expandisse e encontrasse aplicação na computação. Mas como a conexão entre as duas ciências se estabelece?
É comum termos uma relação próxima “computador-máquina”, por meio de assistentes virtuais como a Alexa e o próprio ChatGPT, o qual proporciona uma conversa entre máquina e humano. Aquelas cenas de filme que seriam bem futuristas, para nós, hoje, é uma realidade, e tendo como pano de fundo a linguística computacional.
Apesar de não ser uma ciência propriamente exata e de não precisar ser um exímio programador, é necessário ter o mínimo de conhecimento de computação, visto que, dependendo a área que se pretende seguir, é bom ter conhecimento de computação de matemática, e lógica e etc., de modo a entender o que está acontecendo no background, além de trazer a complexidade da língua e suas variações para os programas.
Então, como um computador pensa? O chatbot pode pensar?
Mediante as regras semânticas (significados) e sintáticas (regras gramaticais), conseguimos ensinar um computador a “pensar” como humano, sendo mais ousados.
Transformar a linguagem natural em linguagem binária no computador de 0 e 1, parece ser um grande desafio, e é aí que entra em campo a PLN, ou seja, o Processamento da Linguagem Natural. O PLN, como é conhecido, é, o ramo da linguística computacional, entendido a como uma subárea da inteligência artificial, mais especificamente a área que faz a ponte entre a construção de software como tradutores informáticos, chatterbotters etc., e traz por meio da interação homem-máquina, para transformar a língua natural na linguagem computacional.
Os primeiros avanços no Processamento de Linguagem Natural (PLN) surgiram durante a Guerra Fria, um período marcado por um rápido aumento no investimento em tecnologia por parte de vários países. Esse investimento, mais especificamente na área de tradução, era crucial para compreender os planos do inimigo. Um marco significativo ocorreu em 1954, quando a IBM colaborou com a Universidade de Georgetown para desenvolver um tradutor.
Além disso, na década de 1950, o renomado linguista Noam Chomsky introduziu a Teoria Gerativista, que desempenhou um papel importante na intersecção entre linguística e computação. Sua teoria visava converter a linguagem natural em uma forma que os computadores pudessem compreender, estabelecendo, assim, uma ponte fundamental entre esses campos.
Podemos começar elucidar por meio do reconhecimento da fala, no qual, temos a parte da fonética e fonologia. A fonética se ocupa em estudar os sons e a fonologia investiga o sistema fonológico dos falantes. Por exemplo, como cita, Gabriel de Ávila Othero e Sérgio de Moura Menuzzi na p.27, 2000, essas áreas se enquadram nos seguintes campos:
-
Reconhecimento de fala (aplicativos de comando de voz, aplicativos que registram a voz e convertem em digitação);
-
Síntese de fala (programas que geram falas mediante dados; exemplo: pronúncia de uma palavra/frases de um dicionário);
-
Sistemas de diálogo em língua falada.
Outros tipos de programas que necessitam de conhecimentos sintáticos e semânticos, que foram pioneiros a ser objeto de estudo da linguística computacional são:
-
Tradução automática;
-
Análise de sentimento;
-
Sumarização de textos (redução de textos gigantes no qual reduz o texto com os pontos importantes)
Primeiro chatbot criado na década de 60
A título de curiosidade, o primeiro chatbot criado nos anos 60 foi a ELIZA, que simulava uma conversa com se fosse uma psicóloga, contando com a análise de sentimentos:

Fonte: https://web.njit.edu/~ronkowit/eliza.html
Importante frisar que chatbots são testados por meio dos Testes de Turing.
Os testes de Turing
Esse teste foi introduzido na década de 50, por Allan Turing (1912 - 1954), no artigo: “Computing machinery and intelligence”. Apesar de algumas limitações, é interessante como Turing investigou e trouxe esse teste, pois nele verifica-se se a máquina consegue mesmo “pensar como humano”.
Fonte: Pinterest
Como podemos ver, cada participante era isolado em salas individuais e se comunicava apenas por texto. Nesse contexto, homens assumiam a identidade de mulheres, e mulheres se passavam por homens, desafiando o interrogador a adivinhar quem era quem. O interrogador tinha liberdade de fazer qualquer pergunta, desde que no fim, conseguisse identificar corretamente o homem e a mulher.
No entanto, no Teste de Turing, o objetivo era substituir o homem por uma máquina, de forma que ela conseguisse enganar o interrogador, fazendo-o acreditar que era uma mulher. Infelizmente, o teste não foi concluído, pois Alan Turing faleceu prematuramente, e sua visão completa para o teste não pôde ser realizada. No entanto, ao longo do tempo, o teste foi adaptado e evoluiu, como podemos ver na imagem a seguir:
Fonte: https://web.njit.edu/~ronkowit/eliza.html
Apesar dos parâmetros citados, temos também outras partes que desafiam a construção de um programa computacional com enfoque na linguagem humana, como:
-
Ambiguidade (uma frase tem duplo sentido);
-
Sintaxe (a posição que a palavra ocupa dentro da oração);
-
Semântica (uma palavra pode ter vários significados, dependendo do contexto);
-
Dialetos;
-
Jargões;
-
Análise conversacional e, em alguns casos, até pronome chulos.
Após elucidação da linguística computacional, você estará familiarizado e perceberá que está rodeado dessa ciência, ainda mais com o crescimento do ChatGPT, no qual foi desenvolvido pela inteligência artificial, o qual é treinado num grande corpus de dados de texto e pode gerar respostas semelhantes às humanas, como pedidos ou perguntas.
O ChatGPT foi especificamente concebido para aplicações de conversação, onde é possível compreender e gerar texto de forma conversacional. Ele foi treinado numa gama diversificada de textos da Internet com capacidade de gerar respostas coerentes e contextualmente relevantes.
Com isso, observamos que a linguística computacional é uma área de grande expansão, na qual são necessários: psicólogos, programadores, linguistas etc., para que cada vez mais, programas como o ChatGPT, comandos de vozes e tradutores automáticos se aproximem mais do “pensamento humano” por meio da complexidade da língua natural.
Referências:
A GRAMÁTICA Gerativa. Língua Portuguesa e Linguística, S.d. Disponível em: . Acesso em: 20 set. 2023.
ELIZA: a very basic Rogerian psychotherapist chatbot. NJIT, S.d. Disponível em: . Acesso em: 20 set. 2023.
LIVE Juliana Porto (Graduação na UnB) - Introdução à Linguística Computacional. EstaTiDados, 23 fev. 2021. Disponível em: . Acesso em: 20 set. 2023.
MENUZZI, G.abnel de Ávila Á. Othero O.;e Sérgio de MOURA, S. et al. Linguística Computacional: teoria & prática. São Paulo: Parábola, 2000. 128 p.
O CHATGPT consegue compreender e responder em vários idiomas? Botpress, S.d. Disponível em: . Acesso em: 20 set. 2023.
O QUE É O TESTE de Turing? Medium, S.d. Disponível em: . Acesso em: 20 set. 2023.
SAUSSURE, Ferdinand F. de. Curso de Linguística Geral. São Paulo: Cultrix, 2012. 312 p.
TESTE de Turing. Wikipédia, S.d. Disponível em: . Acesso em: 20 set. 2023.
THE LANGUAGE of computational linguistics. | Walter Daelemans | TEDxAntwerp. TEDx Talks, 7 fev. 2022. Disponível em: . Acesso em: 20 set. 2023.
VIEIRA, R.; LIMA, V. L. S. Lingüística computacional: princípios e aplicações. In: NEDEL, L. P. (ed.). IX Escola de Informática da SBC-Sul. Passo Fundo, Maringá, São José. SBC-Sul, 2001.. Acesso em: 20 set. 2023.
As informações contidas neste artigo não refletem a opinião do Jornal Folha de Pernambuco e são de inteira responsabilidade de seus criadores.



