O sotaque, o dialeto e o erro

Todas as línguas que eu conheço têm sotaques. Alguns são tão diferentes que chegam a dificultar a compreensão: um nativo de Córdoba, Argentina, fala completamente diferente de alguém de Córdoba, Espanha. Chega a parecer outra língua, mas não é.

A organização capitalista implica que os sotaques utilizadas por mais pessoas, e por grupos mais ricos, costumam receber preferência, maior atenção e recursos. Nunca veremos um DVD de Hollywood dublado somente por atores paraibanos distribuído em escala nacional. Paulista pode. O resto? Nem a pau.

Com a interconectividade das redes, as variações vão diminuindo: os sulistas que pronunciavam Brasil, como os portugueses ainda pronunciam, já falam “brasiu”, como todos nós.

Mas se a televisão e o rádio serviram para criar um sotaque franco, a inteligência artificial vai terminar de massificar o seu uso.

Uma parte da sociedade já começa a utilizar assistentes virtuais: Alexa, Siri e demais robôs que estão preparados para receber comandos de voz. Utilizam bancos de dados de milhões de gravações. Uma hipótese plausível é que a maioria seja de sotaques paulistas, cariocas, o “português genérico da rede Globo.”

Da mesma forma que o seu GPS fala em paulistano, a Siri entende melhor o paulistano que o paraibano, o lisboeta que o cabo-verdiano (até o momento, e provavelmente por um longo tempo, só se construirão sistemas para português brasileiro e europeu, ou seja, genérico-paulistano e lisboeta). O idioma espanhol também tem este problema: é comum encontrar nos sistemas de IA as opções europeu e latino-americano, unificando sotaques da Terra do Fogo a Ciudad Juárez, e ignorando todas as variáveis no meio.

O resultado são pessoas que conseguem ser entendidas pelas máquinas e outras que precisam adaptar sua maneira de falar para serem compreendidas. Eu falo três idiomas, mas os robôs não me entendem em nenhum deles.

Maiores e menores.