LA LINGÜÍSTICA, CIENCIA INDISPENSABLE PARA EL DESARROLLO TECNOLÓGICO
Detrás del
desarrollo de la inteligencia artificial, robots, celulares, asistentes de
voz y más, hay un trabajo multidisciplinario. Seguramente las primeras
disciplinas que se te vienen a la mente al hablar del desarrollo de esta
tecnología son la robótica, mecatrónica, programación, por mencionar algunas.
Sin embargo, qué hay de otras disciplinas como la psicología, la
filosofía, y de la que hablaremos en este artículo; la lingüística.
Cuando
interactúas con algún dispositivo normalmente lo haces por voz o por texto,
¿cierto?, y la facilidad con la que lo haces es gracias al desarrollo que se ha
hecho en algo que los lingüistas llamamos lingüística computacional.
Que entre otras muchas cosas es una herramienta fundamental en el desarrollo de la tecnología.
Lo que nos hace especiales a los seres
humanos
Todas las
especies animales tienen una manera de comunicarse, pero solo los seres humanos
tenemos algo que se llama el lenguaje natural.
Entre otras
características que lo hace único, nuestras lenguas (idiomas) están
formadas por 5 niveles:
La
fonética: el estudio del sonido.
La
morfología: el estudio de la estructura interna de las palabras.
La
sintaxis: el estudio de la relación palabra-frase.
La
semántica: el estudio del significado.
La
pragmática: el estudio de las expresiones lingüísticas y su relación con
el mundo exterior.
Ninguna otra
especie posee en su lenguaje estas características, pero si hay algo que hoy en
día se le puede acercar.
El Procesamiento del Lenguaje Natural (NPL/PLN) o Lingüística Computacional como le llamamos los lingüistas, es la rama encargada de implementar estos niveles en las computadoras (por englobar a las máquinas o inteligencias que procesan nuestro lenguaje).
¿Qué hay de complejo en el hablar?
Si bien las
máquinas e inteligencias artificiales “dominan” partes de los 5 niveles de un
lenguaje natural, aún sigue existiendo una gran brecha entre esto y un lenguaje
artificial.
Por cada nivel
de los mencionados arriba, el PLN puede enfrentar muchos retos en los que aún
queda un largo camino por recorrer. Y tal vez te preguntes, ¿qué tipo de
problemas?
Pues para
nosotros el comunicarnos es tan necesario y natural como el respirar; pero
justamente en ello recae su complejidad.
¿Te ha pasado
que le pides a tu dispositivo que te busque alguna información y te entienda
mil cosas diferentes a lo que necesitas? A mí me ha pasado muchas
veces, la última fue cuando le pedí a mi Alexa que me
buscara “casas a la venta” y ella me respondió con lugares para
comprar “gasas”; nada que ver, ¿cierto?
Bueno, esto
también puede pasarnos a los humanos, pero lo que para mí dispositivo
representa 5 fonemas (cuatro sonidos g.a.s.a.s).
Para cualquier persona representa 5 fonemas más una representación gráfica mental que nos permite diferenciar y corregir la información que escuchamos mal y deducir el mensaje correctamente.
Algunos problemas
Otro problema
muy común, es la diferenciación de fonemas de con diferentes realizaciones
acústicas de una misma lengua. Un asistente de voz podría diferenciar muy bien
el sonido estándar “ch” del español, pero resulta que para lo que un hablante
de la ciudad de Lima es “chancla” para un hablante de la selva podría ser
“shancla”.
Parecería un problema
muy mínimo, pero esto es un solo fonema comparado en dos variantes del español
de Perú; pero si lo multiplicamos por la cantidad de países en las que se habla
el español y cuantas variedades hay en cada uno de ellos, el reto es realmente
abrumador.
Ahora, piensa en
esto: para una persona resulta fácil entender esta oración, “Vi a mi primo
caminando en el coche”, es obvio que quien iba en el coche fue quien vio a su
primo, más no que el primo iba caminando en el auto.
Sin embargo,
para un lenguaje artificial identificar estas ambigüedades resulta aún más
complicado por más frecuencias que se les enseñe a estos.
Además, esto sin contar que el léxico de una lengua está formado por un número infinito de palabras y de significados; por ejemplo, la palabra “gato” puede tener al menos tres significados distintos, y aunque parezca sencilla la solución de programar al lenguaje con un diccionario donde estén contenidas estos significados.
¿Dónde queda aquel léxico que no está
registrado en los corpus?
Podríamos seguir
enlistando un sinfín de problemas a los que se enfrenta esta área que es tan
crucial para el desarrollo de la Inteligencia Artificial, pero sin duda no
nos alcanzarían los artículos. Pero podemos despedirnos con una reflexión.
El conocimiento
y el lenguaje son entes vivos debido a que los seres humanos somos seres
en constante cambio y movimiento; nos adaptamos fácil a ello porque somos
el agente de estos cambios y los experimentamos en tiempo real.
Día con día
aprendemos de infinidad de información que se codifica en el
lenguaje, ¿cómo hará la inteligencia artificial para simular esto?
Seguramente quedan muchas dudas aún y a la vez los expertos en el tema trabajan para resolverlas, sin embargo, queda claro que la capacidad de abstracción humana del lenguaje es sumamente compleja y muy difícil de imitar.
(*) Oly Alcántara de la Cruz
Comentarios
Publicar un comentario