Nos levantamos por la
mañana y preguntamos a nuestra Alexa: ¿Qué tal día hará hoy? Alexa nos da el
parte meteorológico con su voz impersonal dulzona y metálica. Seguidamente
pulsamos en nuestro dispositivo de telefonía móvil y miramos que noticias
seleccionaron para nosotros.
Cuando era estudiante de
ingeniería me explicaron lo que era una red neuronal y apenas entendí nada de
lo que el profesor puso en la pizarra, esto hace ya casi cincuenta años. Después,
por mi cuenta, miré y busqué artículos que me hablaron de la Inteligencia
Artificial (IA) y aprendí términos en inglés que ahora, de una manera milagrosa,
empiezo a ver escritos en internet y en las redes sociales. Machine
Learning, Backpropagation, fuzzy logic, entre otros muchos términos. Seguidamente
mi horizonte tecnológico se fue abriendo y a lo largo de esos cincuenta años he
visto aparecer cantidad de avances que nunca han dejado de fascinarme. Que
suerte la mía, con poder estar vivo ante esta revolución. Pero centremos
nuestra atención en un interesante tema: La lingüística computacional.
Redes neuronales integradas en la IA Generativa (ChatGPT)
Las redes neuronales
ahora son protagonistas, en primera línea, del desarrollo de los llamados Chat
Bots (máquinas con las que conversar). Detrás de los algoritmos de
aprendizaje (Maching Learnng) hay un complejo entramado de redes
neuronales que aprenden de patrones que reciben y son capaces de gestionar de
modo conversacional, mediante lenguaje natural, un dialogo seudo inteligente
con los usuarios. Dije seudo porque lo es. No se asusten, porque de momento,
antes de seguir, dejaré claro que las máquinas no son capaces de pensar y
razonar de forma creativa.
Para empezar, se me ocurre
una pregunta que seguro que a ustedes también se les está ocurriendo. Veamos.
¿Si se sientan delante de Alexa, o cualquier chat bot al que quieren
preguntarle algo y lo hacen como lo harían si se tratara de preguntarle a un
humano la respuesta sería igualmente lógica y coherente? Quizá no, seguramente
hay que interrogar a la máquina con unos patrones lingüísticos apropiados. ¿Cómo
debemos dirigirnos a la máquina para que nos entienda bien y, por tanto, su
respuesta sea aceptada como “razonable”?
Cuando estudiábamos se
nos hablaba del llamado “lenguaje de máquina” y todos entendíamos que
era el lenguaje con el que se programaban los algoritmos digitales lógicos para
que los microprocesadores atendieran nuestras demandas. Pero ahora la cosa ha
cambiado y los lenguajes han ido evolucionando hacia los llamados “lenguajes
naturales” que, quizá por el termino natural, se prestan a confusión. Desde
el punto de vista de las ciencias de la computación los lenguajes naturales son
aquellos con los que las nos dirigimos a las máquinas y estas se dirigen
a nosotros. Pero no deben confundirse en su exactitud funcional con los que
usamos para comunicarnos entre los humanos. Ciertamente son parecidos, claro
que sí, pero existen matices que debemos ir entendiendo para que nuestras “prompts”
(preguntas) a la máquina sean bien entendidas.
Todos sabemos más a o
menos lo que es la lingüística: La RAE define el término “Lingüística computacional”
como la aplicación de los métodos de la inteligencia artificial en el
tratamiento de cuestiones lingüísticas.
Nunca fui muy bueno en
los idiomas y bien que lo he pagado, porque me he perdido la posibilidad de
interaccionar de un modo más eficaz con comunidades científicas y tecnológicas
con las que hubiese deseado compartir conocimiento. El inglés, esa lengua que nació
desligada de las lenguas latinas en “dudosos parnasos lingüísticos” (sus
orígenes no fueron de una lengua culta), se ha adueñado del mundo de la comunicación
y hoy, para bien o para mal, hay que leer y comunicarse en esta lengua, que a mí
particularmente me parece bastante más pobre que la nuestra, el español. Sin
embargo, ahora empiezo a respirar mejor, porque empieza a no ser tan necesario
el uso del inglés para interaccionar con las máquinas. Los grandes fabricantes
de dispositivos de computación son conscientes de que no es precisamente el
inglés la lengua más hablada en el planeta, mucho más lo es, por ejemplo, el
español; esto me alegra, porque siempre he soñado con que nuestra lengua dejara
de ser la lengua para hablar con Dios o para escribir novelas de caballería.
Las máquinas, mis queridos lectores, no hablarán en inglés, lo harán en lenguajes
intermedios de computación a base de patrones lingüísticos bien estructurados e
incorporados en una “arquitectura de pensamiento” totalmente nueva. Ha
llegado la era de la “lingüística computacional” y debemos prepararnos
para que en los centros educativos se enseñe una nueva asignatura que se
llamará, por ejemplo, “LECOM”, (lenguaje de computadores).
No le den a la cabeza, de
un lado a otro, los menos aficionados a la tecnología. No, de ninguna manera, más
bien entiendan que en el futuro se considerará “analfabeto computacional”
a aquel que no sepa conversar con los sistemas de IA. No será necesario
comprarse un pequeño diccionario para viajar. Entre un español y un chino habrá
una IA que se encargará de que se entiendan perfectamente.
La Lingüística
Computacional, también conocida como Procesamiento del Lenguaje Natural
(NLP, por sus siglas en inglés), es una disciplina de la inteligencia
artificial que se centra en la interacción entre las computadoras y el lenguaje
humano. Su objetivo principal es permitir que las computadoras comprendan,
interpreten y generen texto y habla de manera similar a como lo hacen los
humanos.
Vamos a comentar algunas
aplicaciones prácticas de la Lingüística Computacional con el fin de clarificar
el concepto.
En primer lugar, nos
preguntaremos ¿qué entendemos por procesamiento de lenguaje natural (NLP)? Es
una parte importante de la lingüística computacional que se enfoca en el
procesamiento de texto y habla en lenguaje humano. Esto incluye tareas como la
traducción automática, el análisis de sentimientos, la generación de lenguaje
natural, la búsqueda de información y la extracción de información, entre
otras. El NLP utiliza una gran variedad de técnicas y herramientas, incluyendo
la tokenización (dividir el texto en palabras o unidades más pequeñas),
el análisis gramatical (identificar la estructura sintáctica de una
oración), la desambiguación semántica (resolver el significado de
palabras con varios sentidos) y el aprendizaje automático para entrenar
modelos que pueden comprender y generar texto de manera más precisa.
Las Aplicaciones de la
Lingüística Computacional más conocidas son las siguientes:
Motores de búsqueda en
línea. Los motores de búsqueda utilizan algoritmos de procesamiento de lenguaje
natural para mejorar los resultados de búsqueda y comprender las consultas de
los usuarios.
Chatbots y asistentes virtuales