Abstract
En este trabajo de investigación se describe el diseño de una aplicación capaz de
mantener una conversación coherente con seres humanos utilizando el lenguaje
castellano. La aplicación es el resultado de una investigación en el área de
Procesamiento del Lenguaje Natural, gramática castellana e inteligencia humana,
con lo cual se ha logrado diseñar un esquema, a nivel de base de datos, de la
forma como se organizan las ideas en el cerebro y de la estructura sintáctica de
oraciones simples dentro de una gramática castellana abreviada.
Por medio del análisis del lenguaje castellano en cuanto a morfología, sintaxis y
semántica, se obtuvo un conjunto de reglas básicas para conformar oraciones
simples y oraciones interrogativas, teniendo en cuenta los diferentes tipos de
palabras y un conjunto de sus propiedades. Tanto los tipos de palabras y sus
respectivas propiedades fueron registradas en la base de datos, al igual que las
reglas gramaticales que utiliza el sistema para reconocer el texto que recibe. El
sistema luego de recibir una oración, busca en la base de datos el tipo y las
propiedades de todas las palabras que conforman la oración, para realizar con
esto, el proceso de revisión de las reglas gramaticales, el cual se efectúa
descomponiendo la oración en pares de palabras y verificando que existe una
regla en la cual encajen; si existe dicha regla, se toma el producto (sintagma) de
ella y este se analiza con los sintagmas producidos por los demás pares de
palabras, con lo cual se obtiene un árbol binario cuya raíz es el producto final de la
unión de todos los sintagmas y que además indica si la frase es una oración
simple o una pregunta, mientras que los nodos hojas del árbol, son cada una de
las palabras escritas. Si la frase es una oración, se procede a tomar cada uno de
los sintagmas para almacenarlos como complementos de las ideas que almacena
el sistema, teniendo como núcleo de la idea el verbo principal o núcleo del
predicado de la oración. Si la frase es una pregunta se busca dentro de las ideas
del sistema si existe una respuesta para el tipo de pregunta, teniendo en cuenta
los sintagmas encontrados en dicha frase interrogativa. Las ideas son
almacenadas de tal forma que los sintagmas que hacen parte de ellas no
contengan exclusivamente las palabras recibidas sino el contexto en el que ellas
se encuentran, obteniendo así un sistema más inteligente que los ya conocidos.
Los contextos donde se encuentran las palabras son principalmente conjuntos de
sinónimos, y son revisados constantemente por el sistema con el fin de maximizar
su capacidad expresiva, ya que es normal para una persona decir la misma
información utilizando diferentes palabras una y otra vez.