Los investigadores de Meta han desarrollado Husky, un agente lingüístico de código abierto diseñado para realizar una variedad de tareas de razonamiento complejas utilizando diversas herramientas. A diferencia de los agentes lingüísticos convencionales que suelen enfocarse en tareas específicas dentro de dominios limitados o en el uso de modelos de lenguaje grande propietarios, Husky adopta un enfoque más integrador.

El proyecto, desarrollado en colaboración con la Universidad de Washington y el Instituto Allen para la Inteligencia Artificial, se diferencia por su capacidad para «razonar sobre un espacio de acción unificado», permitiéndole abordar tareas que involucran razonamiento numérico, tabular y basado en conocimiento. Este enfoque innovador se detalla en el texto de la investigación publicado en Arxiv.org.

Para ello, utiliza un procedimiento en dos partes: la generación de la acción, que predice la acción, esto es, «el paso del nivel más alto a dar y la herramienta que lo ejecuta»; y la ejecución de la acción, por la que el modelo y la herramienta realizan la acción y «actualizan el estado de la solución» con una «ontología predefinida de acciones» hasta que adopta el estado final.

De una forma más clara, Husky descompone cada tarea en una serie de acciones, y en cada una de ellas utiliza una herramienta para su realización hasta que completa la tarea, o llega al estado final.

Los investigadores han destacado que utiliza modelos de lenguaje grande (LLM, por sus siglas en inglés) de 7.000 millones de parámetros, pero que su rendimiento «iguala o supera» al de otros modelos de lenguaje frontera como GPT-4 en las tareas que se han analizado.

«Nuestro trabajo presenta una receta sólida para la creación de agentes lingüísticos de código abierto que generalizan diferentes tipos de tareas de razonamiento de varios pasos», concluyen los investigadores.

Related Posts