Elena Digital López

Construyendo Interfaces Conversacionales para Datos Estructurados con Amazon Bedrock Knowledge Bases

Las organizaciones gestionan grandes volúmenes de datos estructurados en bases de datos y almacenes de datos. Aunque los modelos de lenguaje de gran escala (LLMs) han revolucionado el procesamiento del lenguaje natural (NLP), traducir consultas conversacionales en análisis de datos estructurados sigue siendo una tarea compleja. Los analistas de datos deben transformar preguntas comerciales en consultas SQL, lo que crea cuellos de botella en el flujo de trabajo.

Amazon Bedrock Knowledge Bases permite interacciones directas en lenguaje natural con fuentes de datos estructuradas. Este sistema interpreta esquemas de bases de datos y el contexto, convirtiendo preguntas en lenguaje natural en consultas precisas mientras se mantienen los estándares de fiabilidad de los datos. Los usuarios pueden interactuar con sus datos estructurados configurando la ingesta de datos estructurados desde tablas de AWS Glue y clústeres de Amazon Redshift en pocos pasos, aprovechando el poder de recuperación de datos estructurados de Amazon Bedrock Knowledge Bases.

El nuevo enfoque expone cómo construir una aplicación conversacional utilizando la recuperación de datos estructurados de Amazon Bedrock. Los desarrolladores suelen enfrentarse a desafíos al integrar datos estructurados en aplicaciones de inteligencia artificial generativa. Esto incluye la dificultad de entrenar LLMs para traducir consultas de lenguaje natural a SQL, basándose en esquemas complejos, así como asegurarse de que se implementen controles de gobernanza y seguridad apropiados. Amazon Bedrock Knowledge Bases alivia estas complejidades al ofrecer un módulo de traducción de lenguaje natural a SQL (NL2SQL) gestionado.

Esta solución consiste en Amazon Bedrock Knowledge Bases, Amazon Redshift, AWS Glue y Amazon Simple Storage Service (S3). La arquitectura incluye un pipeline de ingesta de datos y una aplicación de recuperación de datos estructurados. Este tipo de recuperación admite Amazon Redshift como motor de consulta y ofrece múltiples opciones de ingesta. El proceso de ingesta es una configuración única y es compatible con diferentes patrones de acceso a datos.

Una vez configurada la ingesta, los usuarios pueden formular preguntas en lenguaje natural, y Amazon Bedrock Knowledge Bases generará la consulta SQL correspondiente, ejecutándola en el motor de consulta y procesándola a través del LLM para ofrecer una respuesta amigable.

Además, Amazon Bedrock Knowledge Bases soporta tres API diferentes para satisfacer las necesidades de recuperación de datos: generación de respuestas y recuperación, recuperación solamente y generación de consultas SQL, brindando flexibilidad a los usuarios.

Los requisitos previos para implementar esta solución incluyen la creación de una cuenta de AWS y acceso a los modelos de base necesarios en Amazon Bedrock. La configuración de la ingesta de datos implica cargar un conjunto de datos en un bucket de S3 y configurar las tablas de AWS Glue junto con un grupo de trabajo de Amazon Redshift como motor de consulta.

Con todo, Amazon Bedrock Knowledge Bases simplifica el análisis de datos al convertir preguntas en lenguaje natural en consultas SQL, permitiendo a analistas y equipos operar de manera más accesible y segura en entornos basados en datos, lo que acelera los procesos de toma de decisiones.
vía: AWS machine learning blog

Scroll al inicio