Elena Digital López

Revolucionando el Análisis de Datos sobre Medicamentos con las Capacidades Multimodales RAG de Amazon Bedrock

En la industria farmacéutica, las empresas de biotecnología y salud enfrentan un reto sin precedentes en la gestión y análisis eficiente de grandes volúmenes de datos relacionados con medicamentos provenientes de diversas fuentes. Los métodos tradicionales de análisis de datos resultan inadecuados para procesar la compleja documentación médica que incluye texto, imágenes, gráficos y tablas. En este contexto, Amazon Bedrock se presenta como una solución innovadora, ofreciendo características como la recuperación multimodal, capacidades avanzadas de fragmentación y citaciones para ayudar a las organizaciones a obtener respuestas de alta precisión.

Las organizaciones farmacéuticas y de salud procesan numerosos formatos de documentos complejos y datos no estructurados, lo que representa un desafío analítico significativo. Los documentos de estudios clínicos y sus respectivos trabajos de investigación suelen estar compuestos por un intrincado conjunto de texto técnico, tablas detalladas y gráficos estadísticos elaborados, lo que complica la extracción automatizada de datos. Este tipo de documentos presenta desafíos adicionales debido a la falta de estandarización en el formato y la variabilidad en los estilos de presentación de datos a través de múltiples instituciones de investigación. La solución propuesta permite la extracción de información basada en datos a partir de documentos de investigación complejos, mejorando la eficacia del proceso de investigación farmacéutica.

La aplicación de muestra utiliza Amazon Bedrock para crear un asistente inteligente de inteligencia artificial capaz de analizar y resumir documentos de investigación que contienen texto, gráficos y datos no estructurados. Amazon Bedrock es un servicio completamente gestionado que ofrece la opción de modelos de fundación líderes en la industria, simplificando el desarrollo y garantizando la seguridad, privacidad y una inteligencia artificial responsable.

Para equipar a los modelos de fundación con información actualizada y propietaria, las organizaciones recurren a la Generación Aumentada por Recuperación (RAG), una técnica que extrae datos de las fuentes de información de la empresa y enriquece las consultas para proporcionar respuestas relevantes y precisas. Amazon Bedrock Knowledge Bases, una capacidad de RAG totalmente gestionada dentro de Amazon Bedrock, facilita la implementación del flujo de trabajo completo de RAG, desde la ingestión hasta la recuperación, sin necesidad de construir integraciones personalizadas con las fuentes de datos.

La arquitectura de la solución implementa estas capacidades mediante un flujo de trabajo fluido que comienza con la carga segura de documentos en un bucket de Amazon S3. Estos documentos son luego ingesados en Amazon Bedrock Knowledge Bases, donde un modelo de lenguaje grande procesa y analiza la información. El uso de fragmentación semántica optimiza la recuperación de datos en Amazon OpenSearch Service. La solución cuenta con una interfaz intuitiva, construida con Streamlit, que proporciona una experiencia conversacional para los usuarios finales. Al interactuar con la aplicación, se activan funciones de AWS Lambda que manejan las solicitudes, recuperando el contexto relevante de la base de conocimiento y generando respuestas apropiadas.

Este enfoque permite a las organizaciones acelerar el proceso de investigación al proporcionar análisis precisos de datos de ensayos clínicos, resultados de pacientes, diagramas moleculares y reportes de seguridad. Además, se proporciona crédito a los documentos de origen, lo que minimiza las alucinaciones y mejora la precisión de las respuestas. La aplicación es capaz de interpretar diagramas científicos complejos, extraer datos de tablas y gráficos y generar respuestas que mantengan la precisión científica, lo cual es crucial en un entorno donde la veracidad de la información es esencial.

Mientras los sectores continúan lidiando con volúmenes crecientes de documentos complejos, esta solución ofrece un marco robusto para extraer el máximo valor de sus repositorios documentales, permitiendo así que las organizaciones transformen sus procesos de análisis de investigación. Esta tecnología, aunque centrada en el ámbito de la salud, tiene un potencial transformador que se extiende a diversos sectores, desde el retail hasta los servicios financieros.
vía: AWS machine learning blog

Scroll al inicio