Las empresas de diversos sectores, incluidos salud, finanzas, manufactura y servicios legales, están enfrentando crecientes desafíos en el procesamiento de grandes volúmenes de datos multimodales que combinan texto, imágenes, gráficos y formatos técnicos complejos. A medida que las organizaciones generan contenido multimodal a un ritmo sin precedentes, los métodos de procesamiento de documentos tradicionales están fracasando en lidiar con las complejidades de dominios especializados donde la terminología técnica, las relaciones de datos interconectados y los formatos específicos de la industria crean cuellos de botella operativos. Estos enfoques convencionales, que no utilizan inteligencia artificial, tienen dificultades con las características únicas de los documentos empresariales, resultando en una extracción de datos ineficiente, la pérdida de información valiosa y un procesamiento manual que consume tiempo, obstaculizando así la productividad y la toma de decisiones.
Un ejemplo claro se encuentra en la industria del petróleo y gas, que genera una gran cantidad de datos técnicos complejos a través de operaciones de perforación. Documentos como informes detallados de culminación de pozos, registros de perforación y diagramas de litología contienen información crucial que guía las decisiones operativas y la planificación estratégica. Para abordar estos desafíos, se ha desarrollado una solución avanzada de RAG utilizando Amazon Bedrock y aprovechando las capacidades de inteligencia artificial de Infosys Topaz™, diseñada específicamente para el sector del petróleo y gas. Esta solución es capaz de manejar fuentes de datos multimodales, procesando de manera fluida texto, diagramas y datos numéricos, mientras mantiene el contexto y las relaciones entre los diferentes elementos de datos. La estrategia especializada permite a las organizaciones desbloquear información valiosa a partir de su documentación técnica y optimizar sus flujos de trabajo, facilitando decisiones más informadas basadas en un análisis integral de datos.
La solución se construyó utilizando servicios de AWS, incluidos Amazon Bedrock Nova Pro, Amazon Bedrock Knowledge Bases y Amazon OpenSearch Serverless como base de datos vectorial, permitiendo escalabilidad y costo-efectividad. Se ha implementado un sistema de indexación en tiempo real que permite incorporar nuevos documentos tan pronto como están disponibles, asegurando que la información esté siempre actualizada. Todos estos componentes garantizan que el sistema pueda manejar un gran volumen de solicitudes sin comprometer el rendimiento.
La exploración RAG y los enfoques iniciales llevaron a la creación de emparejamientos de vectores multicanal, permitiendo un entendimiento detallado del contenido visual y textual a partir de informes técnicos de perforación. Por ejemplo, se empleó una estrategia de chunking jerárquica que preserva la estructura del documento y las relaciones contextuales, facilitando el almacenamiento y la recuperación de información técnica específica sin perder el contexto crítico.
El enfoque final combinó capacidades de búsqueda híbrida y chunking optimizado, lo que resultó en un sistema que entiende tanto el contexto como las referencias específicas. Este enfoque integrado no solo mejoró la precisión en la búsqueda de documentos, sino que también optimizó el tiempo de respuesta a menos de dos segundos, alcanzando un 92% de precisión en la recuperación de información, con una alta satisfacción entre los ingenieros de campo y geólogos.
La implementación de esta solución de RAG avanzada ha generado un valor significativo para las operaciones en la industria del petróleo y gas, maximizando la eficiencia operativa, reduciendo costos de procesamiento manual entre un 40 y un 50%, y disminuyendo en un 60% el tiempo que los ingenieros de campo y geólogos dedican a buscar información técnica. Este caso demuestra con claridad el potencial de las tecnologías avanzadas y el aprendizaje automático para transformar la gestión del conocimiento en sectores con complejidades técnicas. A medida que se continúe innovando, se vislumbran grandes oportunidades para integrar datos de sensores en tiempo real, capacidades de visualización mejoradas y análisis predictivo.
vía: AWS machine learning blog