Optimización Rápida del Ajuste de LLM con Datos No Estructurados Usando SageMaker Unified Studio y S3

X (Twitter) Facebook Pinterest Email WhatsApp

AWS ha introducido una nueva integración entre Amazon SageMaker Unified Studio y los buckets de propósito general de Amazon S3, facilitando a los equipos el uso de datos no estructurados almacenados en Amazon S3 para tareas de aprendizaje automático y análisis de datos. Este avance promete transformar la forma en que las organizaciones manejan y analizan grandes volúmenes de información compleja.

En un ejercicio reciente, se demostró cómo integrar estos buckets con el catálogo de Amazon SageMaker para ajustar el modelo Llama 3.2 11B Vision Instruct, enfocándose en responder preguntas visuales. Al proporcionar imágenes y preguntas al modelo, se pudo realizar una consulta, como identificar la fecha de una transacción en un recibo detallado.

El modelo base Llama 3.2 logró un promedio de Similaridad de Levenshtein Normalizada (ANLS) del 85,3% en el conjunto de datos DocVQA, que contiene miles de ejemplos de preguntas visuales. Sin embargo, dado que esta puntuación puede no ser suficiente para tareas que requieren mayor precisión, se estableció un protocolo de ajuste fino utilizando distintos tamaños de conjuntos de datos (1,000, 5,000 y 10,000 imágenes) para evaluar el impacto del tamaño del conjunto de datos en el rendimiento del modelo.

El proceso incluye varios pasos, desde la ingesta de datos y la creación del modelo hasta la evaluación de métricas, todo gestionado a través de Amazon SageMaker Unified Studio. Para llevar a cabo esta actividad, la organización debe cumplir con ciertos requisitos previos, como crear un dominio en SageMaker Unified Studio y establecer conexiones adecuadas con los buckets de S3.

Además, se destaca la importancia de una arquitectura bien diseñada que permita a los equipos de datos colaborar de manera efectiva utilizando roles de acceso que simplifiquen la gestión de permisos, evitando complicaciones innecesarias. Con la utilización de MLflow, se lleva a cabo un seguimiento detallado de los experimentos, lo que permite observar mejoras en la precisión del modelo ajustado.

Los resultados preliminares de este enfoque mostraron que el mejor modelo ajustado alcanzó un ANLS de 90,2%, mostrando una mejora del 4,9% en comparación con el modelo base. Esta mejora no solo valida la metodología utilizada, sino que también resalta el potencial de Amazon SageMaker Unified Studio en la optimización de modelos de aprendizaje automático, facilitando un camino más claro desde los datos no estructurados hasta la implementación de modelos en producción.
vía: AWS machine learning blog