En 2024, se lanzó el Programa de Modelos Personalizados dentro del Centro de Innovación de IA Generativa de AWS, con el objetivo de ofrecer apoyo integral en cada etapa de la personalización y optimización de modelos. Durante los últimos dos años, este programa ha demostrado resultados excepcionales al colaborar con empresas de renombre mundial y startups en diversas industrias, como servicios legales, finanzas, salud y ciencias de la vida, desarrollo de software, telecomunicaciones y manufactura. Estas alianzas han dado lugar a soluciones de inteligencia artificial a medida que capturan la experiencia única de datos, voz de marca y requisitos comerciales especializados de cada organización, superando así a las alternativas genéricas en términos de eficiencia y ahorro en costos operativos.
Con el avance de las organizaciones más allá de proyectos de prueba y chatbots básicos, se ha observado un aumento en la adopción de estrategias avanzadas de personalización y optimización, que van más allá de la ingeniería de prompts y la generación aumentada por recuperación. La estrategia incluye la creación de modelos especializados para tareas específicas y la alineación con la marca, además de la destilación de modelos grandes en versiones más pequeñas y rápidas, así como la modificación a medio entrenamiento para una adaptación más profunda.
Una de las destacadas historias de éxito proviene de Cosine AI, que desarrolló una plataforma de IA y un agente de ingeniería de software que se integra de manera fluida en los flujos de trabajo de sus usuarios. Al asociarse con el Centro de Innovación para ajustar el modelo Nova Pro de Amazon, Cosine AI utilizó Amazon SageMaker AI para su asistente de ingeniería de IA, Genie, lo que resultó en un aumento significativo en la capacidad de pruebas A/B, rapidez de iteraciones de desarrolladores y velocidad general de proyectos.
El Centro de Innovación sugiere varios consejos para maximizar el valor de los modelos de IA generativa. Primero, es fundamental no comenzar desde un enfoque técnico, sino trabajar hacia atrás desde los objetivos comerciales. Este enfoque ha demostrado ser crítico para lograr tasas de éxito en producción de hasta un 65%. Segundo, se recomienda elegir el enfoque de personalización adecuado y comenzar con estrategias más simples antes de avanzar a personalizaciones más complejas.
La medición del éxito es también primordial. Las métricas deben alinearse con lo que realmente importa para el negocio, priorizando resultados específicos y evitando que los proyectos se conviertan en experimentos sin impacto real. Aparte de ello, la optimización a nivel de hardware también puede generar eficiencias en los procesos de entrenamiento e inferencia, siendo un factor crucial en la fase productiva del modelo.
Por último, el principio de que «no hay una talla única» se aplica tanto al tamaño como a la familia de modelos. En un panorama tecnológico en constante evolución, la solución ideal para una tarea hoy podría no ser la misma mañana. La arquitectura modular y adaptable permite a las empresas aprovechar rápidamente las mejoras en los modelos.
El Programa de Modelos Personalizados continúa proporcionando apoyo experto desde la selección del modelo hasta su personalización, facilitando mejoras en el rendimiento y acelerando la realización de valor para las organizaciones involucradas.
vía: AWS machine learning blog

