Durante el día de ayer en AWS re:Invent, Amazon.com Inc (NASDAQ: AMZN) presentó Amazon Nova, una nueva generación de modelos fundacionales (MF) que poseen inteligencia de vanguardia para una amplia gama de tareas y un rendimiento líder en la industria en relación precio-rendimiento.

Desde la oferta de los chips personalizados de AWS Inferentia y AWS Trainium, hasta los mejores modelos fundacionales en Amazon Bedrock, así como experiencias impulsadas por IA como Rufus y Alexa, desde AWS estamos comprometidos con ofrecer soluciones de IA generativa (Gen AI) que aporten valor real a nuestros clientes. Nuestro objetivo es usar la IA para simplificar la vida de clientes, vendedores, anunciantes, empresas y todos los demás.

Como siguiente paso en nuestro viaje de IA, hemos construido Amazon Nova, una nueva generación de modelos base (FM). Con la capacidad de procesar texto, imagen y vídeo, los clientes pueden usar aplicaciones de IA generativa impulsadas por Amazon Nova para comprender vídeos, gráficos y documentos, o generar vídeos y otro contenido multimedia.

"Dentro de Amazon, tenemos alrededor de 1.000 aplicaciones de IA generativa en marcha, y hemos tenido una visión panorámica de los desafíos con los que aún lidian los desarrolladores de aplicaciones", dijo Rohit Prasad, vicepresidente Senior de Inteligencia Artificial General de Amazon. "Nuestros nuevos modelos Amazon Nova están destinados a ayudar con estos desafíos tanto a desarrolladores internos como externos, y proporcionar inteligencia y generación de contenido convincentes, al tiempo que ofrecen un progreso significativo en latencia, rentabilidad, personalización, Generación Aumentada por Recuperación (RAG) y capacidades agénticas".

Los nuevos modelos Amazon Nova disponibles en Amazon Bedrock incluyen:

  • Amazon Nova Micro, un modelo solo de texto que ofrece respuestas con la menor latencia a un coste muy bajo.
  • Amazon Nova Lite, un modelo multimodal de muy bajo coste que es ultrarrápido para procesar entradas de imagen, vídeo y texto.
  • Amazon Nova Pro, un modelo multimodal altamente capaz con la mejor combinación de precisión, velocidad y coste para una amplia gama de tareas.
  • Amazon Nova Premier, el más capaz de los modelos multimodales de Amazon para tareas de razonamiento complejo y para usar como el mejor maestro para destilar modelos personalizados (disponible en el primer trimestre de 2025).
  • Amazon Nova Canvas, un modelo de generación de imágenes de última generación.
  • Amazon Nova Reel, un modelo de generación de vídeo de última generación.
Una foto fija de una costa que se transforma en un gráfico en movimiento, utilizando la instrucción «dolly forward».
Una foto fija de una costa que se transforma en un gráfico en movimiento, utilizando la instrucción «dolly forward».

Los modelos de comprensión de Amazon Nova demuestran inteligencia, capacidades y velocidad excepcionales

Hemos sometido los modelos Amazon Nova a pruebas comparativas con una amplia gama de estándares de referencia de la industria. Amazon Nova Micro, Amazon Nova Lite y Amazon Nova Pro se desempeñan de manera muy competitiva en comparación con los mejores modelos en sus respectivas categorías.

Se vio que Amazon Nova Micro es igual o mejor que Meta LLaMa 3.1 8B en las 11 pruebas comparativas relevantes, y Google Gemini 1.5 Flash-8B en los 12 puntos de referencia aplicables. Con la velocidad líder en la industria de Amazon Nova Micro de 210 tokens de salida por segundo, es ideal para aplicaciones que requieren respuestas rápidas.

Amazon Nova Lite también es altamente competitivo con otros modelos de su misma categoría de inteligencia; su rendimiento fue igual o superior en 17 de 19 pruebas comparativas frente al GPT-4o mini de OpenAI, igual o mejor en 17 de 21 pruebas frente al Gemini 1.5 Flash-8B de Google, e igual o superior en 10 de 12 pruebas en comparación con el Claude Haiku 3.5 de Anthropic. Además de ofrecer precisión en las evaluaciones de texto, Amazon Nova Lite destaca en la comprensión de videos, gráficos y documentos, según lo medido por estándares de referencia como VATEX, ChartQA y DocVQA. Amazon Nova Lite también sobresale en flujos de trabajo agénticos, como la llamada a funciones evaluada por el Ranking de Llamadas a Funciones de Berkeley, y en las capacidades fundamentales de comprensión de elementos visuales para realizar acciones en navegadores y pantallas de ordenador, según lo medido por VisualWebBench (estándar de referencia para acciones en navegadores web) y Mind2Web (estándar de referencia para agentes multimodales generalistas).

Amazon Nova Pro mostró un rendimiento igual o superior en 17 de 20 pruebas comparativas frente al GPT-4o de OpenAI, igual o mejor en 16 de 21 evaluaciones en comparación con el Gemini 1.5 Pro de Google, e igual o superior en 9 de 20 pruebas frente al Claude Sonnet 3.5v2 de Anthropic. Además de su precisión en las evaluaciones de inteligencia textual y visual, Amazon Nova Pro destaca en el seguimiento de instrucciones y en flujos de trabajo agénticos multimodales, según lo medido por el Estándar de Referencia Integral RAG (CRAG, por sus siglas en inglés), el Ranking de Llamadas a Funciones de Berkeley y Mind2Web

Amazon Nova Pro example

Este contenido está alojado por un tercero (www.youtube.com).

Para acceder al contenido, debes dar tu consentimiento a las cookies seleccionando Aceptar todas en la ventana emergente. O puedes ir a la parte inferior de la página y seleccionar Preferencias de cookies, y luego activar Cookies Funcionales, Cookies de rendimiento y Cookies publicitarias.

Soporte multilingüe y multimodal con contexto largo

Amazon Nova Micro, Lite y Pro admiten más de 200 idiomas. Amazon Nova Micro admite una longitud de contexto de 128K tokens de entrada, mientras que Amazon Nova Lite y Amazon Nova Pro admiten una longitud de contexto de 300K tokens, o 30 minutos de procesamiento de vídeo. A principios de 2025, Amazon admitirá una longitud de contexto de más de 2M de tokens de entrada.

Rápido y rentable

Todos los modelos Amazon Nova son rápidos, rentables y han sido diseñados para ser fáciles de usar con los sistemas y datos de los clientes. Amazon Nova Micro, Amazon Nova Lite y Amazon Nova Pro son al menos un 75 por ciento menos costosos que los modelos de mejor rendimiento en sus respectivas clases de inteligencia en Amazon Bedrock. También son los modelos más rápidos en sus respectivas clases de inteligencia en Amazon Bedrock.

Integración perfecta con Amazon Bedrock

Todos los modelos Amazon Nova están integrados con Amazon Bedrock, un servicio completamente gestionado que hace que los MF de alto rendimiento de las principales empresas de IA y Amazon estén disponibles para su uso a través de una única API. Usando Amazon Bedrock, los clientes pueden experimentar y evaluar fácilmente los modelos Amazon Nova, así como otros MF, para determinar el mejor modelo para una aplicación.

Capacidad de ajuste para aumentar la precisión

Los modelos también admiten ajuste personalizado, lo que permite a los clientes dirigir los modelos a ejemplos en sus propios datos propietarios que han sido etiquetados para aumentar la precisión. El modelo Amazon Nova aprende lo que más importa al cliente a partir de sus propios datos (incluyendo texto, imágenes y vídeos), y luego Amazon Bedrock entrena un modelo ajustado privado que proporcionará respuestas personalizadas.

Destilación para entrenar modelos más pequeños y eficientes

Además de admitir el ajuste fino, los modelos también admiten la destilación, que permite la transferencia de conocimientos específicos de un modelo "maestro" más grande y altamente capaz a un modelo más pequeño y eficiente que es altamente preciso, pero también más rápido y económico de ejecutar.

RAG para fundamentar respuestas en datos

Los modelos Amazon Nova están integrados con Amazon Bedrock Knowledge Bases y sobresalen en la Generación Aumentada por Recuperación (RAG), que permite a los clientes garantizar la mejor precisión, fundamentando las respuestas en los propios datos de una organización.

Optimizado para aplicaciones agénticas

Los modelos Amazon Nova han sido optimizados para hacerlos fáciles de usar y efectivos en aplicaciones agénticas que requieren interactuar con los sistemas y datos propietarios de una organización a través de múltiples APIs para ejecutar tareas de varios pasos.

Acceso a contenido visual de grado de producción con modelos de generación de contenido creativo Nova

Amazon Nova Canvas es un modelo de generación de imágenes de vanguardia que crea imágenes de grado profesional a partir de texto o imágenes proporcionadas en los prompts. Amazon Nova Canvas también proporciona características que facilitan la edición de imágenes usando entradas de texto y ofrece controles para ajustar el esquema de color y el diseño. El modelo viene con controles integrados para respaldar el uso seguro y responsable de la IA. Estos incluyen características como marcas de agua, que permiten rastrear siempre la fuente de una imagen, y moderación de contenido, que limita la generación de contenido potencialmente dañino. Amazon Nova Canvas se desempeña mejor que generadores de imágenes como OpenAI DALL-E 3 y Stable Diffusion en evaluaciones humanas realizadas por un tercero, y en métricas automatizadas clave.

Amazon Nova Reel es un modelo de generación de vídeo de vanguardia que permite a los clientes crear fácilmente vídeo de alta calidad a partir de texto e imágenes. Es ideal para la creación de contenido en publicidad, marketing o capacitación. Los clientes pueden usar prompts en lenguaje natural para controlar el estilo visual y el ritmo, incluyendo el movimiento de la cámara, la rotación y el zoom. Supera a modelos comparables en calidad y consistencia, según evaluaciones humanas realizadas por un tercero que prefirió los vídeos generados por Amazon Nova Reel sobre los generados por Gen-3 Alpha de Runway. Al igual que Amazon Nova Canvas, Amazon Nova Reel viene con controles integrados para respaldar el uso seguro y responsable de la IA, incluyendo marcas de agua y moderación de contenido. Amazon Nova Reel actualmente genera vídeos de seis segundos y admitirá la generación de vídeos de hasta dos minutos de duración en los próximos meses.

Pasta City, created with Amazon Nova Reel by Amazon Ads

Este contenido está alojado por un tercero (www.youtube.com).

Para acceder al contenido, debes dar tu consentimiento a las cookies seleccionando Aceptar todas en la ventana emergente. O puedes ir a la parte inferior de la página y seleccionar Preferencias de cookies, y luego activar Cookies Funcionales, Cookies de rendimiento y Cookies publicitarias.

Lo que viene: modelos de voz a voz y multimodal a multimodal

Amazon introducirá un modelo Amazon Nova de voz a voz en el primer trimestre de 2025. El modelo está diseñado para transformar las aplicaciones de IA conversacional al comprender la entrada de voz en streaming en lenguaje natural, interpretar señales verbales y no verbales (como tono y cadencia), y ofrecer interacciones naturales similares a las humanas de ida y vuelta con baja latencia.

Amazon también está desarrollando un modelo novedoso que puede coger texto, imágenes, audio y vídeo como entrada, y generar salidas en cualquiera de estas modalidades. Este modelo Amazon Nova con capacidades nativas de multimodal a multimodal – o capacidades de modalidad "cualquiera a cualquiera" – se introducirá a mediados de 2025. Simplificará el desarrollo de aplicaciones donde el mismo modelo se puede usar para realizar una amplia variedad de tareas, como traducir contenido de una modalidad a otra, editar contenido y potenciar agentes de IA que pueden entender y generar todas las modalidades.

Los socios y clientes de AWS ya están aprovechando las capacidades y el rendimiento en relación precio-rendimiento de los modelos Amazon Nova

SAP, socio estratégico de AWS, está integrando los modelos Amazon Nova en la familia de modelos de lenguaje de gran escala (LLM) compatibles con su centro de IA generativa SAP AI Core. Esto permite a los desarrolladores crear nuevas habilidades para Joule, el copiloto de IA de SAP, y construir de forma segura soluciones impulsadas por IA que aprovechan todo el contexto empresarial capturado en los datos de SAP, permitiendo la automatización, personalización y soluciones avanzadas como la planificación de la cadena de suministro.

Deloitte, socio estratégico de AWS, está comprometido con la entrega de servicios de IA generativa de primer nivel a empresas globales en todos los sectores. Deloitte sabe que las soluciones de IA y los modelos fundacionales no son universales y cree que las capacidades avanzadas de personalización y la seguridad mejorada de los modelos Amazon Nova impulsarán la innovación que aporta un valor excepcional a sus clientes en todo el mundo.

Dentsu Digital Inc., una empresa de marketing digital, está integrando Amazon Nova Reel en su proceso creativo, permitiendo a su equipo mejorar y acelerar el desarrollo de sus campañas, desde el briefing hasta el desarrollo de conceptos y la generación de contenido de vídeo creativo. Amazon Nova Reel reduce el tiempo total necesario para generar nuevos activos de semanas a días.

Musixmatch es la plataforma de letras de canciones más grande del mundo con más de 80 millones de usuarios y una base de datos de más de 11 millones de letras únicas. Musixmatch está incluyendo Amazon Nova Reel en Musixmatch Pro, que ayuda a los creadores a distribuir letras en todos los principales servicios de streaming digital y redes sociales. Los artistas emergentes pueden usar Amazon Nova Reel para producir vídeos musicales de alta calidad utilizando el contexto de sus canciones como entrada y personalizarlos con instrucciones en lenguaje natural.

123RF, un portal de fotografía y vídeo de stock con una biblioteca de más de 200 millones de imágenes y vídeos, está utilizando Amazon Nova Canvas y Amazon Nova Reel para simplificar el proceso de diseño con herramientas más inteligentes, rápidas y fáciles de usar para creadores de medios visuales. La relación precio-rendimiento líder de Amazon Nova, su velocidad, razonamiento multilingüe y moderación de contenido a escala ayudan a ofrecer estas nuevas capacidades a clientes y creadores en todo el mundo.

Caylent, una empresa de servicios en la nube de próxima generación, está utilizando los modelos Amazon Nova para ofrecer capacidades de comprensión de vídeo a clientes de los sectores de medios, deportes y retail. Anteriormente, Caylent tenía que combinar diferentes técnicas y modelos para proporcionar comprensión de vídeo a clientes de estas industrias. Ahora, Amazon Nova ofrece resultados líderes en la industria a una fracción del coste, reduciendo el tiempo necesario para pasar del prototipo a la producción y eliminando complejidades como el mosaico de imágenes, el muestreo y el hashing semántico.

Palantir Technologies desarrolla software que permite la toma de decisiones impulsada por IA en muchos de los contextos más críticos del mundo. Las capacidades avanzadas de razonamiento de Amazon Nova Pro se integrarán con el Sistema de Ontología dentro de la Plataforma de IA de Palantir (AIP) para impulsar nuevas eficiencias operativas y flujos de trabajo de toma de decisiones en más de 40 industrias. Por ejemplo, esta integración empoderará a los agentes de seguros que procesan solicitudes de pólizas complejas y a los agentes de la cadena de suministro que orquestan procesos de reasignación de extremo a extremo.

Shutterstock es una plataforma creativa líder que ofrece soluciones integrales, contenido de alta calidad y herramientas para marcas transformadoras, medios digitales y empresas de marketing. Basándose en la alta calidad de las imágenes generadas por Amazon Nova Canvas, el equipo de Shutterstock está emocionado de incluir el modelo en el Generador de Imágenes de IA de Shutterstock, ofreciendo a los usuarios una herramienta intuitiva y fácil de usar.

Amazon está comprometido con el desarrollo responsable de la inteligencia artificial

Los modelos Amazon Nova se han construido con medidas y protecciones de seguridad integradas. La empresa ha lanzado las Tarjetas de Servicio de IA de AWS para Amazon Nova, ofreciendo información transparente sobre casos de uso, limitaciones y prácticas de IA responsable. Para más información, explore las Tarjetas de Servicio aquí: Amazon Nova Canvas, Amazon Nova Reel, and Amazon Nova Micro, Amazon Nova Lite, Amazon Nova Pro.

Para comenzar a usar los modelos Amazon Nova, visite: https://aws.amazon.com/nova/