Amazon bouleverse et re pousse encore un peu plus les limites de l’IA générative. En effet, lors de sa conférence annuelle re:Invent 2024, le géant du cloud a dévoilé Nova, une nouvelle suite de modèles d’IA de pointe pour la création de texte, d’image et de vidéo. Une annonce surprise qui positionne Amazon comme un acteur majeur dans la course à l’intelligence artificielle, aux côtés de géants comme OpenAI et Google.

Mais avec un tel panel d’IA générative dans la sphère de l’Intelligence Artificielle, qu’est-ce que Amazon Nova apporte de nouveaux et surtout en quoi est elle novatrice ?

Amazon Nova rassemble l’ensemble des nouveaux modèles d’IA générative d’Amazon.Ces modèles sont conçus pour être rapides, efficaces et économiques, ce qui les rend accessibles à un large éventail d’applications commerciales. Avec Amazon Nova, les entreprises peuvent analyser des documents complexes, comprendre des graphiques et des diagrammes, générer du contenu visuel attrayant et construire des agents d’IA sophistiqués.De plus, Ces modèles sont pensés pour scaler rapidement, c’est-à-dire augmenter en puissance de calcul de manière dynamique et flexible, en fonction des besoins de l’entreprise, tout en maintenant des coûts d’utilisation plus raisonnables.

Au cœur de cette nouvelle gamme complète, Andy Jassy, CEO d’Amazon, présente tout d’abord quatre différents modèles en LLM multimodal qui s’adapte à tous les besoins. C’est-à-dire capable de comprendre, traiter et générer plusieurs types de données simultanément, comme le texte, les images, les vidéos, le son, etc. Cela signifie qu’il peut interpréter et générer des contenus qui combinent plusieurs formes de médias.
Nova Micro : le plus léger, se concentre sur le traitement de texte avec une rapidité d’exécution « record » pour les tâches basiques et un contexte de 128 000 tokens.
Nova Lite : plus polyvalent, ajoute la compréhension des images et des vidéos avec une fenêtre de contexte de 300 000 tokens, tout en conservant des coûts compétitifs.
Nova Pro : se positionne comme le modèle le plus équilibré, disposant également d’un contexte de 300 000 tokens et capable d’analyser aussi bien des documents financiers que du code ou des contenus visuels.
Nova Premier : annoncé pour début 2025, présenté comme le plus sophistiqué de la famille avec des capacités avancées de raisonnement.

La particularité de ces modèles : ils sont tous personnalisable pour s’adapter aux besoins spécifiques des entreprises et compatibles avec plus de 200 langues, dont le français.

Ce n’est pas tout ! Andy Jassy continue sa présentation en présentant un nouveau modèle de génération d’images (Amazon Nova Canvas) ainsi qu’un modèle de génération vidéo (Amazon Nova Reel). 
Amazon Nova Canvas, le modèle de génération d’images présenté comme « state-of-the-art » a été développé dans la même lignée que les modèles text-to-image tel que DALL-E ou Midjourney.
Il permet de créer des images de haute qualité à partir de texte ou d’autres images. Le modèle inclut également des fonctionnalités avancées d’édition d’image en utilisant un prompt. Sa particularité se trouve dans sa capacité à proposer un contrôle précis sur les styles visuels, le rythme, les mouvements de caméra, ainsi que la mise en page.

Pour ce qui est de Amazon Nova Reel, le modèle de génération de vidéo, il intervient dans la continuité de Amazon Nova Canvas. Avec ce modèle Amazon a pour ambition de permettre à toutes les entreprises de créer facilement des vidéos de haute qualité à partir de texte et d’images. Ses caractéristiques et performances évolutives offre un contrôle précis sur le style visuel et le rythme des vidéos, ainsi que sur sa capacité à gérer les mouvements de caméra.

Les modèles Nova Canvas et Reel se distinguent par leurs performances singulières et leur capacité à s’adapter à des charges de travail importantes. Ils sont conçus pour être facilement déployés et mis à l’échelle et aux besoins de chaque entreprise.

En revanche, contrairement à Micro, Lite, Pro ou Premier, Nova Canvas et Reel ne fonctionne pour l’instant qu’en anglais, avec une limite respective de de 1024 et 512 caractères par prompt. Amazon promet également des capacités de « fine-tuning » qui seront disponible prochainement, ainsi qu’une intégration par défaut des contrôles de sécurité.

En effet, Amazon accorde une importance particulière à la sécurité et à l’éthique de l’IA. C’est donc dans la perspective d’un écosystème sécurisé et responsable que les deux modèles Nova Canvas et Reel intègrent des garde-fous pour prévenir la génération de contenus nuisibles ou biaisés. De plus, les images et les vidéos générées sont automatiquement filigranées pour en assurer la traçabilité.Les performances des premières vidéos partagées laissent à penser que le modèle serait aussi bon que Sora d’OpenAI.


Amazon frappe fort en proposant une gamme complète d’IA générative qui répond aux besoins variés des entreprises. Que ce soit pour le traitement de texte, la génération d’images ou de vidéos, Amazon Nova met à leur disposition des modèles performants et personnalisables, promettant ainsi de transformer la manière dont les entreprises utilisent l’IA pour générer leurs contenus.