Il y a quelques jours, Google a de nouveau attiré l’attention des passionnés d’IA en annonçant Gemini 1.5 juste une semaine après la sortie du puissant modèle Gemini 1.0 Ultra et en renommant le chatbot Bard en Gemini.
Cependant, OpenAI n’a pas laissé Google profiter d’une position forte dans le domaine de l’IA même pas un jour. Les créateurs de ChatGPT ont révélé une solution encore plus excitante : Sora, un générateur de vidéos capable de créer des vidéos d’une minute basées sur des instructions textuelles. Sora d’OpenAI est sur le point de devenir un outil révolutionnaire avec le potentiel de transformer l’industrie de la création de contenu vidéo. Pourtant, ce qui rend Sora exceptionnel, ce ne sont pas seulement ses capacités techniques, mais aussi sa large gamme d’applications potentielles, allant du marketing et de l’éducation à l’industrie du divertissement et à la communication quotidienne. Examinons comment Sora envisage d’apporter ces changements et quelles perspectives elle ouvre pour les entreprises.
Nous avons parcouru un long chemin depuis les premiers essais maladroits de création de vidéos à l’aide d’ordinateurs. Il est déjà évident que les vidéos créées par l’intelligence artificielle générative, même celles datant de six mois, semblent assez maladroites par rapport aux générations de Sora. Bien que Sora, qui peut créer des scènes vidéo réalistes basées sur des instructions textuelles, soit encore en phase expérimentale et pas encore disponible pour le public, ses capacités sont stupéfiantes.
Sora offre une large gamme d’applications qui peuvent changer notre façon de créer et de consommer du contenu vidéo. Voici quelques exemples :
Ces exemples montrent un progrès énorme dans le domaine de l’IA. Cependant, surtout, cela ouvre des portes à de nouvelles possibilités dans la création de contenu vidéo. Regardez simplement la présentation d’une vidéo haute résolution montrant la beauté d’une fleur en pleine floraison :
Source : OpenAI (https://cdn.openai.com/sora/videos/flower-blooming.mp4 ou https://youtu.be/UNmqxZoTgsk)
Sora est-elle juste un jouet et un autre outil pour créer du contenu vidéo ? Non. Du moins selon OpenAI. Comme l’écrivent les créateurs de Sora :
Nous enseignons à l’intelligence artificielle à comprendre et à simuler le monde physique en mouvement, et l’objectif est de former des modèles qui aident les gens à résoudre des problèmes nécessitant une interaction avec le monde réel.
Pour générer des vidéos avec précision, le modèle doit comprendre le monde à un niveau beaucoup plus profond que ce qui est nécessaire pour la création de texte. Cela implique de comprendre la physique, les relations spatiales entre les objets sur le même plan, et l’interaction entre le premier plan et l’arrière-plan.
Sora sera capable de générer :
À l’avenir, Sora pourrait être utilisée pour créer des vidéos promotionnelles, du contenu pour les réseaux sociaux, ou des présentations d’entreprise. C’est un outil qui pourrait complètement changer notre façon de créer et de partager du contenu vidéo :
Source : OpenAI (https://cdn.openai.com/sora/videos/aquarium-nyc.mp4 ou https://youtu.be/3l8wjxjNubE)
Bien que ce colossal pas en avant dans le développement de l’intelligence artificielle générative soit excitant, il soulève également des préoccupations concernant les risques associés aux deep fakes, en particulier en relation avec les élections présidentielles américaines. Les menaces associées à l’utilisation de Sora incluent principalement :
Par conséquent, bien que les capacités de Sora soient impressionnantes, nous devons être prudents quant à leur impact sur la société, créer des réglementations et prendre des mesures supplémentaires pour minimiser leurs conséquences négatives.
Bien que Sora soit actuellement en phase de test et pas disponible pour un public plus large, son utilisation semble être un processus simple et intuitif. Les utilisateurs pourront probablement l’utiliser comme ils utilisent actuellement DALL-E 3 dans ChatGPT Plus. C’est-à-dire taper des commandes textuelles, que Sora convertira en courts clips vidéo. Cela offre de nouvelles opportunités pour les créateurs de contenu, les marketeurs et les éducateurs, leur permettant de réaliser rapidement des vidéos engageantes et de haute qualité.
Mais comment Sora se compare-t-elle à d’autres générateurs de vidéos ? Pour l’instant, nous ne pouvons que spéculer sur la performance de Sora, mais sur la base de la description de l’outil disponible sur le site Web d’OpenAI, nous pouvons faire quelques observations générales :
Sora se distingue des autres outils de génération de vidéos car elle crée des vidéos hautement réalistes qui ressemblent étroitement à de véritables enregistrements. La résolution est particulièrement importante ici. Sora peut réaliser des vidéos avec des résolutions allant jusqu’à 1920x1080px.
Avec sa compréhension approfondie du langage, le modèle interprète avec précision les commandes. Ici, OpenAI a utilisé la méthode éprouvée dans DALL-E 3. Le modèle interprète d’abord une invite simple saisie par l’utilisateur, puis génère du contenu visuel basé sur sa version élaborée et détaillée. Cela lui permet de créer des scènes complexes et de générer des personnages qui expriment des émotions authentiques :
Source : OpenAI (https://cdn.openai.com/sora/videos/closeup-man-in-glasses.mp4 ou https://youtu.be/pxkfUDoQg5I)
Le potentiel de Sora pour transformer l’industrie créative est énorme. L’accès à cet outil pour les cinéastes et les designers apporte une nouvelle qualité à la création de contenu vidéo. Sora sert de base à des modèles capables de simuler le monde réel, ce qui pourrait être une percée dans l’atteinte de l’AGI (Intelligence Artificielle Générale). Du moins, c’est ce que ses créateurs, OpenAI, affirment.
Puisque Sora crée des images animées réalistes similaires à celles filmées par la main humaine, elle a le potentiel de changer considérablement le domaine de la création vidéo, des matériaux de formation aux productions hollywoodiennes. Sora aura sans aucun doute un impact sur :
Source : DALL·E 3, prompt : Marta M. Kania (https://www.linkedin.com/in/martamatyldakania/)
L’utilisation de l’IA dans la production vidéo offre aux entreprises une gamme d’avantages, tels que des économies de temps et de coûts, une qualité de résultats constante, et une valeur accrue du produit final. OpenAI prend des mesures pour garantir la sécurité de Sora, y compris la collaboration avec des équipes de test anti-adversariales et le développement d’un classificateur pour détecter les vidéos générées par l’IA.
Sora d’OpenAI ouvre de nouvelles possibilités pour créer et consommer du contenu vidéo. De la révolution de l’industrie créative à l’impact sur le marketing et l’éducation, en passant par l’influence sur la communication quotidienne – le potentiel est immense. En tant qu’outil qui peut complètement changer les règles du jeu, Sora mérite une attention particulière. Nous attendons avec impatience de plus amples informations de la part d’OpenAI, notamment concernant la date à laquelle Sora sera disponible pour le grand public. Cela marque le début d’une nouvelle ère dans la création de contenu vidéo. La prochaine étape est son intégration avec le son, la voix et les modèles 3D, ce qui ouvrira des portes vers le métavers.
Si vous aimez notre contenu, rejoignez notre communauté de abeilles occupées sur Facebook, Twitter, LinkedIn, Instagram, YouTube, Pinterest, TikTok.
Expert en JavaScript et instructeur qui forme les départements informatiques. Son objectif principal est d'améliorer la productivité de l'équipe en enseignant aux autres comment coopérer efficacement lors du codage.
Les entreprises luttent pour gérer une vaste quantité de contenu publié en ligne, des publications…
À l'ère de la transformation numérique, les entreprises ont accès à une quantité sans précédent…
Saviez-vous que vous pouvez obtenir l'essence d'un enregistrement de plusieurs heures d'une réunion ou d'une…
Imaginez un monde où votre entreprise peut créer des vidéos engageantes et personnalisées pour n'importe…
Pour tirer pleinement parti du potentiel des grands modèles de langage (LLMs), les entreprises doivent…
En 2018, Unilever avait déjà entrepris un voyage conscient pour équilibrer les capacités d'automatisation et…