Sora. Comment les vidéos réalistes d’OpenAI vont-elles changer les affaires ? | IA dans les affaires #94

Il y a quelques jours, Google a de nouveau attiré l’attention des passionnés d’IA en annonçant Gemini 1.5 juste une semaine après la sortie du puissant modèle Gemini 1.0 Ultra et en renommant le chatbot Bard en Gemini.

Cependant, OpenAI n’a pas laissé Google profiter d’une position forte dans le domaine de l’IA même pas un jour. Les créateurs de ChatGPT ont révélé une solution encore plus excitante : Sora, un générateur de vidéos capable de créer des vidéos d’une minute basées sur des instructions textuelles. Sora d’OpenAI est sur le point de devenir un outil révolutionnaire avec le potentiel de transformer l’industrie de la création de contenu vidéo. Pourtant, ce qui rend Sora exceptionnel, ce ne sont pas seulement ses capacités techniques, mais aussi sa large gamme d’applications potentielles, allant du marketing et de l’éducation à l’industrie du divertissement et à la communication quotidienne. Examinons comment Sora envisage d’apporter ces changements et quelles perspectives elle ouvre pour les entreprises.

Sora d’OpenAI – une nouvelle ère dans la création de contenu vidéo

Nous avons parcouru un long chemin depuis les premiers essais maladroits de création de vidéos à l’aide d’ordinateurs. Il est déjà évident que les vidéos créées par l’intelligence artificielle générative, même celles datant de six mois, semblent assez maladroites par rapport aux générations de Sora. Bien que Sora, qui peut créer des scènes vidéo réalistes basées sur des instructions textuelles, soit encore en phase expérimentale et pas encore disponible pour le public, ses capacités sont stupéfiantes.

Sora offre une large gamme d’applications qui peuvent changer notre façon de créer et de consommer du contenu vidéo. Voici quelques exemples :

  • générer des scènes complexes avec plusieurs personnages ou objets,
  • animer des images déjà existantes,
  • éditer des vidéos créées,
  • combiner différentes graphiques ou vidéos en une seule.

Ces exemples montrent un progrès énorme dans le domaine de l’IA. Cependant, surtout, cela ouvre des portes à de nouvelles possibilités dans la création de contenu vidéo. Regardez simplement la présentation d’une vidéo haute résolution montrant la beauté d’une fleur en pleine floraison :

Source : OpenAI (https://cdn.openai.com/sora/videos/flower-blooming.mp4 ou https://youtu.be/UNmqxZoTgsk)

Comment Sora sera-t-elle utilisée ?

Sora est-elle juste un jouet et un autre outil pour créer du contenu vidéo ? Non. Du moins selon OpenAI. Comme l’écrivent les créateurs de Sora :

Nous enseignons à l’intelligence artificielle à comprendre et à simuler le monde physique en mouvement, et l’objectif est de former des modèles qui aident les gens à résoudre des problèmes nécessitant une interaction avec le monde réel.

Pour générer des vidéos avec précision, le modèle doit comprendre le monde à un niveau beaucoup plus profond que ce qui est nécessaire pour la création de texte. Cela implique de comprendre la physique, les relations spatiales entre les objets sur le même plan, et l’interaction entre le premier plan et l’arrière-plan.

Sora sera capable de générer :

  • vidéo à partir de texte – la première et la plus importante innovation du modèle,
  • vidéo à partir d’images – permettant l’animation de générations existantes créées dans DALL·E 3,
  • vidéo à partir d’image et de texte – permettant une création de film plus précise,
  • vidéo à partir de vidéo – ajoutant des effets spéciaux, prolongeant le film, combinant deux enregistrements existants, ou changeant le style vidéo,
  • images à partir de texte – remplaçant probablement DALL·E et offrant des générations avec une résolution de 2048×2048.

À l’avenir, Sora pourrait être utilisée pour créer des vidéos promotionnelles, du contenu pour les réseaux sociaux, ou des présentations d’entreprise. C’est un outil qui pourrait complètement changer notre façon de créer et de partager du contenu vidéo :

Source : OpenAI (https://cdn.openai.com/sora/videos/aquarium-nyc.mp4 ou https://youtu.be/3l8wjxjNubE)

Bien que ce colossal pas en avant dans le développement de l’intelligence artificielle générative soit excitant, il soulève également des préoccupations concernant les risques associés aux deep fakes, en particulier en relation avec les élections présidentielles américaines. Les menaces associées à l’utilisation de Sora incluent principalement :

  • Désinformation. Les deepfakes, y compris les vidéos photoréalistes générées par Sora, peuvent propager de fausses nouvelles qui peuvent influencer l’opinion publique et saper la démocratie. En créant de fausses vidéos qui semblent réelles, les spectateurs peuvent être manipulés et trompés.
  • Violation de la vie privée. Rendre Sora disponible permettrait à quiconque ayant un ordinateur et un accès à Internet de créer du contenu faux, y compris des vidéos qui violent la vie privée et abusent des données personnelles sans autorisation. Probablement pour cette raison, il faudra un certain temps avant que Sora ne soit disponible pour le grand public. OpenAI doit s’assurer de mettre en place des protections appropriées.
  • Atteinte à la réputation. En utilisant Sora, des hackers peuvent usurper l’identité d’autres individus, organisations ou marques pour les diffamer. En créant l’impression que quelqu’un dit ou fait des choses qu’il n’a jamais faites, de telles vidéos peuvent nuire considérablement à la réputation et à la crédibilité. Combiner la technologie deepfake avec le clonage vocal basé sur l’IA peut, malheureusement, conduire à la création de nombreux faux très convaincants. À mesure que nous approchons d’un point où il devient extrêmement difficile de distinguer un faux d’un enregistrement authentique, la vigilance, la sensibilisation et la pensée critique deviennent de plus en plus cruciales pour lutter contre les dommages potentiels causés par les deepfakes.

Par conséquent, bien que les capacités de Sora soient impressionnantes, nous devons être prudents quant à leur impact sur la société, créer des réglementations et prendre des mesures supplémentaires pour minimiser leurs conséquences négatives.

Comment utiliser Sora ?

Bien que Sora soit actuellement en phase de test et pas disponible pour un public plus large, son utilisation semble être un processus simple et intuitif. Les utilisateurs pourront probablement l’utiliser comme ils utilisent actuellement DALL-E 3 dans ChatGPT Plus. C’est-à-dire taper des commandes textuelles, que Sora convertira en courts clips vidéo. Cela offre de nouvelles opportunités pour les créateurs de contenu, les marketeurs et les éducateurs, leur permettant de réaliser rapidement des vidéos engageantes et de haute qualité.

Comment Sora se compare-t-elle à d’autres générateurs de vidéos IA ?

Mais comment Sora se compare-t-elle à d’autres générateurs de vidéos ? Pour l’instant, nous ne pouvons que spéculer sur la performance de Sora, mais sur la base de la description de l’outil disponible sur le site Web d’OpenAI, nous pouvons faire quelques observations générales :

  • Runway – Sora fonctionnera de manière similaire, mais avec un réalisme beaucoup plus élevé. Runway vous permet de créer du contenu vidéo et image à l’aide de l’IA, y compris des options de texte à vidéo et d’image à image. Il propose également des améliorations d’édition comme la suppression de l’arrière-plan et le remplacement d’éléments basés sur des commandes textuelles.
  • Synthesia – la plateforme fonctionne différemment de Sora, car elle propose la création de vidéos réalistes avec des avatars numériques, prenant en charge plus de 120 langues et permettant la création d’avatars personnalisés. Nous ne savons pas encore comment Sora gérera des tâches comme la combinaison de l’audio ou la génération de discours avec le matériel visuel qu’elle crée.
  • HeyGen – son unicité réside dans le clonage vocal et la capacité de créer un avatar avec des gestes personnalisés, donc sa fonctionnalité diffère considérablement de l’offre de Sora.
  • Stable Video Diffusion – probablement le concurrent direct le plus sérieux de Sora, capable de transformer des images statiques en animations vidéo, principalement pour les créateurs de contenu sur les réseaux sociaux. Sa nature expérimentale, et le fait qu’il soit basé sur des modèles à accès ouvert, suscite de grands espoirs dans le contexte de la production cinématographique et de l’animation.

Sora se distingue des autres outils de génération de vidéos car elle crée des vidéos hautement réalistes qui ressemblent étroitement à de véritables enregistrements. La résolution est particulièrement importante ici. Sora peut réaliser des vidéos avec des résolutions allant jusqu’à 1920x1080px.

Avec sa compréhension approfondie du langage, le modèle interprète avec précision les commandes. Ici, OpenAI a utilisé la méthode éprouvée dans DALL-E 3. Le modèle interprète d’abord une invite simple saisie par l’utilisateur, puis génère du contenu visuel basé sur sa version élaborée et détaillée. Cela lui permet de créer des scènes complexes et de générer des personnages qui expriment des émotions authentiques :

Source : OpenAI (https://cdn.openai.com/sora/videos/closeup-man-in-glasses.mp4 ou https://youtu.be/pxkfUDoQg5I)

Comment Sora peut-elle affecter l’industrie créative ?

Le potentiel de Sora pour transformer l’industrie créative est énorme. L’accès à cet outil pour les cinéastes et les designers apporte une nouvelle qualité à la création de contenu vidéo. Sora sert de base à des modèles capables de simuler le monde réel, ce qui pourrait être une percée dans l’atteinte de l’AGI (Intelligence Artificielle Générale). Du moins, c’est ce que ses créateurs, OpenAI, affirment.

Puisque Sora crée des images animées réalistes similaires à celles filmées par la main humaine, elle a le potentiel de changer considérablement le domaine de la création vidéo, des matériaux de formation aux productions hollywoodiennes. Sora aura sans aucun doute un impact sur :

  • Marketing. Sora a le potentiel de révolutionner les campagnes publicitaires en générant rapidement un contenu vidéo attrayant basé sur des messages marketing ou des descriptions de produits.
  • Industrie du divertissement. Les studios de cinéma et les créateurs de contenu peuvent bénéficier de la capacité de Sora à créer des scènes et des personnages réalistes, rationalisant ainsi les processus de production.
  • Jeux. Les développeurs de jeux peuvent utiliser Sora pour créer des films ou des bandes-annonces dans les jeux, améliorant ainsi l’expérience des joueurs.
  • Formation. La facilité de création de matériaux éducatifs de haute qualité, y compris des vidéos d’instruction “comment faire”, peut grandement améliorer l’attractivité des formations et des cours.

Source : DALL·E 3, prompt : Marta M. Kania (https://www.linkedin.com/in/martamatyldakania/)

Comment les entreprises peuvent-elles bénéficier de vidéos IA réalistes ?

L’utilisation de l’IA dans la production vidéo offre aux entreprises une gamme d’avantages, tels que des économies de temps et de coûts, une qualité de résultats constante, et une valeur accrue du produit final. OpenAI prend des mesures pour garantir la sécurité de Sora, y compris la collaboration avec des équipes de test anti-adversariales et le développement d’un classificateur pour détecter les vidéos générées par l’IA.

Sora d’OpenAI ouvre de nouvelles possibilités pour créer et consommer du contenu vidéo. De la révolution de l’industrie créative à l’impact sur le marketing et l’éducation, en passant par l’influence sur la communication quotidienne – le potentiel est immense. En tant qu’outil qui peut complètement changer les règles du jeu, Sora mérite une attention particulière. Nous attendons avec impatience de plus amples informations de la part d’OpenAI, notamment concernant la date à laquelle Sora sera disponible pour le grand public. Cela marque le début d’une nouvelle ère dans la création de contenu vidéo. La prochaine étape est son intégration avec le son, la voix et les modèles 3D, ce qui ouvrira des portes vers le métavers.

Si vous aimez notre contenu, rejoignez notre communauté de abeilles occupées sur Facebook, Twitter, LinkedIn, Instagram, YouTube, Pinterest, TikTok.

Robert Whitney

Expert en JavaScript et instructeur qui forme les départements informatiques. Son objectif principal est d'améliorer la productivité de l'équipe en enseignant aux autres comment coopérer efficacement lors du codage.

View all posts →

Robert Whitney

Expert en JavaScript et instructeur qui forme les départements informatiques. Son objectif principal est d'améliorer la productivité de l'équipe en enseignant aux autres comment coopérer efficacement lors du codage.

Share
Published by
Robert Whitney

Recent Posts

Le rôle de l’IA dans la modération de contenu | IA dans les affaires #129

Les entreprises luttent pour gérer une vaste quantité de contenu publié en ligne, des publications…

3 days ago

Analyse de sentiment avec l’IA. Comment cela aide-t-il à provoquer des changements dans les entreprises ? | IA dans les affaires #128

À l'ère de la transformation numérique, les entreprises ont accès à une quantité sans précédent…

3 days ago

Meilleurs outils de transcription IA. Comment transformer de longs enregistrements en résumés concis ? | IA dans les affaires #127

Saviez-vous que vous pouvez obtenir l'essence d'un enregistrement de plusieurs heures d'une réunion ou d'une…

3 days ago

Génération de vidéos par IA. Nouveaux horizons dans la production de contenu vidéo pour les entreprises | IA dans les affaires #126

Imaginez un monde où votre entreprise peut créer des vidéos engageantes et personnalisées pour n'importe…

3 days ago

LLMOps, ou comment gérer efficacement les modèles de langage dans une organisation | IA en affaires #125

Pour tirer pleinement parti du potentiel des grands modèles de langage (LLMs), les entreprises doivent…

3 days ago

Automatisation ou augmentation ? Deux approches de l’IA dans une entreprise | IA en affaires #124

En 2018, Unilever avait déjà entrepris un voyage conscient pour équilibrer les capacités d'automatisation et…

3 days ago