Qu’est-ce que ReALM ?

ReALM signifie “Résolution de Référence Comme Modélisation de Langue”, une solution révolutionnaire développée par des chercheurs d’Apple. Il s’agit donc d’un nouveau modèle de langage (Modèle de Langage de Grande Taille, LLM) qui traite le problème de la reconnaissance de référence comme une tâche dans le domaine de la modélisation de langage.

ReALM convertit efficacement divers types de contexte en une représentation textuelle, qu’il traite ensuite dans le cadre d’une tâche linguistique. Cela peut inclure :

  • des conversations – telles que des messages texte, des commandes vocales à un assistant, ou des e-mails,
  • des éléments à l’écran – par exemple, des photos, un calendrier, un widget météo, ou des applications et processus s’exécutant en arrière-plan.

Qu’est-ce qui rend ReALM différent des autres modèles de reconnaissance de référence ? D’abord, l’approche – au lieu de s’appuyer sur le traitement d’images, ReALM fonctionne dans le domaine du texte. Cela le rend beaucoup plus léger et plus efficace, ce qui devrait lui permettre de fonctionner directement sur des appareils mobiles tout en préservant la vie privée des utilisateurs.

En quoi ReALM est-il meilleur que GPT-4 ?

L’équipe de recherche d’Apple a comparé ReALM aux modèles de langage les plus puissants sur le marché aujourd’hui – GPT-3.5 et GPT-4 d’OpenAI. Les résultats étaient impressionnants. Dans les tâches de reconnaissance de référence, la plus petite variante de ReALM a atteint une précision comparable à celle de GPT-4 ! Les modèles ReALM plus grands ont même surpassé GPT-4 dans la reconnaissance des références aux éléments affichés à l’écran (http://arxiv.org/abs/2403.20329).

Qu’est-ce qui explique cet avantage ? Tout d’abord, ReALM est excellent pour les requêtes spécifiques à un domaine, telles que celles concernant les appareils de maison intelligente. Cela est dû au fait que ReALM démontre une compréhension plus profonde du contexte en ajustant le modèle pour des données spécifiques à un domaine.

De plus, contrairement à GPT-4, qui s’entraîne principalement sur des images d’objets réels, ReALM excelle dans la reconnaissance des éléments textuels et des composants des interfaces utilisateur des applications. Et c’est la compréhension de l’interface qui est cruciale pour l’interaction fluide des assistants vocaux avec les applications que nous utilisons aujourd’hui.

ReALM

Source : DALL·E 3, prompt : Marta M. Kania (https://www.linkedin.com/in/martamatyldakania/)

Est-ce le début de l’ère des assistants véritablement intelligents ?

En effet, l’intégration de ReALM avec Siri pourrait ouvrir un tout nouveau chapitre dans l’interaction homme-machine. Avec ReALM, Siri sera capable de comprendre des commandes qui incluent des références aux éléments affichés sur l’écran du smartphone, ainsi qu’aux processus et applications s’exécutant en arrière-plan. Mais quand cette option sera-t-elle disponible pour les utilisateurs ? Cela reste encore inconnu.

Nous restons avec des spéculations basées sur les capacités techniques du modèle. Alors, comment pourrait fonctionner un Siri alimenté par ReALM ? Par exemple, si vous naviguez sur un site de listes d’entreprises et voyez une entreprise qui vous intéresse, vous pourriez simplement dire à Siri : “Appelle cette entreprise”, et l’assistant – utilisant ReALM pour analyser le contexte – trouvera le numéro de téléphone de l’entreprise que vous spécifiez et initiera l’appel. Vous n’avez même pas besoin d’expliquer exactement quelle entreprise vous voulez dire.

A to dopiero początek możliwości ReALM. Des commandes telles que “Joue la dernière playlist” permettraient un contrôle intuitif des applications multimédias et des appareils de maison intelligente. ReALM pourrait aussi permettre à Siri de comprendre le contexte des conversations et l’historique des commandes, afin que l’assistant réagisse de manière appropriée aux demandes précédentes de l’utilisateur. C’est un pas vers des agents intelligents qui nous rapproche non pas d’une intelligence artificielle qui comprend nos requêtes, mais d’une qui saura exécuter des commandes.

Et ce n’est que le début de ce que ReALM peut faire. Des commandes comme “joue la dernière playlist” permettraient un contrôle intuitif des applications multimédias et des appareils de maison intelligente. ReALM pourrait également permettre à Siri de comprendre le contexte des conversations et l’historique des commandes, afin que l’assistant réponde de manière appropriée aux demandes précédentes de l’utilisateur. C’est un pas vers des agents intelligents, nous rapprochant non pas d’une intelligence artificielle qui comprend nos demandes, mais d’une qui sait comment exécuter des commandes.

Malheureusement, les utilisateurs d’appareils Android devront attendre. Actuellement, il n’y a aucune information sur les plans de Google pour ajouter les capacités de Gemini à Google Assistant. Une application Google Gemini pour les appareils Android a été développée (https://play.google.com/store/apps/details?id=com.google.android.apps.bard&hl=en_US), mais elle n’est pas encore disponible en dehors des États-Unis.

ReALM

Source : Google Play (https://play.google.com/store/apps/details?id=com.google.android.apps.bard&hl=en_US)

Résumé

ReALM est l’approche innovante d’Apple pour résoudre le problème de la reconnaissance de contexte par les assistants vocaux. Au lieu de s’appuyer sur le traitement d’images, ce modèle de langage convertit différents types de contexte en une représentation textuelle, qu’il traite ensuite dans une tâche linguistique. Cette approche garantit non seulement une grande précision de reconnaissance, mais aussi la capacité de fonctionner sur un appareil mobile tout en préservant la vie privée des utilisateurs.

Donner à Siri accès à ReALM peut offrir des interactions vocales plus naturelles et contextuelles, un pas important vers des assistants véritablement intelligents. Avec ReALM, Siri sera capable de répondre instantanément aux commandes liées aux éléments à l’écran, aux applications et aux processus en arrière-plan. Une chose est certaine – améliorer la conscience contextuelle des assistants est la clé pour créer des interactions vocales véritablement intelligentes et naturelles, et ReALM est sans aucun doute un pas important dans cette direction.

ReALM

Si vous aimez notre contenu, rejoignez notre communauté de abeilles occupées sur Facebook, Twitter, LinkedIn, Instagram, YouTube, Pinterest, TikTok.

Robert Whitney

Expert en JavaScript et instructeur qui forme les départements informatiques. Son objectif principal est d'améliorer la productivité de l'équipe en enseignant aux autres comment coopérer efficacement lors du codage.

View all posts →

AI in business:

  1. 6 super plugins ChatGTP qui rendront votre vie plus facile
  2. Naviguer dans de nouvelles opportunités commerciales avec ChatGPT-4
  3. 3 écrivains IA incroyables que vous devez essayer aujourd'hui
  4. Acteurs synthétiques. Top 3 des générateurs de vidéos IA
  5. Quelles sont les faiblesses de mon idée d'entreprise ? Une séance de brainstorming avec ChatGPT
  6. Utiliser ChatGPT dans les affaires
  7. Nouveaux services et produits fonctionnant avec l'IA
  8. Publications automatisées sur les réseaux sociaux
  9. Planification des publications sur les réseaux sociaux. Comment l'IA peut-elle aider ?
  10. Le rôle de l'IA dans la prise de décision en entreprise
  11. NLP commercial aujourd'hui et demain
  12. Chatbots textuels assistés par l'IA
  13. Applications de l'IA dans les affaires - aperçu
  14. Menaces et opportunités de l'IA dans les affaires (partie 2)
  15. Menaces et opportunités de l'IA dans les affaires (partie 1)
  16. Quel est l'avenir de l'IA selon le McKinsey Global Institute ?
  17. L'intelligence artificielle dans les affaires - Introduction
  18. Qu'est-ce que le PNL, ou traitement du langage naturel dans les affaires
  19. Google Translate contre DeepL. 5 applications de la traduction automatique pour les entreprises
  20. Traitement automatique des documents
  21. L'opération et les applications commerciales des voicebots
  22. Technologie d'assistant virtuel, ou comment parler à l'IA ?
  23. Qu'est-ce que l'intelligence d'affaires ?
  24. Comment l'intelligence artificielle peut-elle aider avec la gestion des processus métier ?
  25. IA créative d'aujourd'hui et de demain
  26. L'intelligence artificielle dans la gestion de contenu
  27. Explorer le pouvoir de l'IA dans la création musicale
  28. 3 outils de design graphique IA utiles. L'IA générative dans les affaires
  29. L'IA et les réseaux sociaux - que disent-ils de nous ?
  30. L'intelligence artificielle remplacera-t-elle les analystes commerciaux ?
  31. Outils d'IA pour le manager
  32. Le marché du travail futur et les professions à venir
  33. RPA et API dans une entreprise numérique
  34. Nouvelles interactions. Comment l'IA change-t-elle notre façon d'utiliser les appareils ?
  35. IA multimodale et ses applications dans les affaires
  36. Intelligence artificielle et environnement. 3 solutions d'IA pour vous aider à construire une entreprise durable.
  37. Détecteurs de contenu IA. En valent-ils la peine ?
  38. ChatGPT contre Bard contre Bing. Quel chatbot IA est en tête de la course ?
  39. L'IA des chatbots est-elle un concurrent de la recherche Google ?
  40. Prompts efficaces de ChatGPT pour les ressources humaines et le recrutement
  41. Ingénierie des invites. Que fait un ingénieur des invites ?
  42. IA et quoi d'autre ? Principales tendances technologiques pour les entreprises en 2024
  43. IA et éthique des affaires. Pourquoi vous devriez investir dans des solutions éthiques.
  44. Meta AI. Que devez-vous savoir sur les fonctionnalités soutenues par l'IA de Facebook et Instagram ?
  45. Réglementation de l'IA. Que devez-vous savoir en tant qu'entrepreneur ?
  46. 5 nouvelles utilisations de l'IA dans les affaires
  47. Produits et projets d'IA - en quoi sont-ils différents des autres ?
  48. L'IA en tant qu'expert dans votre équipe
  49. Équipe IA contre division des rôles
  50. Comment choisir un domaine de carrière en IA ?
  51. IA dans les RH : Comment l'automatisation du recrutement affecte les RH et le développement des équipes
  52. Automatisation des processus assistée par l'IA. Par où commencer ?
  53. 6 outils d'IA les plus intéressants en 2023
  54. Quelle est l'analyse de maturité en intelligence artificielle de l'entreprise ?
  55. IA pour la personnalisation B2B
  56. Cas d'utilisation de ChatGPT. 18 exemples de la façon d'améliorer votre entreprise avec ChatGPT en 2024
  57. Générateur de maquettes IA. Top 4 outils
  58. Micro-apprentissage. Une manière rapide d'acquérir de nouvelles compétences.
  59. Les implémentations d'IA les plus intéressantes dans les entreprises en 2024
  60. Quels défis le projet d'IA apporte-t-il ?
  61. Top 8 outils d'IA pour les entreprises en 2024
  62. L'IA dans la CRM. Qu'est-ce que l'IA change dans les outils de CRM ?
  63. La loi sur l'IA de l'UE. Comment l'Europe régule-t-elle l'utilisation de l'intelligence artificielle
  64. Les 7 meilleurs créateurs de sites web IA
  65. Outils sans code et innovations en IA
  66. Dans quelle mesure l'utilisation de l'IA augmente-t-elle la productivité de votre équipe ?
  67. Comment utiliser ChatGTP pour la recherche de marché ?
  68. Comment élargir la portée de votre campagne de marketing par IA ?
  69. L'IA dans le transport et la logistique
  70. Quels problèmes commerciaux l'IA peut-elle résoudre ?
  71. Comment associez-vous une solution d'IA à un problème commercial ?
  72. L'intelligence artificielle dans les médias
  73. L'IA dans la banque et la finance. Stripe, Monzo et Grab
  74. L'IA dans l'industrie du voyage
  75. Comment l'IA favorise la naissance de nouvelles technologies
  76. L'IA dans le commerce électronique. Aperçu des leaders mondiaux
  77. Top 4 outils de création d'images par IA
  78. Top 5 outils d'IA pour l'analyse des données
  79. La révolution de l'IA dans les médias sociaux
  80. Est-il toujours utile d'ajouter de l'intelligence artificielle au processus de développement de produit ?
  81. 6 plus grands incidents commerciaux causés par l'IA
  82. Stratégie d'IA dans votre entreprise - comment la construire ?
  83. Meilleurs cours d'IA – 6 recommandations incroyables
  84. Optimiser l'écoute des médias sociaux avec des outils d'IA
  85. IoT + IA, ou comment réduire les coûts énergétiques dans une entreprise
  86. L'IA dans la logistique. 5 meilleurs outils
  87. GPT Store – un aperçu des GPT les plus intéressants pour les entreprises
  88. LLM, GPT, RAG... Que signifient les acronymes de l'IA ?
  89. Les robots IA – l'avenir ou le présent des affaires ?
  90. Quel est le coût de la mise en œuvre de l'IA dans une entreprise ?
  91. Que font les spécialistes en intelligence artificielle ?
  92. Comment l'IA peut-elle aider dans la carrière d'un freelance ?
  93. Automatiser le travail et augmenter la productivité. Un guide de l'IA pour les freelances
  94. IA pour les startups – meilleurs outils
  95. Créer un site web avec l'IA
  96. Eleven Labs et quoi d'autre ? Les startups d'IA les plus prometteuses
  97. OpenAI, Midjourney, Anthropic, Hugging Face. Qui est qui dans le monde de l'IA ?
  98. Données synthétiques et leur importance pour le développement de votre entreprise
  99. Moteurs de recherche IA de premier plan. Où chercher des outils d'IA ?
  100. Vidéo IA. Les derniers générateurs de vidéos IA
  101. IA pour les managers. Comment l'IA peut faciliter votre travail
  102. Quoi de neuf dans Google Gemini ? Tout ce que vous devez savoir
  103. IA en Pologne. Entreprises, réunions et conférences
  104. Calendrier IA. Comment optimiser votre temps dans une entreprise ?
  105. IA et l'avenir du travail. Comment préparer votre entreprise au changement ?
  106. Clonage vocal par IA pour les entreprises. Comment créer des messages vocaux personnalisés avec l'IA ?
  107. "Nous sommes tous des développeurs". Comment les développeurs citoyens peuvent-ils aider votre entreprise ?
  108. Vérification des faits et hallucinations de l'IA
  109. L'IA dans le recrutement – développement des matériaux de recrutement étape par étape
  110. Sora. Comment les vidéos réalistes d'OpenAI vont-elles changer les affaires ?
  111. Midjourney v6. Innovations dans la génération d'images par IA
  112. L'IA dans les PME. Comment les PME peuvent-elles rivaliser avec les géants en utilisant l'IA ?
  113. Comment l'IA transforme-t-elle le marketing d'influence ?
  114. L'IA est-elle vraiment une menace pour les développeurs ? Devin et Microsoft AutoDev
  115. Meilleurs chatbots IA pour le commerce électronique. Plates-formes
  116. Chatbots IA pour le commerce électronique. Études de cas
  117. Comment rester au courant de ce qui se passe dans le monde de l'IA ?
  118. Domestiquer l'IA. Comment faire les premiers pas pour appliquer l'IA dans votre entreprise ?
  119. Perplexité, Bing Copilot ou You.com ? Comparaison des moteurs de recherche IA
  120. Experts en IA en Pologne
  121. ReALM. Un modèle de langage révolutionnaire d'Apple ?
  122. Google Genie — un modèle d'IA générative qui crée des mondes entièrement interactifs à partir d'images
  123. Automatisation ou augmentation ? Deux approches de l'IA dans une entreprise
  124. LLMOps, ou comment gérer efficacement les modèles de langage dans une organisation
  125. Génération de vidéos par IA. Nouveaux horizons dans la production de contenu vidéo pour les entreprises.
  126. Meilleurs outils de transcription IA. Comment transformer de longs enregistrements en résumés concis ?
  127. Analyse des sentiments avec l'IA. Comment cela aide-t-il à provoquer des changements dans les entreprises ?
  128. Le rôle de l'IA dans la modération de contenu