ReALM – table des matières
Qu’est-ce que ReALM ?
ReALM signifie “Résolution de Référence Comme Modélisation de Langue”, une solution révolutionnaire développée par des chercheurs d’Apple. Il s’agit donc d’un nouveau modèle de langage (Modèle de Langage de Grande Taille, LLM) qui traite le problème de la reconnaissance de référence comme une tâche dans le domaine de la modélisation de langage.
ReALM convertit efficacement divers types de contexte en une représentation textuelle, qu’il traite ensuite dans le cadre d’une tâche linguistique. Cela peut inclure :
- des conversations – telles que des messages texte, des commandes vocales à un assistant, ou des e-mails,
- des éléments à l’écran – par exemple, des photos, un calendrier, un widget météo, ou des applications et processus s’exécutant en arrière-plan.
Qu’est-ce qui rend ReALM différent des autres modèles de reconnaissance de référence ? D’abord, l’approche – au lieu de s’appuyer sur le traitement d’images, ReALM fonctionne dans le domaine du texte. Cela le rend beaucoup plus léger et plus efficace, ce qui devrait lui permettre de fonctionner directement sur des appareils mobiles tout en préservant la vie privée des utilisateurs.
En quoi ReALM est-il meilleur que GPT-4 ?
L’équipe de recherche d’Apple a comparé ReALM aux modèles de langage les plus puissants sur le marché aujourd’hui – GPT-3.5 et GPT-4 d’OpenAI. Les résultats étaient impressionnants. Dans les tâches de reconnaissance de référence, la plus petite variante de ReALM a atteint une précision comparable à celle de GPT-4 ! Les modèles ReALM plus grands ont même surpassé GPT-4 dans la reconnaissance des références aux éléments affichés à l’écran (http://arxiv.org/abs/2403.20329).
Qu’est-ce qui explique cet avantage ? Tout d’abord, ReALM est excellent pour les requêtes spécifiques à un domaine, telles que celles concernant les appareils de maison intelligente. Cela est dû au fait que ReALM démontre une compréhension plus profonde du contexte en ajustant le modèle pour des données spécifiques à un domaine.
De plus, contrairement à GPT-4, qui s’entraîne principalement sur des images d’objets réels, ReALM excelle dans la reconnaissance des éléments textuels et des composants des interfaces utilisateur des applications. Et c’est la compréhension de l’interface qui est cruciale pour l’interaction fluide des assistants vocaux avec les applications que nous utilisons aujourd’hui.

Source : DALL·E 3, prompt : Marta M. Kania (https://www.linkedin.com/in/martamatyldakania/)
Est-ce le début de l’ère des assistants véritablement intelligents ?
En effet, l’intégration de ReALM avec Siri pourrait ouvrir un tout nouveau chapitre dans l’interaction homme-machine. Avec ReALM, Siri sera capable de comprendre des commandes qui incluent des références aux éléments affichés sur l’écran du smartphone, ainsi qu’aux processus et applications s’exécutant en arrière-plan. Mais quand cette option sera-t-elle disponible pour les utilisateurs ? Cela reste encore inconnu.
Nous restons avec des spéculations basées sur les capacités techniques du modèle. Alors, comment pourrait fonctionner un Siri alimenté par ReALM ? Par exemple, si vous naviguez sur un site de listes d’entreprises et voyez une entreprise qui vous intéresse, vous pourriez simplement dire à Siri : “Appelle cette entreprise”, et l’assistant – utilisant ReALM pour analyser le contexte – trouvera le numéro de téléphone de l’entreprise que vous spécifiez et initiera l’appel. Vous n’avez même pas besoin d’expliquer exactement quelle entreprise vous voulez dire.
A to dopiero początek możliwości ReALM. Des commandes telles que “Joue la dernière playlist” permettraient un contrôle intuitif des applications multimédias et des appareils de maison intelligente. ReALM pourrait aussi permettre à Siri de comprendre le contexte des conversations et l’historique des commandes, afin que l’assistant réagisse de manière appropriée aux demandes précédentes de l’utilisateur. C’est un pas vers des agents intelligents qui nous rapproche non pas d’une intelligence artificielle qui comprend nos requêtes, mais d’une qui saura exécuter des commandes.
Et ce n’est que le début de ce que ReALM peut faire. Des commandes comme “joue la dernière playlist” permettraient un contrôle intuitif des applications multimédias et des appareils de maison intelligente. ReALM pourrait également permettre à Siri de comprendre le contexte des conversations et l’historique des commandes, afin que l’assistant réponde de manière appropriée aux demandes précédentes de l’utilisateur. C’est un pas vers des agents intelligents, nous rapprochant non pas d’une intelligence artificielle qui comprend nos demandes, mais d’une qui sait comment exécuter des commandes.
Malheureusement, les utilisateurs d’appareils Android devront attendre. Actuellement, il n’y a aucune information sur les plans de Google pour ajouter les capacités de Gemini à Google Assistant. Une application Google Gemini pour les appareils Android a été développée (https://play.google.com/store/apps/details?id=com.google.android.apps.bard&hl=en_US), mais elle n’est pas encore disponible en dehors des États-Unis.

Source : Google Play (https://play.google.com/store/apps/details?id=com.google.android.apps.bard&hl=en_US)
Résumé
ReALM est l’approche innovante d’Apple pour résoudre le problème de la reconnaissance de contexte par les assistants vocaux. Au lieu de s’appuyer sur le traitement d’images, ce modèle de langage convertit différents types de contexte en une représentation textuelle, qu’il traite ensuite dans une tâche linguistique. Cette approche garantit non seulement une grande précision de reconnaissance, mais aussi la capacité de fonctionner sur un appareil mobile tout en préservant la vie privée des utilisateurs.
Donner à Siri accès à ReALM peut offrir des interactions vocales plus naturelles et contextuelles, un pas important vers des assistants véritablement intelligents. Avec ReALM, Siri sera capable de répondre instantanément aux commandes liées aux éléments à l’écran, aux applications et aux processus en arrière-plan. Une chose est certaine – améliorer la conscience contextuelle des assistants est la clé pour créer des interactions vocales véritablement intelligentes et naturelles, et ReALM est sans aucun doute un pas important dans cette direction.

Si vous aimez notre contenu, rejoignez notre communauté de abeilles occupées sur Facebook, Twitter, LinkedIn, Instagram, YouTube, Pinterest, TikTok.
Robert Whitney
Expert en JavaScript et instructeur qui forme les départements informatiques. Son objectif principal est d'améliorer la productivité de l'équipe en enseignant aux autres comment coopérer efficacement lors du codage.
AI in business:
- 6 super plugins ChatGTP qui rendront votre vie plus facile
- Naviguer dans de nouvelles opportunités commerciales avec ChatGPT-4
- 3 écrivains IA incroyables que vous devez essayer aujourd'hui
- Acteurs synthétiques. Top 3 des générateurs de vidéos IA
- Quelles sont les faiblesses de mon idée d'entreprise ? Une séance de brainstorming avec ChatGPT
- Utiliser ChatGPT dans les affaires
- Nouveaux services et produits fonctionnant avec l'IA
- Publications automatisées sur les réseaux sociaux
- Planification des publications sur les réseaux sociaux. Comment l'IA peut-elle aider ?
- Le rôle de l'IA dans la prise de décision en entreprise
- NLP commercial aujourd'hui et demain
- Chatbots textuels assistés par l'IA
- Applications de l'IA dans les affaires - aperçu
- Menaces et opportunités de l'IA dans les affaires (partie 2)
- Menaces et opportunités de l'IA dans les affaires (partie 1)
- Quel est l'avenir de l'IA selon le McKinsey Global Institute ?
- L'intelligence artificielle dans les affaires - Introduction
- Qu'est-ce que le PNL, ou traitement du langage naturel dans les affaires
- Google Translate contre DeepL. 5 applications de la traduction automatique pour les entreprises
- Traitement automatique des documents
- L'opération et les applications commerciales des voicebots
- Technologie d'assistant virtuel, ou comment parler à l'IA ?
- Qu'est-ce que l'intelligence d'affaires ?
- Comment l'intelligence artificielle peut-elle aider avec la gestion des processus métier ?
- IA créative d'aujourd'hui et de demain
- L'intelligence artificielle dans la gestion de contenu
- Explorer le pouvoir de l'IA dans la création musicale
- 3 outils de design graphique IA utiles. L'IA générative dans les affaires
- L'IA et les réseaux sociaux - que disent-ils de nous ?
- L'intelligence artificielle remplacera-t-elle les analystes commerciaux ?
- Outils d'IA pour le manager
- Le marché du travail futur et les professions à venir
- RPA et API dans une entreprise numérique
- Nouvelles interactions. Comment l'IA change-t-elle notre façon d'utiliser les appareils ?
- IA multimodale et ses applications dans les affaires
- Intelligence artificielle et environnement. 3 solutions d'IA pour vous aider à construire une entreprise durable.
- Détecteurs de contenu IA. En valent-ils la peine ?
- ChatGPT contre Bard contre Bing. Quel chatbot IA est en tête de la course ?
- L'IA des chatbots est-elle un concurrent de la recherche Google ?
- Prompts efficaces de ChatGPT pour les ressources humaines et le recrutement
- Ingénierie des invites. Que fait un ingénieur des invites ?
- IA et quoi d'autre ? Principales tendances technologiques pour les entreprises en 2024
- IA et éthique des affaires. Pourquoi vous devriez investir dans des solutions éthiques.
- Meta AI. Que devez-vous savoir sur les fonctionnalités soutenues par l'IA de Facebook et Instagram ?
- Réglementation de l'IA. Que devez-vous savoir en tant qu'entrepreneur ?
- 5 nouvelles utilisations de l'IA dans les affaires
- Produits et projets d'IA - en quoi sont-ils différents des autres ?
- L'IA en tant qu'expert dans votre équipe
- Équipe IA contre division des rôles
- Comment choisir un domaine de carrière en IA ?
- IA dans les RH : Comment l'automatisation du recrutement affecte les RH et le développement des équipes
- Automatisation des processus assistée par l'IA. Par où commencer ?
- 6 outils d'IA les plus intéressants en 2023
- Quelle est l'analyse de maturité en intelligence artificielle de l'entreprise ?
- IA pour la personnalisation B2B
- Cas d'utilisation de ChatGPT. 18 exemples de la façon d'améliorer votre entreprise avec ChatGPT en 2024
- Générateur de maquettes IA. Top 4 outils
- Micro-apprentissage. Une manière rapide d'acquérir de nouvelles compétences.
- Les implémentations d'IA les plus intéressantes dans les entreprises en 2024
- Quels défis le projet d'IA apporte-t-il ?
- Top 8 outils d'IA pour les entreprises en 2024
- L'IA dans la CRM. Qu'est-ce que l'IA change dans les outils de CRM ?
- La loi sur l'IA de l'UE. Comment l'Europe régule-t-elle l'utilisation de l'intelligence artificielle
- Les 7 meilleurs créateurs de sites web IA
- Outils sans code et innovations en IA
- Dans quelle mesure l'utilisation de l'IA augmente-t-elle la productivité de votre équipe ?
- Comment utiliser ChatGTP pour la recherche de marché ?
- Comment élargir la portée de votre campagne de marketing par IA ?
- L'IA dans le transport et la logistique
- Quels problèmes commerciaux l'IA peut-elle résoudre ?
- Comment associez-vous une solution d'IA à un problème commercial ?
- L'intelligence artificielle dans les médias
- L'IA dans la banque et la finance. Stripe, Monzo et Grab
- L'IA dans l'industrie du voyage
- Comment l'IA favorise la naissance de nouvelles technologies
- L'IA dans le commerce électronique. Aperçu des leaders mondiaux
- Top 4 outils de création d'images par IA
- Top 5 outils d'IA pour l'analyse des données
- La révolution de l'IA dans les médias sociaux
- Est-il toujours utile d'ajouter de l'intelligence artificielle au processus de développement de produit ?
- 6 plus grands incidents commerciaux causés par l'IA
- Stratégie d'IA dans votre entreprise - comment la construire ?
- Meilleurs cours d'IA – 6 recommandations incroyables
- Optimiser l'écoute des médias sociaux avec des outils d'IA
- IoT + IA, ou comment réduire les coûts énergétiques dans une entreprise
- L'IA dans la logistique. 5 meilleurs outils
- GPT Store – un aperçu des GPT les plus intéressants pour les entreprises
- LLM, GPT, RAG... Que signifient les acronymes de l'IA ?
- Les robots IA – l'avenir ou le présent des affaires ?
- Quel est le coût de la mise en œuvre de l'IA dans une entreprise ?
- Que font les spécialistes en intelligence artificielle ?
- Comment l'IA peut-elle aider dans la carrière d'un freelance ?
- Automatiser le travail et augmenter la productivité. Un guide de l'IA pour les freelances
- IA pour les startups – meilleurs outils
- Créer un site web avec l'IA
- Eleven Labs et quoi d'autre ? Les startups d'IA les plus prometteuses
- OpenAI, Midjourney, Anthropic, Hugging Face. Qui est qui dans le monde de l'IA ?
- Données synthétiques et leur importance pour le développement de votre entreprise
- Moteurs de recherche IA de premier plan. Où chercher des outils d'IA ?
- Vidéo IA. Les derniers générateurs de vidéos IA
- IA pour les managers. Comment l'IA peut faciliter votre travail
- Quoi de neuf dans Google Gemini ? Tout ce que vous devez savoir
- IA en Pologne. Entreprises, réunions et conférences
- Calendrier IA. Comment optimiser votre temps dans une entreprise ?
- IA et l'avenir du travail. Comment préparer votre entreprise au changement ?
- Clonage vocal par IA pour les entreprises. Comment créer des messages vocaux personnalisés avec l'IA ?
- "Nous sommes tous des développeurs". Comment les développeurs citoyens peuvent-ils aider votre entreprise ?
- Vérification des faits et hallucinations de l'IA
- L'IA dans le recrutement – développement des matériaux de recrutement étape par étape
- Sora. Comment les vidéos réalistes d'OpenAI vont-elles changer les affaires ?
- Midjourney v6. Innovations dans la génération d'images par IA
- L'IA dans les PME. Comment les PME peuvent-elles rivaliser avec les géants en utilisant l'IA ?
- Comment l'IA transforme-t-elle le marketing d'influence ?
- L'IA est-elle vraiment une menace pour les développeurs ? Devin et Microsoft AutoDev
- Meilleurs chatbots IA pour le commerce électronique. Plates-formes
- Chatbots IA pour le commerce électronique. Études de cas
- Comment rester au courant de ce qui se passe dans le monde de l'IA ?
- Domestiquer l'IA. Comment faire les premiers pas pour appliquer l'IA dans votre entreprise ?
- Perplexité, Bing Copilot ou You.com ? Comparaison des moteurs de recherche IA
- Experts en IA en Pologne
- ReALM. Un modèle de langage révolutionnaire d'Apple ?
- Google Genie — un modèle d'IA générative qui crée des mondes entièrement interactifs à partir d'images
- Automatisation ou augmentation ? Deux approches de l'IA dans une entreprise
- LLMOps, ou comment gérer efficacement les modèles de langage dans une organisation
- Génération de vidéos par IA. Nouveaux horizons dans la production de contenu vidéo pour les entreprises.
- Meilleurs outils de transcription IA. Comment transformer de longs enregistrements en résumés concis ?
- Analyse des sentiments avec l'IA. Comment cela aide-t-il à provoquer des changements dans les entreprises ?
- Le rôle de l'IA dans la modération de contenu