;
WEB SIDE STORIES- Site personnel de Guy DERIDET
Web Side Storie
WEB SIDE STORIES

«L'avenir n'est plus ce qu'il était» [Paul Valéry]



Google dévoile son arme secrète contre ChatGPT

La semaine écoulée a encore une fois secoué le petit monde de l’intelligence artificielle. Google Translate s’est transformé en traducteur universel, OpenAI a lancé une nouvelle voix IA, Nano Banana a dopé Photoshop, des robots ont essayé de jouer au ping-pong et une étude de Stanford a sonné l’alarme sur l’avenir des jeunes face à l’IA. C’est un cocktail de nouveautés explosif qui nous a été servi. Une vidéo éclairante de l'excellente chaîne YouTube : Vision I.A. J’ai écrit un article inspiré par cette vidéo, en collaboration avec DIA, mon nouveau navigateur dopé à l’IA.



Image GPT 5
Image GPT 5


Contexte

Google et OpenAI visent le même cap: des assistants “en direct” qui comprennent la voix, voient ce que tu montres (appareil photo, écran) et répondent tout de suite.

Adobe adapte ses outils de création à cette nouvelle donne, la robotique humanoïde progresse, et une étude de Stanford observe déjà des effets sur l’emploi des jeunes. En annexe, vous trouverez un véritable Powerpoint, et en français, s'il vous plait, à propos de cette vidéo et de mon article.


 

 



 

Faits confirmés 

  • Google Translate passe à la traduction en direct: vous pouvez parler dans votre langue et entendre/voir immédiatement la traduction dans celle de votre interlocuteur (plus de 70 langues, déploiement en cours sur Android et iOS). L’application gère les pauses, accents et intonations pour une conversation naturelle.
     
  • OpenAI met en service ses “agents vocaux”: une nouvelle interface pour parler avec une IA au téléphone ou sur le web avec un délai minimal. Elle peut même se connecter au réseau téléphonique (SIP = standard pour relier l’IA aux appels) et comprendre des images envoyées.
     
  • NotebookLM s’ouvre au français: l’outil de Google peut générer des résumés audio et des vidéos explicatives dans 80 langues à partir de vos documents (PDF, notes, etc.). Pratique pour créer des présentations pédagogiques rapidement.
     
  • Adobe privilégie les “meilleurs modèles disponibles”: au lieu de s’appuyer seulement sur son propre moteur, la suite Firefly peut utiliser des modèles d’IA externes (ce qui compte devient le résultat, les droits d’usage et la sécurité, plus que le “nom” du modèle).
Points à nuancer
  • “Nano Banana dans Photoshop”: Nano Banana existe bien comme outil d’édition d’images par IA, mais son intégration directe dans Photoshop n’est pas confirmée. Adobe a annoncé l’ouverture à des modèles externes, sans valider celui‑ci en particulier.
  • Robot ping‑pong “autonome”: les démonstrations (Unitree) sont impressionnantes et montrent une vraie accélération. Certes, des caméras assistent les robots, mais l'important est l'accélération incroyable des réactions des robots, dans un sport où les réflexes sont prédominants.

Tendances qui se dessinent

  • L’assistant “live” devient l’interface par défaut: on parle, on montre, et l’IA répond tout de suite. “Multimodal” signifie simplement voix + images + contexte des applis, le tout ensemble.
     
  • Les suites créatives deviennent des “plateformes”: on orchestre différents modèles d’IA selon le besoin (qualité, coût, droits). L’utilisateur choisit un écosystème fiable plutôt qu’un logo de modèle.
     
  • Robotique: les compétitions structurent les progrès (vision, décision, contrôle). La Chine avance vite; on peut s’attendre à des usages en logistique et services.
  • Emploi: les postes juniors des métiers exposés à l’IA reculent, tandis que les profils plus expérimentés résistent ou progressent, surtout quand l’IA “augmente” le travail au lieu de le remplacer. Voir la note en bas de page.

Impacts pratiques

  • Pour le quotidien et le support client: la traduction en direct et la voix IA vont se généraliser (voyages, accueil, centres d’appels). À prévoir: intégration technique (raccorder l’IA au téléphone et au logiciel client), information claire (“vous parlez à une IA”) et supervision humaine.
     
  • Pour la création de contenus: avec des outils plus “ouverts”, on choisit selon les droits, la sécurité, l’ergonomie et le coût. Les résumés audio/vidéo et des voix plus naturelles vont accélérer la production, mais il faudra garder des règles de vérification.
     
  • Pour les carrières: côté juniors, la valeur se déplace vers l’assemblage de solutions (faire “appeler des fonctions” = demander à l’IA d’exécuter des actions concrètes), le travail avec les données et le contrôle qualité. Côté seniors, l’IA démultiplie la productivité et la responsabilité.
À retenir
  • Le “temps réel” est devenu une norme: on parle, on montre et l’IA agit.
  • Les grands outils se transforment en plateformes d’orchestration.
     
  • L'impact sur l'emploi touche d’abord les débuts de carrière; la clé est d’apprendre à concevoir, piloter et vérifier les systèmes, pas seulement à exécuter des tâches répétitives.
     

Addendum

— Mise à jour NotebookLM — 

NotebookLM peut désormais générer des présentations “type PowerPoint” en français à partir de vos documents (notes, PDFs, images). Pratique pour illustrer un article, un cours ou un brief sans y passer des heures: vous sélectionnez les sources, vous choisissez la langue, et vous récupérez des diapositives structurées avec texte et visuels. Regardez le PowerPoint en français réalisé par NotebookLM, c'est très étonnant.
 

— Glossaire express — 

Assistant “live” (ou en direct): un assistant qui vous répond tout de suite à l’oral, peut voir ce que vous montrez (appareil photo, capture d’écran) et agir dans tes applications. 

Multimodal: l’IA comprend plusieurs “modes” à la fois: la voix, le texte, les images, parfois la vidéo. 

SIP (téléphonie): un standard qui permet de relier une IA au réseau téléphonique pour passer/recevoir des appels. 

Agent vocal: une application qui vous parle et vous écoute, connectée à des données ou à des outils (ex. agenda, CRM) pour faire des actions. 

Function calling (appel de fonction): demander à l’IA d’exécuter une action concrète (ex.: “crée un rendez-vous”, “envoie un email”) plutôt que de juste répondre en texte. 

Orchestrer des modèles: choisir le “bon” modèle d’IA au bon moment (qualité, coût, droits d’usage) au sein d’un même outil. Gemini (Google): la famille de modèles d’IA utilisée dans Translate, Gemini Live, NotebookLM, etc. 

Realtime API (OpenAI): l’interface pour créer des agents vocaux “temps réel” (latence faible, voix naturelle, connexion téléphonique). 

NotebookLM (Google): outil pour résumer et expliquer tes propres sources, avec exports audio/vidéo et présentations en plusieurs langues. 

Firefly (Adobe): la suite d’IA créative d’Adobe; elle peut s’appuyer sur plusieurs modèles d’IA (y compris externes) au sein de Photoshop et consorts.
 

Sources:

  1. Annonce Google Translate: traduction en direct et pratique de langues; détails de déploiement. ​⁠https://blog.google/products/translate/language-learning-live-translate/
     
  2. OpenAI Realtime API et modèle gpt‑realtime (SIP, image input, voix naturelles); cas d’usage T‑Mobile. ​⁠https://openai.com/index/introducing-gpt-realtime
  3. Gemini Live: intégrations apps Google, guidance visuelle, amélioration de la voix. ​⁠https://blog.google/products/gemini/gemini-live-updates-august-2025/
  4. NotebookLM: Audio/Video Overviews en 80 langues, y compris le français. ​⁠https://blog.google/technology/google-labs/notebook-lm-audio-video-overviews-more-languages-longer-content/
     
  5. Couverture TechCrunch de l’extension des Video Overviews. ​⁠https://techcrunch.com/2025/08/25/notebooklms-video-overview-feature-now-supports-80-languages/
     
  6. Adobe Firefly: intégration de modèles OpenAI et Google (stratégie plateforme). ​⁠https://www.reuters.com/business/adobe-adds-ai-models-openai-google-its-firefly-app-2025-04-24/
     
  7. Robotique humanoïde: performances Unitree et World Humanoid Robot Games. ​⁠https://www.bloomberg.com/news/features/2025-08-16/unitree-robotics-china-s-top-rival-to-tesla-bot-headlines-humanoid-robot-games jusqu'au bout
     
  8. Marché du travail et IA: “Canaries in the Coal Mine?” (Stanford Digital Economy Lab). ​⁠https://digitaleconomy.stanford.edu/publications/canaries-in-the-coal-mine/
     
  9. Synthèse presse des résultats de l’étude Stanford. ​⁠https://time.com/7312205/ai-jobs-stanford/
     
  10. Fiche Nano Banana (outil d’édition d’images IA). ​⁠https://nanobanana.ai/
     
  11. Article de blog mentionnant “Nano Banana” et confusion de dénomination. ​⁠https://medium.com/the-generator/i-tested-googles-new-nano-banana-image-ai-and-it-s-insane-826d23f7f9a7
N.B :

L'article sur le marché du travail et l’IA ainsi que sa synthèse presse feront l’objet d’un prochain article sur ce site.


Dimanche 7 Septembre 2025

Lu 119 fois

Genspark A.I Browser - 12/08/2025

1 2 3 4 5 » ... 7

Mode d'emploi de ce site | Edito | Humour | Santé | Intelligence Artificielle | Covid-19 | Informatique | Sexualité | Politique | Coup de gueule | Coup de coeur | Voyages | Divers | Télécoms | Ordiphones | Musique | Archives | Dernières nouvelles | Bons plans | Belles annonces | Environnement | Partenaires