Google Gemini 1.5 peut utiliser des films comme source et données d'entrée

Google a rapidement mis à jour son système Gemini AI, anciennement connu sous le nom de Google Bard, au cours des derniers mois. Aujourd'hui, la société a dévoilé le modèle Gemini 1.5 mis à jour actuellement en cours de test, avec la possibilité de traiter plus d'informations à la fois et d'utiliser des clips vidéo comme entrée.

Google a dévoilé Gemini 1.5, une version mise à jour du modèle qui alimente actuellement son chatbot Gemini et d'autres fonctionnalités et services d'IA. Il n'est actuellement disponible qu'en version préliminaire pour les développeurs de logiciels et les entreprises clientes, mais devrait être déployé prochainement sur le chatbot Gemini.

La principale amélioration promise est une « fenêtre contextuelle de jeton » beaucoup plus grande – des données qui peuvent être saisies dans une invite d’IA. Gemini 1.5 Pro dispose d'une fenêtre contextuelle standard de 128000 32000 jetons, ce qui représente un bond considérable par rapport à la limite de 1.0 11 jetons de Gemini 700000. Google autorise un groupe limité de développeurs et d'entreprises à utiliser des fenêtres contextuelles pouvant contenir jusqu'à 10 million de jetons, ce qui est suffisant pour une heure de vidéo, XNUMX heures d'audio ou plus de XNUMX XNUMX mots. Google a déclaré avoir également testé avec succès la limite de XNUMX millions de jetons.

"[Gemini] 1.5 Pro peut effectuer des tâches de compréhension et de raisonnement très sophistiquées pour différentes modalités, y compris la vidéo", a déclaré Google dans un article de blog. "Par exemple, lorsqu'on lui présente un film muet de 44 minutes de Buster Keaton, le modèle peut analyser avec précision divers points et événements de l'intrigue, et même les raisons de petits détails du film peuvent facilement passer inaperçues."

Lisez aussi: 15 conseils pour augmenter votre productivité lorsque vous travaillez à domicile

Le modèle Gemini mis à jour est également censé être meilleur en «Tâches de compréhension et de raisonnement. Il surpasse le précédent modèle 1.0 Pro dans 87 % des tests que Google utilise pour tester de grands modèles de langage. Cela laisse encore la possibilité à Gemini AI de générer des données incorrectes, comme toutes les autres solutions d'IA générative, elle reste donc une solution imparfaite pour l'analyse des données et des faits.

Google n'a pas confirmé quand le chatbot Gemini habituel et d'autres services Google seront mis à jour pour utiliser Gemini 1.5, mais la société a déclaré que "des améliorations significatives de la vitesse sont également à l'horizon", donc Google attend peut-être cela avant de le déployer. Déconnexion pour tous les utilisateurs. Le nouveau modèle est disponible en version préliminaire pour les développeurs et les entreprises utilisant AI Studio et Vertex AI.

مصدر: Google

GEMINI Google Gémeaux 1.5