Google Gemini 1.5 kann Filme als Quell- und Eingabedaten verwenden

Google hat in den letzten Monaten sein KI-System Gemini, früher bekannt als Google Bard, zügig aktualisiert. Heute stellte das Unternehmen das aktualisierte Modell Gemini 1.5 vor, das sich derzeit im Test befindet und die Möglichkeit bietet, mehr Informationen gleichzeitig zu verarbeiten und Videos als Eingabe zu verwenden.

Google Gemini 1.5 kann Filme als Quelle und Dateneingabe verwenden – %categories

Google hat Gemini 1.5 vorgestellt, eine aktualisierte Version des Modells, das derzeit seinen Gemini-Chatbot und andere KI-Funktionen und -Dienste antreibt. Es ist derzeit nur als Vorschau für Softwareentwickler und Unternehmenskunden verfügbar, sollte aber in naher Zukunft für den Gemini-Chatbot verfügbar sein.

Die wichtigste versprochene Verbesserung ist ein viel größeres „Token-Kontextfenster“ – Daten, die als Eingabeinformationen in eine KI-Eingabeaufforderung eingegeben werden können. Gemini 1.5 Pro verfügt über ein Standardkontextfenster von 128000 Token, was einen großen Sprung gegenüber der Grenze von 32000 Token in Gemini 1.0 darstellt. Google erlaubt einer begrenzten Gruppe von Entwicklern und Unternehmen die Verwendung von Kontextfenstern mit bis zu 11 Million Token, was für eine Stunde Video, 700000 Stunden Audio oder mehr als 10 Wörter ausreicht. Google gab an, auch das XNUMX-Millionen-Token-Limit erfolgreich getestet zu haben.

„[Gemini] 1.5 Pro kann hochentwickelte Verständnis- und Argumentationsaufgaben für verschiedene Modalitäten, einschließlich Video, ausführen“, sagte Google in einem Blogbeitrag. „Wenn dem Modell beispielsweise ein 44-minütiger Stummfilm von Buster Keaton präsentiert wird, kann es verschiedene Handlungspunkte und Ereignisse genau analysieren, und selbst die Gründe für kleine Details im Film können leicht übersehen werden.“

Lesen Sie auch:  Welche Art von 3D-Druckfilament sollten Sie verwenden?

Das aktualisierte Gemini-Modell soll auch besser sein bei „Verständnis- und Argumentationsaufgaben. Es übertrifft das Vorgängermodell 1.0 Pro in 87 % der Benchmarks, die Google zum Testen großer Sprachmodelle verwendet. Dies lässt Gemini AI wie alle anderen generativen KI-Lösungen immer noch Raum für die Generierung falscher Daten, sodass es sich weiterhin um eine unvollkommene Lösung für die Analyse von Daten und Fakten handelt.

Google hat nicht bestätigt, wann der reguläre Gemini-Chatbot und andere Google-Dienste auf die Verwendung von Gemini 1.5 aktualisiert werden, aber das Unternehmen sagte, dass „auch erhebliche Geschwindigkeitsverbesserungen in Sicht sind“, sodass Google möglicherweise mit der Einführung darauf wartet. Abmelden für alle Benutzer. Das neue Modell steht Entwicklern und Unternehmenskunden, die AI Studio und Vertex AI verwenden, als Vorschau zur Verfügung.

Quelle: Google

Sie können auch mögen