Gemini – Googles neuer Stern am KI-Himmel

Google Gemini AI

Google hat mit der Ende letzter Woche vorgestellten neuen KI “Gemini” ein neues Zeitalter der künstlichen Intelligenz (KI) eingeläutet. Dieses KI-Modell, das als Ergebnis umfangreicher kollaborativer Bemühungen innerhalb von Google und Google Research entstanden ist, zeichnet sich durch seine Fähigkeit aus, eine Vielzahl von Informationsarten – Text, Code, Audio, Bilder und Videos – gleichzeitig zu verstehen und nahtlos zu kombinieren.

Vorstellung von Gemini

Sundar Pichai, CEO von Google und Alphabet, und Demis Hassabis, CEO und Mitbegründer von Google DeepMind, stellen nun das neue KI-Modell Gemini vor, welche das Ergebnis umfangreicher kollaborativer Bemühungen innerhalb des Konzerns ist. Gemini, das von Grund auf als multimodales Modell entwickelt wurde, kann unterschiedliche Informationsarten wie Text, Code, Audio, Bild und Video verstehen und kombinieren. Gemini ist dabei flexibel und skalierbar und kann von Rechenzentren bis zu mobilen Geräten effizient betrieben werden.

Die erste Version, Gemini 1.0 übertrifft in verschiedenen Benchmarks die bisherigen Spitzenleistungen von ChatGPT und anderen Produkten und es handelt sich gleichzeitig um das erste Modell, das menschliche Experten im MMLU (Massive Multitask Language Understanding) Benchmark übertrifft.

Das KI-Modell versteht nuancierte Informationen besser und kann auch Fragen zu komplexen Themen beantworten. Dadurch ist es besonders effektiv beim Erklären von Überlegungen in anspruchsvollen Fachgebieten wie Mathematik und Physik. Gemini ist darauf ausgelegt, komplexe geschriebene und visuelle Informationen zu verstehen und bietet fortschrittliche Fähigkeiten, z.B. auch im Bereich der Programmierung.

Klar werden die neu erlernten Fähigkeiten im folgenden Google Promotion-Video:

Video 1: Google Gemini – Der neue Stern am KI-Himmel?

* Kleiner Nachtrag zum gezeigten Video: Google hat mittlerweile (eine Woche später) selbst eingelenkt, dass die Präsentation nicht in Echtzeit durchgeführt wurde, wie es das Video suggeriert. Insofern werden hier falsche Tatsachen vorgespielt, was Google heftige Kritik eingebracht hat. Dennoch handelt es sich bei Gemini um ein äusserst bemerkenswertes KI-Modell mit enormen Fähigkeiten.

Die drei Varianten von Gemini

Gemini wurde in drei verschiedenen Größenmodellen entwickelt, um unterschiedliche Anforderungen und Systeme abzudecken:

Benchmark-Ergebnisse und Leistungsvergleich

Gemini Ultra hat in mehreren akademischen Benchmarks herausragende Leistungen gezeigt, darunter das Übertreffen von menschlichen Experten im MMLU-Benchmark. Zudem erreichte es im MMMU-Benchmark einen Spitzenwert von 59,4%. Diese Ergebnisse unterstreichen die Fähigkeit von Gemini, komplexe, multidisziplinäre und multimodale Aufgaben zu bewältigen.

Integration in Googles Produktlandschaft

Gemini wird in einer Vielzahl von Google-Produkten und -Diensten integriert, darunter Bard, Pixel 8 Pro, die Google Suchmaschine, Werbung und den Chrome-Browser. Gemini Nano ist beispielsweise in der Recorder-App des Pixel 8 Pro im Einsatz und ermöglicht Funktionen wie das Vorschlagen von Antworten in verschlüsselten Messaging-Apps. Gemini Pro wird in Google Bard integriert sein, einem Konkurrenten von ChatGPT. Dies zeigt, wie tiefgreifend der Einfluss von Gemini auf das gesamte Spektrum von Googles Angeboten sein wird.

Sicherheit und Datenschutz

Google betont das Engagement für verantwortungsbewusste und sichere KI-Entwicklung und arbeitet kontinuierlich an der Verbesserung der Sicherheit von Gemini.

So unternimmt Google momentan gründliche Überprüfungen in Bezug auf Vertrauen und Sicherheit für ihr KI-Modell Gemini Ultra. Ein wesentlicher Bestandteil dieser Überprüfungen ist das sogenannte Red Teaming. Dabei handelt es sich um eine spezielle Testmethode, bei der externe, vertrauenswürdige Partner die Rolle potenzieller Angreifer einnehmen, um die Sicherheit, Stabilität und Zuverlässigkeit des Systems zu bewerten. Diese externen Teams arbeiten mit Google zusammen, um das Modell durch gezieltes Tuning und das Einbeziehen von menschlichem Feedback in Form von verstärkendem Lernen (Reinforcement Learning from Human Feedback, RLHF) weiter zu verbessern. Diese Schritte sind entscheidend, um sicherzustellen, dass Gemini Ultra bereit für eine breitere öffentliche Nutzung ist.

Zugänglichkeit und Verfügbarkeit für Entwickler

Ab dem 13. Dezember können Entwickler und Unternehmenskunden über Google Generative AI Studio oder Vertex AI in der Google Cloud auf Gemini Pro zugreifen. Die Verfügbarkeit von Gemini Nano ist bereits auf dem Pixel 8 Pro realisiert.

Abschlussbetrachtung und Ausblick

Google Gemini stellt einen bedeutenden Fortschritt in der KI-Technologie dar. Mit seiner Fähigkeit, verschiedene Informationsarten wie Text, Foto, Video und Audio nahtlos miteinander zu integrieren und noch dazu auf einem breiten Spektrum von Geräten zu funktionieren, markiert mit Gemini einen Wendepunkt in der Entwicklung von KI-Modellen. Die vielfältigen Einsatzmöglichkeiten von Gemini, von mobilen Anwendungen bis hin zu komplexen Unternehmenslösungen, deuten auf eine spannende Zukunft in der Welt der KI hin.

Die mobile Version verlassen