Gemini 1.5 Pro 2M, Codeausführungsfunktionen und Gemma 2 für Entwickler freigeschaltet

Google Gemini
Quelle: Google

Google hat seine Large Language Models (LLMs) Gemini 1.5 Pro und Flash mit neuen Funktionen ausgestattet, die Entwicklern mehr Flexibilität und Leistung bieten sollen.

Zu den wichtigsten Neuerungen gehören ein 2-Millionen-Token-Kontextfenster, Codeausführungsfunktionen und die Verfügbarkeit von Gemma 2 in Google AI Studio.

Erweitertes Kontextfenster für komplexere Aufgaben

Entwickler haben jetzt Zugriff auf das bisher längste Kontextfenster (2 Millionen Token) in Gemini 1.5 Pro. Dies ermöglicht die Bewältigung komplexerer und nuancierterer Aufgaben, die ein tieferes Verständnis des Kontexts erfordern. Um die Kosten zu senken, führt Google außerdem das Kontext-Caching ein. Diese Funktion ermöglicht die Wiederverwendung von Token über mehrere Eingabeaufforderungen hinweg, was die Effizienz und Wirtschaftlichkeit von Anwendungen verbessern kann.

Codeausführung für mathematische und Datenschlussfolgerungsprobleme

Sowohl Gemini 1.5 Pro als auch 1.5 Flash können jetzt Python-Code generieren und ausführen. Dies erweitert ihre Anwendungsbereiche auf Aufgaben, die mathematische oder logische Schlussfolgerungen erfordern, die zuvor für LLMs schwierig waren. Die Codeausführung erfolgt in einer sicheren Sandbox und wird standardmäßig mit numerischen Bibliotheken geliefert. Entwickler werden auf Basis der Ausgabetoken des Modells abgerechnet.

Gemma 2 in Google AI Studio für einfaches Onboarding

Das leichtgewichtige LLM Gemma 2 ist jetzt in Google AI Studio verfügbar. Dies soll Entwicklern den Einstieg in die Arbeit mit dem Modell erleichtern und die Nutzung seiner Fähigkeiten für verschiedene Anwendungsfälle ermöglichen.

Gemini 1.5 Flash in Produktion mit vielfältigen Anwendungen

Entwickler nutzen Gemini 1.5 Flash bereits in verschiedenen Anwendungen, die von der Barrierefreiheit bis hin zur Datenanalyse reichen. Zu den bemerkenswerten Beispielen gehören:

  • Envision: Bietet blinden oder sehbehinderten Menschen Echtzeitbeschreibungen ihrer Umgebung mithilfe einer App oder Smart Glasses.
  • Plural: Fasst komplexe Gesetzesdokumente für NGOs und Bürger zusammen, um die politische Entscheidungsfindung zu unterstützen.
  • Zapier: Extrahiert Details aus Rohvideomaterial, um neue Automatisierungsmöglichkeiten für die Videobearbeitung zu ermöglichen.
  • Dot: Ermöglicht einer KI, im Laufe der Zeit zu lernen und sich zu personalisieren, um ein umfassenderes und hilfreicheres Assistenzsystem zu werden.

Tuning für Gemini 1.5 Flash zur weiteren Optimierung

Das Text-Tuning für Gemini 1.5 Flash wird ab heute schrittweise für Entwickler eingeführt. Bis Mitte Juli können alle Entwickler über die Gemini-API und Google AI Studio auf das Tuning zugreifen. Dieses Tuning soll die Leistung und Effizienz des Modells weiter verbessern und seine Anwendungsbereiche erweitern.

Quelle(n):
Google

Links mit einem * sind Partner-Links. Durch einen Klick darauf ge­lan­gt ihr direkt zum Anbieter. Solltet ihr euch dort für einen Kauf entscheiden, erhalte ich ei­ne kleine Provision. Für euch ändert sich am Preis nichts. Danke für eure Unterstützung!

Um über alle News auf dem Laufenden zu bleiben, folge mir auf Google News oder Facebook, abonniere meinen Telegram-, WhatsApp-, X/Twitter- oder Mastodon-Kanal oder RSS-Feed!

Der einzige Tech-Newsletter, den Du brauchst

Abonniere Schmidtis Blog, um tägliche Updates der neuesten Artikel direkt in Deinem Posteingang zu erhalten

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert