Skip to content

Google Cloud & Vertex AI (+ OpenAI-kompatibler Proxy)

Vertex AI ist Googles Plattform für Text- und Multimodal-Modelle (Gemini) sowie ASR und TTS, alles in einer Oberfläche mit EU-Regionen. Admin Bud-E enthält einen kleinen OpenAI-kompatiblen Proxy, sodass Clients Vertex/Gemini wie die OpenAI-API ansprechen können — der Proxy übersetzt im Hintergrund.

Was bedeutet "OpenAI-kompatibel"?

Der Begriff "OpenAI-kompatibel" bedeutet, dass die API dieselben Endpunkte und Datenformate wie die OpenAI API verwendet:

  • Endpunkt: POST /v1/chat/completions
  • Authentifizierung: Authorization: Bearer <API_KEY>
  • Request/Response-Format: JSON mit messages, model, temperature usw.

Dies ermöglicht es Entwicklern, vorhandenen Code, der für OpenAI geschrieben wurde, mit minimalem Anpassungsaufwand für andere Anbieter (wie Vertex AI) zu nutzen.

Was ist Vertex AI?

Vertex AI ist Googles einheitliche ML-Plattform, die u.a. folgende Dienste bietet:

  • Gemini-Modelle (LLM/VLM): Leistungsstarke Sprachmodelle
  • Cloud Text-to-Speech: Natürlich klingende Sprachausgabe
  • Cloud Speech-to-Text: Präzise Transkription
  • EU-Regionen: Datenverarbeitung in Europa möglich

Integrierter Proxy

Admin Bud-E enthält einen integrierten Proxy, der:

  1. OpenAI-Format-Anfragen empfängt
  2. Diese automatisch zu Vertex AI-Format konvertiert
  3. Die Antworten zurück ins OpenAI-Format übersetzt
  4. Nutzung erfasst und Credits abbucht

Vorteil

Sie müssen keine separate Proxy-Software installieren – alles ist bereits in Admin Bud-E integriert!

Schritt-für-Schritt-Anleitung

4.1 Google-Projekt anlegen

  1. Gehen Sie zur Google Cloud Console
  2. Melden Sie sich mit Ihrem Google-Konto an
  3. Klicken Sie oben links auf Projekt auswählen
  4. Klicken Sie auf NEUES PROJEKT
  5. Geben Sie einen Projektnamen ein (z.B. "School-Bud-E-Production")
  6. Wählen Sie ggf. eine Organisation aus
  7. Klicken Sie auf ERSTELLEN

Startguthaben

Neue Google Cloud-Konten erhalten häufig $300 Startguthaben für 90 Tage.

4.2 Abrechnung aktivieren

  1. Navigieren Sie zu Abrechnung im Menü
  2. Verknüpfen Sie das Projekt mit einem Rechnungskonto
  3. Falls noch kein Rechnungskonto existiert, erstellen Sie eines

Wichtig

Ohne aktive Abrechnung können Sie die APIs nicht nutzen.

4.3 APIs aktivieren

Aktivieren Sie folgende APIs für Ihr Projekt:

Vertex AI API

  1. Gehen Sie zu APIs & Dienste > Bibliothek
  2. Suchen Sie nach "Vertex AI API"
  3. Klicken Sie auf AKTIVIEREN

Cloud Text-to-Speech API (optional für TTS)

  1. Suchen Sie nach "Cloud Text-to-Speech API"
  2. Klicken Sie auf AKTIVIEREN

Cloud Speech-to-Text API (optional für ASR)

  1. Suchen Sie nach "Cloud Speech-to-Text API"
  2. Klicken Sie auf AKTIVIEREN

4.4 Service-Account erstellen & JSON-Key herunterladen

  1. Navigieren Sie zu IAM & Verwaltung > Dienstkonten
  2. Klicken Sie auf DIENSTKONTO ERSTELLEN
  3. Geben Sie einen Namen ein (z.B. "bud-e-middleware")
  4. Optional: Beschreibung hinzufügen
  5. Klicken Sie auf ERSTELLEN UND FORTFAHREN

Rollen zuweisen

Fügen Sie folgende Rollen hinzu:

  • Vertex AI-Nutzer (Vertex AI User)
  • Cloud Text-to-Speech-Nutzer (falls TTS genutzt wird)
  • Cloud Speech-Nutzer (falls ASR genutzt wird)

Klicken Sie auf FERTIG

JSON-Schlüssel herunterladen

  1. Klicken Sie auf das erstellte Dienstkonto
  2. Wechseln Sie zum Tab SCHLÜSSEL
  3. Klicken Sie auf SCHLÜSSEL HINZUFÜGEN > Neuen Schlüssel erstellen
  4. Wählen Sie JSON als Schlüsseltyp
  5. Klicken Sie auf ERSTELLEN

Sicherheit

Der JSON-Schlüssel wird automatisch heruntergeladen. Bewahren Sie ihn sicher auf! Teilen Sie ihn niemals öffentlich oder in einem Git-Repository.

4.5 Regionen & Modelle wählen

Für DSGVO-konforme Setups wählen Sie EU-Regionen:

Empfohlene EU-Regionen

  • europe-west1 (Belgien)
  • europe-west3 (Frankfurt)
  • europe-west4 (Niederlande)
  • europe-west9 (Paris)

Verfügbare Modelle

Prüfen Sie die Verfügbarkeit in Ihrer Region:

  • Gemini 1.5 Pro: Hohe Leistung, große Kontextfenster
  • Gemini 1.5 Flash: Schneller, kosteneffizienter
  • Gemini 2.0 Flash: Neueste Version mit verbesserter Leistung

Modell-Verfügbarkeit

Prüfen Sie die Vertex AI Locations-Dokumentation für aktuelle Informationen zur Modellverfügbarkeit in verschiedenen Regionen.

4.6 Anbindung in Admin Bud-E

Provider hinzufügen

  1. Öffnen Sie das Admin-Dashboard (/admin)
  2. Navigieren Sie zu Providers
  3. Klicken Sie auf Add Provider
  4. Füllen Sie folgende Felder aus:
FeldWert
Namevertex (exakt so!)
Base URLIhre Vertex-Endpoint-URL
API KeyInhalt der JSON-Schlüsseldatei
Regionz.B. europe-west4

Name ist wichtig!

Der Provider-Name muss exakt vertex lauten, damit der integrierte Proxy funktioniert.

Routen konfigurieren

  1. Navigieren Sie zu Routes
  2. Definieren Sie Prioritätsketten für jeden Typ:

LLM-Route Beispiel:

Priority 1: vertex (gemini-1.5-pro)
Priority 2: together (meta-llama)

VLM-Route Beispiel:

Priority 1: vertex (gemini-1.5-flash)

TTS-Route Beispiel:

Priority 1: vertex (de-DE-Neural2-C)

ASR-Route Beispiel:

Priority 1: vertex (chirp)

Failover

Bei Fehlern (429/5xx) wechselt Admin Bud-E automatisch zum nächsten Provider in der Prioritätsliste.

4.7 Pricing festlegen

Navigieren Sie zu Pricing und tragen Sie die Modellpreise ein:

LLM/VLM Preise

Preise werden pro 1.000.000 Tokens angegeben:

ModellInput (pro 1M Tokens)Output (pro 1M Tokens)
Gemini 1.5 Pro$1.25$5.00
Gemini 1.5 Flash$0.075$0.30
Gemini 2.0 Flash$0.10$0.40

TTS Preise

Preise werden pro Zeichen angegeben:

  • Standard-Stimmen: ~$0.000004 pro Zeichen
  • Neural2-Stimmen: ~$0.000016 pro Zeichen
  • WaveNet-Stimmen: ~$0.000016 pro Zeichen

ASR Preise

Preise werden pro Stunde Audio angegeben:

  • Standard: ~$0.006 pro Stunde (15 Sekunden)
  • Enhanced: ~$0.009 pro Stunde (15 Sekunden)

Aktuelle Preise

Die Preise können sich ändern. Prüfen Sie die aktuellen Preise auf der Google Cloud Pricing-Seite.

Testen der Konfiguration

  1. Erstellen Sie einen Testnutzer in Users
  2. Generieren Sie einen API-Key
  3. Verwenden Sie den Key im Frontend
  4. Senden Sie eine Testanfrage
  5. Prüfen Sie in Usage, ob die Anfrage korrekt erfasst wurde

Erfolgreich?

Wenn die Anfrage in den Usage Reports erscheint, funktioniert alles korrekt!

Weitere Anbieter hinzufügen

Alternativen wie Together oder Mistral bindet man analog ein:

  1. Provider anlegen (Name, Base-URL, API-Key)
  2. In Routes als Alternative oder Fallback hinzufügen
  3. Pricing konfigurieren

Mehr Informationen

Details zu anderen Providern finden Sie unter Provider und Routen.