Google Cloud & Vertex AI (+ OpenAI-kompatibler Proxy)

Vertex AI ist Googles Plattform für Text- und Multimodal-Modelle (Gemini) sowie ASR und TTS, alles in einer Oberfläche mit EU-Regionen. Admin Bud-E enthält einen kleinen OpenAI-kompatiblen Proxy, sodass Clients Vertex/Gemini wie die OpenAI-API ansprechen können — der Proxy übersetzt im Hintergrund.

Was bedeutet "OpenAI-kompatibel"?

Der Begriff "OpenAI-kompatibel" bedeutet, dass die API dieselben Endpunkte und Datenformate wie die OpenAI API verwendet:

Endpunkt: POST /v1/chat/completions
Authentifizierung: Authorization: Bearer <API_KEY>
Request/Response-Format: JSON mit messages, model, temperature usw.

Dies ermöglicht es Entwicklern, vorhandenen Code, der für OpenAI geschrieben wurde, mit minimalem Anpassungsaufwand für andere Anbieter (wie Vertex AI) zu nutzen.

Was ist Vertex AI?

Vertex AI ist Googles einheitliche ML-Plattform, die u.a. folgende Dienste bietet:

Gemini-Modelle (LLM/VLM): Leistungsstarke Sprachmodelle
Cloud Text-to-Speech: Natürlich klingende Sprachausgabe
Cloud Speech-to-Text: Präzise Transkription
EU-Regionen: Datenverarbeitung in Europa möglich

Integrierter Proxy

Admin Bud-E enthält einen integrierten Proxy, der:

OpenAI-Format-Anfragen empfängt
Diese automatisch zu Vertex AI-Format konvertiert
Die Antworten zurück ins OpenAI-Format übersetzt
Nutzung erfasst und Credits abbucht

Vorteil

Sie müssen keine separate Proxy-Software installieren – alles ist bereits in Admin Bud-E integriert!

Schritt-für-Schritt-Anleitung

4.1 Google-Projekt anlegen

Gehen Sie zur Google Cloud Console
Melden Sie sich mit Ihrem Google-Konto an
Klicken Sie oben links auf Projekt auswählen
Klicken Sie auf NEUES PROJEKT
Geben Sie einen Projektnamen ein (z.B. "School-Bud-E-Production")
Wählen Sie ggf. eine Organisation aus
Klicken Sie auf ERSTELLEN

Startguthaben

Neue Google Cloud-Konten erhalten häufig $300 Startguthaben für 90 Tage.

4.2 Abrechnung aktivieren

Navigieren Sie zu Abrechnung im Menü
Verknüpfen Sie das Projekt mit einem Rechnungskonto
Falls noch kein Rechnungskonto existiert, erstellen Sie eines

Wichtig

Ohne aktive Abrechnung können Sie die APIs nicht nutzen.

4.3 APIs aktivieren

Aktivieren Sie folgende APIs für Ihr Projekt:

Vertex AI API

Gehen Sie zu APIs & Dienste > Bibliothek
Suchen Sie nach "Vertex AI API"
Klicken Sie auf AKTIVIEREN

Cloud Text-to-Speech API (optional für TTS)

Suchen Sie nach "Cloud Text-to-Speech API"
Klicken Sie auf AKTIVIEREN

Cloud Speech-to-Text API (optional für ASR)

Suchen Sie nach "Cloud Speech-to-Text API"
Klicken Sie auf AKTIVIEREN

4.4 Service-Account erstellen & JSON-Key herunterladen

Navigieren Sie zu IAM & Verwaltung > Dienstkonten
Klicken Sie auf DIENSTKONTO ERSTELLEN
Geben Sie einen Namen ein (z.B. "bud-e-middleware")
Optional: Beschreibung hinzufügen
Klicken Sie auf ERSTELLEN UND FORTFAHREN

Rollen zuweisen

Fügen Sie folgende Rollen hinzu:

Vertex AI-Nutzer (Vertex AI User)
Cloud Text-to-Speech-Nutzer (falls TTS genutzt wird)
Cloud Speech-Nutzer (falls ASR genutzt wird)

Klicken Sie auf FERTIG

JSON-Schlüssel herunterladen

Klicken Sie auf das erstellte Dienstkonto
Wechseln Sie zum Tab SCHLÜSSEL
Klicken Sie auf SCHLÜSSEL HINZUFÜGEN > Neuen Schlüssel erstellen
Wählen Sie JSON als Schlüsseltyp
Klicken Sie auf ERSTELLEN

Sicherheit

Der JSON-Schlüssel wird automatisch heruntergeladen. Bewahren Sie ihn sicher auf! Teilen Sie ihn niemals öffentlich oder in einem Git-Repository.

4.5 Regionen & Modelle wählen

Für DSGVO-konforme Setups wählen Sie EU-Regionen:

Empfohlene EU-Regionen

europe-west1 (Belgien)
europe-west3 (Frankfurt)
europe-west4 (Niederlande)
europe-west9 (Paris)

Verfügbare Modelle

Prüfen Sie die Verfügbarkeit in Ihrer Region:

Gemini 1.5 Pro: Hohe Leistung, große Kontextfenster
Gemini 1.5 Flash: Schneller, kosteneffizienter
Gemini 2.0 Flash: Neueste Version mit verbesserter Leistung

Modell-Verfügbarkeit

Prüfen Sie die Vertex AI Locations-Dokumentation für aktuelle Informationen zur Modellverfügbarkeit in verschiedenen Regionen.

4.6 Anbindung in Admin Bud-E

Provider hinzufügen

Öffnen Sie das Admin-Dashboard (/admin)
Navigieren Sie zu Providers
Klicken Sie auf Add Provider
Füllen Sie folgende Felder aus:

Feld	Wert
Name	`vertex` (exakt so!)
Base URL	Ihre Vertex-Endpoint-URL
API Key	Inhalt der JSON-Schlüsseldatei
Region	z.B. `europe-west4`

Name ist wichtig!

Der Provider-Name muss exakt vertex lauten, damit der integrierte Proxy funktioniert.

Routen konfigurieren

Navigieren Sie zu Routes
Definieren Sie Prioritätsketten für jeden Typ:

LLM-Route Beispiel:

Priority 1: vertex (gemini-1.5-pro)
Priority 2: together (meta-llama)

VLM-Route Beispiel:

Priority 1: vertex (gemini-1.5-flash)

TTS-Route Beispiel:

Priority 1: vertex (de-DE-Neural2-C)

ASR-Route Beispiel:

Priority 1: vertex (chirp)

Failover

Bei Fehlern (429/5xx) wechselt Admin Bud-E automatisch zum nächsten Provider in der Prioritätsliste.

4.7 Pricing festlegen

Navigieren Sie zu Pricing und tragen Sie die Modellpreise ein:

LLM/VLM Preise

Preise werden pro 1.000.000 Tokens angegeben:

Modell	Input (pro 1M Tokens)	Output (pro 1M Tokens)
Gemini 1.5 Pro	$1.25	$5.00
Gemini 1.5 Flash	$0.075	$0.30
Gemini 2.0 Flash	$0.10	$0.40

TTS Preise

Preise werden pro Zeichen angegeben:

Standard-Stimmen: ~$0.000004 pro Zeichen
Neural2-Stimmen: ~$0.000016 pro Zeichen
WaveNet-Stimmen: ~$0.000016 pro Zeichen

ASR Preise

Preise werden pro Stunde Audio angegeben:

Standard: ~$0.006 pro Stunde (15 Sekunden)
Enhanced: ~$0.009 pro Stunde (15 Sekunden)

Aktuelle Preise

Die Preise können sich ändern. Prüfen Sie die aktuellen Preise auf der Google Cloud Pricing-Seite.

Testen der Konfiguration

Erstellen Sie einen Testnutzer in Users
Generieren Sie einen API-Key
Verwenden Sie den Key im Frontend
Senden Sie eine Testanfrage
Prüfen Sie in Usage, ob die Anfrage korrekt erfasst wurde

Erfolgreich?

Wenn die Anfrage in den Usage Reports erscheint, funktioniert alles korrekt!

Weitere Anbieter hinzufügen

Alternativen wie Together oder Mistral bindet man analog ein:

Provider anlegen (Name, Base-URL, API-Key)
In Routes als Alternative oder Fallback hinzufügen
Pricing konfigurieren

Mehr Informationen

Details zu anderen Providern finden Sie unter Provider und Routen.

Google Cloud & Vertex AI (+ OpenAI-kompatibler Proxy) ​

Was bedeutet "OpenAI-kompatibel"? ​

Was ist Vertex AI? ​

Integrierter Proxy ​

Schritt-für-Schritt-Anleitung ​

4.1 Google-Projekt anlegen ​

4.2 Abrechnung aktivieren ​

4.3 APIs aktivieren ​

Vertex AI API ​

Cloud Text-to-Speech API (optional für TTS) ​

Cloud Speech-to-Text API (optional für ASR) ​

4.4 Service-Account erstellen & JSON-Key herunterladen ​

Rollen zuweisen ​

JSON-Schlüssel herunterladen ​

4.5 Regionen & Modelle wählen ​

Empfohlene EU-Regionen ​

Verfügbare Modelle ​

4.6 Anbindung in Admin Bud-E ​

Provider hinzufügen ​

Routen konfigurieren ​

4.7 Pricing festlegen ​

LLM/VLM Preise ​

TTS Preise ​

ASR Preise ​

Testen der Konfiguration ​

Weitere Anbieter hinzufügen ​