Google Cloud & Vertex AI (+ OpenAI-kompatibler Proxy)
Vertex AI ist Googles Plattform für Text- und Multimodal-Modelle (Gemini) sowie ASR und TTS, alles in einer Oberfläche mit EU-Regionen. Admin Bud-E enthält einen kleinen OpenAI-kompatiblen Proxy, sodass Clients Vertex/Gemini wie die OpenAI-API ansprechen können — der Proxy übersetzt im Hintergrund.
Was bedeutet "OpenAI-kompatibel"?
Der Begriff "OpenAI-kompatibel" bedeutet, dass die API dieselben Endpunkte und Datenformate wie die OpenAI API verwendet:
- Endpunkt:
POST /v1/chat/completions - Authentifizierung:
Authorization: Bearer <API_KEY> - Request/Response-Format: JSON mit
messages,model,temperatureusw.
Dies ermöglicht es Entwicklern, vorhandenen Code, der für OpenAI geschrieben wurde, mit minimalem Anpassungsaufwand für andere Anbieter (wie Vertex AI) zu nutzen.
Was ist Vertex AI?
Vertex AI ist Googles einheitliche ML-Plattform, die u.a. folgende Dienste bietet:
- Gemini-Modelle (LLM/VLM): Leistungsstarke Sprachmodelle
- Cloud Text-to-Speech: Natürlich klingende Sprachausgabe
- Cloud Speech-to-Text: Präzise Transkription
- EU-Regionen: Datenverarbeitung in Europa möglich
Integrierter Proxy
Admin Bud-E enthält einen integrierten Proxy, der:
- OpenAI-Format-Anfragen empfängt
- Diese automatisch zu Vertex AI-Format konvertiert
- Die Antworten zurück ins OpenAI-Format übersetzt
- Nutzung erfasst und Credits abbucht
Vorteil
Sie müssen keine separate Proxy-Software installieren – alles ist bereits in Admin Bud-E integriert!
Schritt-für-Schritt-Anleitung
4.1 Google-Projekt anlegen
- Gehen Sie zur Google Cloud Console
- Melden Sie sich mit Ihrem Google-Konto an
- Klicken Sie oben links auf Projekt auswählen
- Klicken Sie auf NEUES PROJEKT
- Geben Sie einen Projektnamen ein (z.B. "School-Bud-E-Production")
- Wählen Sie ggf. eine Organisation aus
- Klicken Sie auf ERSTELLEN
Startguthaben
Neue Google Cloud-Konten erhalten häufig $300 Startguthaben für 90 Tage.
4.2 Abrechnung aktivieren
- Navigieren Sie zu Abrechnung im Menü
- Verknüpfen Sie das Projekt mit einem Rechnungskonto
- Falls noch kein Rechnungskonto existiert, erstellen Sie eines
Wichtig
Ohne aktive Abrechnung können Sie die APIs nicht nutzen.
4.3 APIs aktivieren
Aktivieren Sie folgende APIs für Ihr Projekt:
Vertex AI API
- Gehen Sie zu APIs & Dienste > Bibliothek
- Suchen Sie nach "Vertex AI API"
- Klicken Sie auf AKTIVIEREN
Cloud Text-to-Speech API (optional für TTS)
- Suchen Sie nach "Cloud Text-to-Speech API"
- Klicken Sie auf AKTIVIEREN
Cloud Speech-to-Text API (optional für ASR)
- Suchen Sie nach "Cloud Speech-to-Text API"
- Klicken Sie auf AKTIVIEREN
4.4 Service-Account erstellen & JSON-Key herunterladen
- Navigieren Sie zu IAM & Verwaltung > Dienstkonten
- Klicken Sie auf DIENSTKONTO ERSTELLEN
- Geben Sie einen Namen ein (z.B. "bud-e-middleware")
- Optional: Beschreibung hinzufügen
- Klicken Sie auf ERSTELLEN UND FORTFAHREN
Rollen zuweisen
Fügen Sie folgende Rollen hinzu:
- Vertex AI-Nutzer (Vertex AI User)
- Cloud Text-to-Speech-Nutzer (falls TTS genutzt wird)
- Cloud Speech-Nutzer (falls ASR genutzt wird)
Klicken Sie auf FERTIG
JSON-Schlüssel herunterladen
- Klicken Sie auf das erstellte Dienstkonto
- Wechseln Sie zum Tab SCHLÜSSEL
- Klicken Sie auf SCHLÜSSEL HINZUFÜGEN > Neuen Schlüssel erstellen
- Wählen Sie JSON als Schlüsseltyp
- Klicken Sie auf ERSTELLEN
Sicherheit
Der JSON-Schlüssel wird automatisch heruntergeladen. Bewahren Sie ihn sicher auf! Teilen Sie ihn niemals öffentlich oder in einem Git-Repository.
4.5 Regionen & Modelle wählen
Für DSGVO-konforme Setups wählen Sie EU-Regionen:
Empfohlene EU-Regionen
europe-west1(Belgien)europe-west3(Frankfurt)europe-west4(Niederlande)europe-west9(Paris)
Verfügbare Modelle
Prüfen Sie die Verfügbarkeit in Ihrer Region:
- Gemini 1.5 Pro: Hohe Leistung, große Kontextfenster
- Gemini 1.5 Flash: Schneller, kosteneffizienter
- Gemini 2.0 Flash: Neueste Version mit verbesserter Leistung
Modell-Verfügbarkeit
Prüfen Sie die Vertex AI Locations-Dokumentation für aktuelle Informationen zur Modellverfügbarkeit in verschiedenen Regionen.
4.6 Anbindung in Admin Bud-E
Provider hinzufügen
- Öffnen Sie das Admin-Dashboard (
/admin) - Navigieren Sie zu Providers
- Klicken Sie auf Add Provider
- Füllen Sie folgende Felder aus:
| Feld | Wert |
|---|---|
| Name | vertex (exakt so!) |
| Base URL | Ihre Vertex-Endpoint-URL |
| API Key | Inhalt der JSON-Schlüsseldatei |
| Region | z.B. europe-west4 |
Name ist wichtig!
Der Provider-Name muss exakt vertex lauten, damit der integrierte Proxy funktioniert.
Routen konfigurieren
- Navigieren Sie zu Routes
- Definieren Sie Prioritätsketten für jeden Typ:
LLM-Route Beispiel:
Priority 1: vertex (gemini-1.5-pro)
Priority 2: together (meta-llama)VLM-Route Beispiel:
Priority 1: vertex (gemini-1.5-flash)TTS-Route Beispiel:
Priority 1: vertex (de-DE-Neural2-C)ASR-Route Beispiel:
Priority 1: vertex (chirp)Failover
Bei Fehlern (429/5xx) wechselt Admin Bud-E automatisch zum nächsten Provider in der Prioritätsliste.
4.7 Pricing festlegen
Navigieren Sie zu Pricing und tragen Sie die Modellpreise ein:
LLM/VLM Preise
Preise werden pro 1.000.000 Tokens angegeben:
| Modell | Input (pro 1M Tokens) | Output (pro 1M Tokens) |
|---|---|---|
| Gemini 1.5 Pro | $1.25 | $5.00 |
| Gemini 1.5 Flash | $0.075 | $0.30 |
| Gemini 2.0 Flash | $0.10 | $0.40 |
TTS Preise
Preise werden pro Zeichen angegeben:
- Standard-Stimmen: ~$0.000004 pro Zeichen
- Neural2-Stimmen: ~$0.000016 pro Zeichen
- WaveNet-Stimmen: ~$0.000016 pro Zeichen
ASR Preise
Preise werden pro Stunde Audio angegeben:
- Standard: ~$0.006 pro Stunde (15 Sekunden)
- Enhanced: ~$0.009 pro Stunde (15 Sekunden)
Aktuelle Preise
Die Preise können sich ändern. Prüfen Sie die aktuellen Preise auf der Google Cloud Pricing-Seite.
Testen der Konfiguration
- Erstellen Sie einen Testnutzer in Users
- Generieren Sie einen API-Key
- Verwenden Sie den Key im Frontend
- Senden Sie eine Testanfrage
- Prüfen Sie in Usage, ob die Anfrage korrekt erfasst wurde
Erfolgreich?
Wenn die Anfrage in den Usage Reports erscheint, funktioniert alles korrekt!
Weitere Anbieter hinzufügen
Alternativen wie Together oder Mistral bindet man analog ein:
- Provider anlegen (Name, Base-URL, API-Key)
- In Routes als Alternative oder Fallback hinzufügen
- Pricing konfigurieren