Preise
Das Pricing-Modul ermöglicht es Ihnen, Modellpreise zu hinterlegen, die für die Credit-Abrechnung verwendet werden. Die Preise werden je nach Technologie unterschiedlich angegeben: LLM/VLM pro 1.000.000 Tokens, TTS pro Zeichen, ASR pro Stunde (Fallback).
Preiseinheiten
Admin Bud-E verwendet technologiespezifische Einheiten für maximale Transparenz:
| Technologie | Einheit | Beschreibung |
|---|---|---|
| LLM/VLM | Pro 1.000.000 Tokens | Getrennte Preise für Input und Output |
| TTS | Pro Zeichen | Jedes Zeichen (inkl. Leerzeichen) zählt |
| ASR | Pro Stunde Audio | Fallback, wenn Provider keine Tokens meldet |
Pricing konfigurieren
- Öffnen Sie das Admin-Dashboard
- Navigieren Sie zu Pricing
- Wählen Sie den Provider und das Modell
- Tragen Sie die Preise ein
LLM/VLM Pricing
Für Text- und multimodale Modelle werden zwei Preise benötigt:
| Feld | Beschreibung |
|---|---|
| Input Price | Kosten pro 1.000.000 Input-Tokens |
| Output Price | Kosten pro 1.000.000 Output-Tokens |
Warum zwei Preise?
Output-Tokens sind meist teurer, da die Generierung rechenintensiver ist als das Verarbeiten von Input.
TTS Pricing
Für Text-to-Speech wird ein einfacher Preis pro Zeichen angegeben:
| Feld | Beschreibung |
|---|---|
| Price per Character | Kosten pro Zeichen (z.B. 0.000016) |
Umrechnung
Meist werden TTS-Preise pro 1 Million Zeichen angegeben. Teilen Sie durch 1.000.000 für den Preis pro Zeichen.
Beispiel: $16 pro 1M Zeichen = $0.000016 pro Zeichen
ASR Pricing
Für Automatic Speech Recognition gibt es zwei Modi:
Token-basiert (bevorzugt)
Wenn der Provider Token-Nutzung meldet:
| Feld | Beschreibung |
|---|---|
| Input Price | Kosten pro 1.000.000 Tokens |
| Output Price | Meist 0, da ASR nur Input verarbeitet |
Zeit-basiert (Fallback)
Wenn keine Token-Daten verfügbar:
| Feld | Beschreibung |
|---|---|
| Price per Hour | Kosten pro Stunde Audio |
Beispiel-Preise
Google Vertex AI (Gemini)
LLM Modelle
| Modell | Input (pro 1M Tokens) | Output (pro 1M Tokens) |
|---|---|---|
| gemini-1.5-pro | $1.25 | $5.00 |
| gemini-1.5-flash | $0.075 | $0.30 |
| gemini-2.0-flash | $0.10 | $0.40 |
Cloud TTS
| Stimm-Typ | Preis pro Zeichen |
|---|---|
| Standard | $0.000004 |
| Neural2 | $0.000016 |
| WaveNet | $0.000016 |
Cloud Speech-to-Text
| Modell | Preis (15-Sekunden-Inkrement) |
|---|---|
| Standard | $0.006 pro Stunde |
| Enhanced | $0.009 pro Stunde |
| Chirp | $0.012 pro Stunde |
Aktuelle Preise
Preise können sich ändern. Prüfen Sie die Google Cloud Pricing-Seite.
Together AI
| Modell | Input (pro 1M Tokens) | Output (pro 1M Tokens) |
|---|---|---|
| Llama-3.1-405B | $5.00 | $5.00 |
| Llama-3.1-70B | $0.88 | $0.88 |
| Llama-3.1-8B | $0.18 | $0.18 |
| Qwen-2.5-72B | $0.88 | $0.88 |
Mistral AI
| Modell | Input (pro 1M Tokens) | Output (pro 1M Tokens) |
|---|---|---|
| mistral-large-latest | $2.00 | $6.00 |
| mistral-medium-latest | $0.70 | $2.10 |
| mistral-small-latest | $0.20 | $0.60 |
OpenAI
| Modell | Input (pro 1M Tokens) | Output (pro 1M Tokens) |
|---|---|---|
| GPT-4o | $2.50 | $10.00 |
| GPT-4 Turbo | $10.00 | $30.00 |
| GPT-3.5 Turbo | $0.50 | $1.50 |
Anthropic Claude
| Modell | Input (pro 1M Tokens) | Output (pro 1M Tokens) |
|---|---|---|
| Claude 3.5 Sonnet | $3.00 | $15.00 |
| Claude 3 Opus | $15.00 | $75.00 |
| Claude 3 Haiku | $0.25 | $1.25 |
Credit-Berechnung
LLM/VLM Beispiel
Anfrage:
- Input: 1.000 Tokens
- Output: 500 Tokens
- Modell: Gemini 1.5 Flash
- Input-Preis: $0.075 pro 1M Tokens
- Output-Preis: $0.30 pro 1M Tokens
Berechnung:
Input-Kosten = (1.000 / 1.000.000) × $0.075 = $0.000075
Output-Kosten = (500 / 1.000.000) × $0.30 = $0.000150
Gesamt = $0.000225In Credits (wenn 1 Credit = $0.01):
Credits = $0.000225 / $0.01 = 0.0225 CreditsTTS Beispiel
Anfrage:
- Text: "Hallo Welt, dies ist ein Test." (35 Zeichen inkl. Leerzeichen)
- Stimme: Neural2-C
- Preis: $0.000016 pro Zeichen
Berechnung:
Kosten = 35 × $0.000016 = $0.00056In Credits:
Credits = $0.00056 / $0.01 = 0.056 CreditsASR Beispiel (Zeit-basiert)
Anfrage:
- Audio-Dauer: 2 Minuten 30 Sekunden = 0.0417 Stunden
- Modell: Chirp
- Preis: $0.012 pro Stunde
Berechnung:
Kosten = 0.0417 × $0.012 = $0.0005004In Credits:
Credits = $0.0005004 / $0.01 = 0.05 CreditsRundung
Admin Bud-E rundet Credit-Beträge auf sinnvolle Werte:
- Minimum: 0.0001 Credits (verhindert "0 Credits" bei Kleinstmengen)
- Genauigkeit: 4 Dezimalstellen
- Rundungsregel: Kaufmännisch (0.5 → auf, 0.4 → ab)
Warum Rundung?
Ohne Rundung würden sehr kurze Anfragen 0 Credits kosten, was zu ungenauen Budgets führen würde.
Bulk-Import
Für große Setups können Sie Preise per CSV importieren:
CSV-Format
provider,model,type,input_price,output_price,char_price,hour_price
vertex,gemini-1.5-pro,llm,1.25,5.00,,
vertex,gemini-1.5-flash,llm,0.075,0.30,,
vertex,de-DE-Neural2-C,tts,,,0.000016,
vertex,chirp,asr,,,,0.012Import durchführen
- Navigieren Sie zu Pricing
- Klicken Sie auf Import CSV
- Wählen Sie die CSV-Datei
- Prüfen Sie die Vorschau
- Klicken Sie auf Import
Best Practices
1. Preise regelmäßig aktualisieren
Anbieter ändern Preise:
- Prüfen Sie monatlich auf Preisänderungen
- Abonnieren Sie Provider-Newsletters
- Dokumentieren Sie Änderungen
2. Sicherheitsmarge einrechnen
Rechnen Sie 5-10% Sicherheitsmarge ein:
Offizieller Preis: $0.075
Mit 10% Marge: $0.0825Vorteile:
- Puffer für Preiserhöhungen
- Abdeckung von Netzwerk-Overhead
- Vermeidung negativer Budgets
3. Preise dokumentieren
Führen Sie ein Changelog:
## Pricing History
### 2025-10-11
- Gemini 1.5 Flash: $0.075/$0.30 → $0.10/$0.40
- Grund: Google Preisanpassung
### 2025-09-01
- Chirp ASR: $0.012 → $0.015
- Grund: Neue Abrechnungsmodell4. Test-Credits für neue Preise
Vor dem Roll-out:
- Erstellen Sie Test-User
- Geben Sie Test-Credits (z.B. 10 Credits)
- Führen Sie typische Anfragen durch
- Prüfen Sie Credit-Verbrauch
5. Transparenz für Nutzer
Informieren Sie Nutzer über:
- Ungefähre Credit-Kosten pro Anfrage
- Welche Aktionen viel kosten (lange Antworten, TTS)
- Tipps zum Sparen (kürzere Prompts, weniger TTS)
Problembehebung
Negative Credits
Problem: Nutzer haben negative Credit-Stände.
Ursachen:
- Preise wurden nachträglich erhöht
- Fehler in der Berechnung
- Race Conditions bei parallelen Anfragen
Lösung:
- Korrigieren Sie die Preise
- Setzen Sie Credits auf 0 zurück
- Buchen Sie Korrektur-Credits
Zu hoher Verbrauch
Problem: Credits werden schneller verbraucht als erwartet.
Prüfen Sie:
- Sind Preise korrekt eingetragen?
- Gibt es Tippfehler (z.B. 1.25 statt 0.125)?
- Wird das richtige Modell verwendet?
- Werden Input/Output richtig zugeordnet?
Usage Reports helfen
Unter Usage sehen Sie detailliert, welche Tokens/Zeichen abgerechnet wurden.
Inkonsistente Preise
Problem: Gleiche Anfrage kostet unterschiedlich viele Credits.
Ursachen:
- Verschiedene Modelle durch Failover
- Preise wurden zwischenzeitlich geändert
- Unterschiedliche Token-Zählung (Provider-spezifisch)
Nächste Schritte
Nach der Pricing-Konfiguration:
- Nutzer anlegen - Erste Nutzer erstellen
- Projekte einrichten - Budgets verteilen
- Usage prüfen - Abrechnungen überprüfen