Skip to content

Preise

Das Pricing-Modul ermöglicht es Ihnen, Modellpreise zu hinterlegen, die für die Credit-Abrechnung verwendet werden. Die Preise werden je nach Technologie unterschiedlich angegeben: LLM/VLM pro 1.000.000 Tokens, TTS pro Zeichen, ASR pro Stunde (Fallback).

Preiseinheiten

Admin Bud-E verwendet technologiespezifische Einheiten für maximale Transparenz:

TechnologieEinheitBeschreibung
LLM/VLMPro 1.000.000 TokensGetrennte Preise für Input und Output
TTSPro ZeichenJedes Zeichen (inkl. Leerzeichen) zählt
ASRPro Stunde AudioFallback, wenn Provider keine Tokens meldet

Pricing konfigurieren

  1. Öffnen Sie das Admin-Dashboard
  2. Navigieren Sie zu Pricing
  3. Wählen Sie den Provider und das Modell
  4. Tragen Sie die Preise ein

LLM/VLM Pricing

Für Text- und multimodale Modelle werden zwei Preise benötigt:

FeldBeschreibung
Input PriceKosten pro 1.000.000 Input-Tokens
Output PriceKosten pro 1.000.000 Output-Tokens

Warum zwei Preise?

Output-Tokens sind meist teurer, da die Generierung rechenintensiver ist als das Verarbeiten von Input.

TTS Pricing

Für Text-to-Speech wird ein einfacher Preis pro Zeichen angegeben:

FeldBeschreibung
Price per CharacterKosten pro Zeichen (z.B. 0.000016)

Umrechnung

Meist werden TTS-Preise pro 1 Million Zeichen angegeben. Teilen Sie durch 1.000.000 für den Preis pro Zeichen.

Beispiel: $16 pro 1M Zeichen = $0.000016 pro Zeichen

ASR Pricing

Für Automatic Speech Recognition gibt es zwei Modi:

Token-basiert (bevorzugt)

Wenn der Provider Token-Nutzung meldet:

FeldBeschreibung
Input PriceKosten pro 1.000.000 Tokens
Output PriceMeist 0, da ASR nur Input verarbeitet

Zeit-basiert (Fallback)

Wenn keine Token-Daten verfügbar:

FeldBeschreibung
Price per HourKosten pro Stunde Audio

Beispiel-Preise

Google Vertex AI (Gemini)

LLM Modelle

ModellInput (pro 1M Tokens)Output (pro 1M Tokens)
gemini-1.5-pro$1.25$5.00
gemini-1.5-flash$0.075$0.30
gemini-2.0-flash$0.10$0.40

Cloud TTS

Stimm-TypPreis pro Zeichen
Standard$0.000004
Neural2$0.000016
WaveNet$0.000016

Cloud Speech-to-Text

ModellPreis (15-Sekunden-Inkrement)
Standard$0.006 pro Stunde
Enhanced$0.009 pro Stunde
Chirp$0.012 pro Stunde

Aktuelle Preise

Preise können sich ändern. Prüfen Sie die Google Cloud Pricing-Seite.

Together AI

ModellInput (pro 1M Tokens)Output (pro 1M Tokens)
Llama-3.1-405B$5.00$5.00
Llama-3.1-70B$0.88$0.88
Llama-3.1-8B$0.18$0.18
Qwen-2.5-72B$0.88$0.88

Mistral AI

ModellInput (pro 1M Tokens)Output (pro 1M Tokens)
mistral-large-latest$2.00$6.00
mistral-medium-latest$0.70$2.10
mistral-small-latest$0.20$0.60

OpenAI

ModellInput (pro 1M Tokens)Output (pro 1M Tokens)
GPT-4o$2.50$10.00
GPT-4 Turbo$10.00$30.00
GPT-3.5 Turbo$0.50$1.50

Anthropic Claude

ModellInput (pro 1M Tokens)Output (pro 1M Tokens)
Claude 3.5 Sonnet$3.00$15.00
Claude 3 Opus$15.00$75.00
Claude 3 Haiku$0.25$1.25

Credit-Berechnung

LLM/VLM Beispiel

Anfrage:

  • Input: 1.000 Tokens
  • Output: 500 Tokens
  • Modell: Gemini 1.5 Flash
  • Input-Preis: $0.075 pro 1M Tokens
  • Output-Preis: $0.30 pro 1M Tokens

Berechnung:

Input-Kosten  = (1.000 / 1.000.000) × $0.075 = $0.000075
Output-Kosten = (500 / 1.000.000) × $0.30   = $0.000150
Gesamt        = $0.000225

In Credits (wenn 1 Credit = $0.01):

Credits = $0.000225 / $0.01 = 0.0225 Credits

TTS Beispiel

Anfrage:

  • Text: "Hallo Welt, dies ist ein Test." (35 Zeichen inkl. Leerzeichen)
  • Stimme: Neural2-C
  • Preis: $0.000016 pro Zeichen

Berechnung:

Kosten = 35 × $0.000016 = $0.00056

In Credits:

Credits = $0.00056 / $0.01 = 0.056 Credits

ASR Beispiel (Zeit-basiert)

Anfrage:

  • Audio-Dauer: 2 Minuten 30 Sekunden = 0.0417 Stunden
  • Modell: Chirp
  • Preis: $0.012 pro Stunde

Berechnung:

Kosten = 0.0417 × $0.012 = $0.0005004

In Credits:

Credits = $0.0005004 / $0.01 = 0.05 Credits

Rundung

Admin Bud-E rundet Credit-Beträge auf sinnvolle Werte:

  • Minimum: 0.0001 Credits (verhindert "0 Credits" bei Kleinstmengen)
  • Genauigkeit: 4 Dezimalstellen
  • Rundungsregel: Kaufmännisch (0.5 → auf, 0.4 → ab)

Warum Rundung?

Ohne Rundung würden sehr kurze Anfragen 0 Credits kosten, was zu ungenauen Budgets führen würde.

Bulk-Import

Für große Setups können Sie Preise per CSV importieren:

CSV-Format

csv
provider,model,type,input_price,output_price,char_price,hour_price
vertex,gemini-1.5-pro,llm,1.25,5.00,,
vertex,gemini-1.5-flash,llm,0.075,0.30,,
vertex,de-DE-Neural2-C,tts,,,0.000016,
vertex,chirp,asr,,,,0.012

Import durchführen

  1. Navigieren Sie zu Pricing
  2. Klicken Sie auf Import CSV
  3. Wählen Sie die CSV-Datei
  4. Prüfen Sie die Vorschau
  5. Klicken Sie auf Import

Best Practices

1. Preise regelmäßig aktualisieren

Anbieter ändern Preise:

  • Prüfen Sie monatlich auf Preisänderungen
  • Abonnieren Sie Provider-Newsletters
  • Dokumentieren Sie Änderungen

2. Sicherheitsmarge einrechnen

Rechnen Sie 5-10% Sicherheitsmarge ein:

Offizieller Preis: $0.075
Mit 10% Marge:     $0.0825

Vorteile:

  • Puffer für Preiserhöhungen
  • Abdeckung von Netzwerk-Overhead
  • Vermeidung negativer Budgets

3. Preise dokumentieren

Führen Sie ein Changelog:

markdown
## Pricing History

### 2025-10-11
- Gemini 1.5 Flash: $0.075/$0.30 → $0.10/$0.40
- Grund: Google Preisanpassung

### 2025-09-01
- Chirp ASR: $0.012 → $0.015
- Grund: Neue Abrechnungsmodell

4. Test-Credits für neue Preise

Vor dem Roll-out:

  1. Erstellen Sie Test-User
  2. Geben Sie Test-Credits (z.B. 10 Credits)
  3. Führen Sie typische Anfragen durch
  4. Prüfen Sie Credit-Verbrauch

5. Transparenz für Nutzer

Informieren Sie Nutzer über:

  • Ungefähre Credit-Kosten pro Anfrage
  • Welche Aktionen viel kosten (lange Antworten, TTS)
  • Tipps zum Sparen (kürzere Prompts, weniger TTS)

Problembehebung

Negative Credits

Problem: Nutzer haben negative Credit-Stände.

Ursachen:

  • Preise wurden nachträglich erhöht
  • Fehler in der Berechnung
  • Race Conditions bei parallelen Anfragen

Lösung:

  • Korrigieren Sie die Preise
  • Setzen Sie Credits auf 0 zurück
  • Buchen Sie Korrektur-Credits

Zu hoher Verbrauch

Problem: Credits werden schneller verbraucht als erwartet.

Prüfen Sie:

  • Sind Preise korrekt eingetragen?
  • Gibt es Tippfehler (z.B. 1.25 statt 0.125)?
  • Wird das richtige Modell verwendet?
  • Werden Input/Output richtig zugeordnet?

Usage Reports helfen

Unter Usage sehen Sie detailliert, welche Tokens/Zeichen abgerechnet wurden.

Inkonsistente Preise

Problem: Gleiche Anfrage kostet unterschiedlich viele Credits.

Ursachen:

  • Verschiedene Modelle durch Failover
  • Preise wurden zwischenzeitlich geändert
  • Unterschiedliche Token-Zählung (Provider-spezifisch)

Nächste Schritte

Nach der Pricing-Konfiguration:

  1. Nutzer anlegen - Erste Nutzer erstellen
  2. Projekte einrichten - Budgets verteilen
  3. Usage prüfen - Abrechnungen überprüfen