Preise

Das Pricing-Modul ermöglicht es Ihnen, Modellpreise zu hinterlegen, die für die Credit-Abrechnung verwendet werden. Die Preise werden je nach Technologie unterschiedlich angegeben: LLM/VLM pro 1.000.000 Tokens, TTS pro Zeichen, ASR pro Stunde (Fallback).

Preiseinheiten

Admin Bud-E verwendet technologiespezifische Einheiten für maximale Transparenz:

Technologie	Einheit	Beschreibung
LLM/VLM	Pro 1.000.000 Tokens	Getrennte Preise für Input und Output
TTS	Pro Zeichen	Jedes Zeichen (inkl. Leerzeichen) zählt
ASR	Pro Stunde Audio	Fallback, wenn Provider keine Tokens meldet

Pricing konfigurieren

Öffnen Sie das Admin-Dashboard
Navigieren Sie zu Pricing
Wählen Sie den Provider und das Modell
Tragen Sie die Preise ein

LLM/VLM Pricing

Für Text- und multimodale Modelle werden zwei Preise benötigt:

Feld	Beschreibung
Input Price	Kosten pro 1.000.000 Input-Tokens
Output Price	Kosten pro 1.000.000 Output-Tokens

Warum zwei Preise?

Output-Tokens sind meist teurer, da die Generierung rechenintensiver ist als das Verarbeiten von Input.

TTS Pricing

Für Text-to-Speech wird ein einfacher Preis pro Zeichen angegeben:

Feld	Beschreibung
Price per Character	Kosten pro Zeichen (z.B. 0.000016)

Umrechnung

Meist werden TTS-Preise pro 1 Million Zeichen angegeben. Teilen Sie durch 1.000.000 für den Preis pro Zeichen.

Beispiel: $16 pro 1M Zeichen = $0.000016 pro Zeichen

ASR Pricing

Für Automatic Speech Recognition gibt es zwei Modi:

Token-basiert (bevorzugt)

Wenn der Provider Token-Nutzung meldet:

Feld	Beschreibung
Input Price	Kosten pro 1.000.000 Tokens
Output Price	Meist 0, da ASR nur Input verarbeitet

Zeit-basiert (Fallback)

Wenn keine Token-Daten verfügbar:

Feld	Beschreibung
Price per Hour	Kosten pro Stunde Audio

Beispiel-Preise

Google Vertex AI (Gemini)

LLM Modelle

Modell	Input (pro 1M Tokens)	Output (pro 1M Tokens)
gemini-1.5-pro	$1.25	$5.00
gemini-1.5-flash	$0.075	$0.30
gemini-2.0-flash	$0.10	$0.40

Cloud TTS

Stimm-Typ	Preis pro Zeichen
Standard	$0.000004
Neural2	$0.000016
WaveNet	$0.000016

Cloud Speech-to-Text

Modell	Preis (15-Sekunden-Inkrement)
Standard	$0.006 pro Stunde
Enhanced	$0.009 pro Stunde
Chirp	$0.012 pro Stunde

Aktuelle Preise

Preise können sich ändern. Prüfen Sie die Google Cloud Pricing-Seite.

Together AI

Modell	Input (pro 1M Tokens)	Output (pro 1M Tokens)
Llama-3.1-405B	$5.00	$5.00
Llama-3.1-70B	$0.88	$0.88
Llama-3.1-8B	$0.18	$0.18
Qwen-2.5-72B	$0.88	$0.88

Mistral AI

Modell	Input (pro 1M Tokens)	Output (pro 1M Tokens)
mistral-large-latest	$2.00	$6.00
mistral-medium-latest	$0.70	$2.10
mistral-small-latest	$0.20	$0.60

OpenAI

Modell	Input (pro 1M Tokens)	Output (pro 1M Tokens)
GPT-4o	$2.50	$10.00
GPT-4 Turbo	$10.00	$30.00
GPT-3.5 Turbo	$0.50	$1.50

Anthropic Claude

Modell	Input (pro 1M Tokens)	Output (pro 1M Tokens)
Claude 3.5 Sonnet	$3.00	$15.00
Claude 3 Opus	$15.00	$75.00
Claude 3 Haiku	$0.25	$1.25

Credit-Berechnung

LLM/VLM Beispiel

Anfrage:

Input: 1.000 Tokens
Output: 500 Tokens
Modell: Gemini 1.5 Flash
Input-Preis: $0.075 pro 1M Tokens
Output-Preis: $0.30 pro 1M Tokens

Berechnung:

Input-Kosten  = (1.000 / 1.000.000) × $0.075 = $0.000075
Output-Kosten = (500 / 1.000.000) × $0.30   = $0.000150
Gesamt        = $0.000225

In Credits (wenn 1 Credit = $0.01):

Credits = $0.000225 / $0.01 = 0.0225 Credits

TTS Beispiel

Anfrage:

Text: "Hallo Welt, dies ist ein Test." (35 Zeichen inkl. Leerzeichen)
Stimme: Neural2-C
Preis: $0.000016 pro Zeichen

Berechnung:

Kosten = 35 × $0.000016 = $0.00056

In Credits:

Credits = $0.00056 / $0.01 = 0.056 Credits

ASR Beispiel (Zeit-basiert)

Anfrage:

Audio-Dauer: 2 Minuten 30 Sekunden = 0.0417 Stunden
Modell: Chirp
Preis: $0.012 pro Stunde

Berechnung:

Kosten = 0.0417 × $0.012 = $0.0005004

In Credits:

Credits = $0.0005004 / $0.01 = 0.05 Credits

Rundung

Admin Bud-E rundet Credit-Beträge auf sinnvolle Werte:

Minimum: 0.0001 Credits (verhindert "0 Credits" bei Kleinstmengen)
Genauigkeit: 4 Dezimalstellen
Rundungsregel: Kaufmännisch (0.5 → auf, 0.4 → ab)

Warum Rundung?

Ohne Rundung würden sehr kurze Anfragen 0 Credits kosten, was zu ungenauen Budgets führen würde.

Bulk-Import

Für große Setups können Sie Preise per CSV importieren:

CSV-Format

csv

provider,model,type,input_price,output_price,char_price,hour_price
vertex,gemini-1.5-pro,llm,1.25,5.00,,
vertex,gemini-1.5-flash,llm,0.075,0.30,,
vertex,de-DE-Neural2-C,tts,,,0.000016,
vertex,chirp,asr,,,,0.012

Import durchführen

Navigieren Sie zu Pricing
Klicken Sie auf Import CSV
Wählen Sie die CSV-Datei
Prüfen Sie die Vorschau
Klicken Sie auf Import

Best Practices

1. Preise regelmäßig aktualisieren

Anbieter ändern Preise:

Prüfen Sie monatlich auf Preisänderungen
Abonnieren Sie Provider-Newsletters
Dokumentieren Sie Änderungen

2. Sicherheitsmarge einrechnen

Rechnen Sie 5-10% Sicherheitsmarge ein:

Offizieller Preis: $0.075
Mit 10% Marge:     $0.0825

Vorteile:

Puffer für Preiserhöhungen
Abdeckung von Netzwerk-Overhead
Vermeidung negativer Budgets

3. Preise dokumentieren

Führen Sie ein Changelog:

markdown

## Pricing History

### 2025-10-11
- Gemini 1.5 Flash: $0.075/$0.30 → $0.10/$0.40
- Grund: Google Preisanpassung

### 2025-09-01
- Chirp ASR: $0.012 → $0.015
- Grund: Neue Abrechnungsmodell

4. Test-Credits für neue Preise

Vor dem Roll-out:

Erstellen Sie Test-User
Geben Sie Test-Credits (z.B. 10 Credits)
Führen Sie typische Anfragen durch
Prüfen Sie Credit-Verbrauch

5. Transparenz für Nutzer

Informieren Sie Nutzer über:

Ungefähre Credit-Kosten pro Anfrage
Welche Aktionen viel kosten (lange Antworten, TTS)
Tipps zum Sparen (kürzere Prompts, weniger TTS)

Problembehebung

Negative Credits

Problem: Nutzer haben negative Credit-Stände.

Ursachen:

Preise wurden nachträglich erhöht
Fehler in der Berechnung
Race Conditions bei parallelen Anfragen

Lösung:

Korrigieren Sie die Preise
Setzen Sie Credits auf 0 zurück
Buchen Sie Korrektur-Credits

Zu hoher Verbrauch

Problem: Credits werden schneller verbraucht als erwartet.

Prüfen Sie:

Sind Preise korrekt eingetragen?
Gibt es Tippfehler (z.B. 1.25 statt 0.125)?
Wird das richtige Modell verwendet?
Werden Input/Output richtig zugeordnet?

Usage Reports helfen

Unter Usage sehen Sie detailliert, welche Tokens/Zeichen abgerechnet wurden.

Inkonsistente Preise

Problem: Gleiche Anfrage kostet unterschiedlich viele Credits.

Ursachen:

Verschiedene Modelle durch Failover
Preise wurden zwischenzeitlich geändert
Unterschiedliche Token-Zählung (Provider-spezifisch)

Nächste Schritte

Nach der Pricing-Konfiguration:

Nutzer anlegen - Erste Nutzer erstellen
Projekte einrichten - Budgets verteilen
Usage prüfen - Abrechnungen überprüfen

Preise ​

Preiseinheiten ​

Pricing konfigurieren ​

LLM/VLM Pricing ​

TTS Pricing ​

ASR Pricing ​

Token-basiert (bevorzugt) ​

Zeit-basiert (Fallback) ​

Beispiel-Preise ​

Google Vertex AI (Gemini) ​

LLM Modelle ​

Cloud TTS ​

Cloud Speech-to-Text ​

Together AI ​

Mistral AI ​

OpenAI ​

Anthropic Claude ​

Credit-Berechnung ​

LLM/VLM Beispiel ​

TTS Beispiel ​

ASR Beispiel (Zeit-basiert) ​

Rundung ​

Bulk-Import ​

CSV-Format ​

Import durchführen ​

Best Practices ​

1. Preise regelmäßig aktualisieren ​

2. Sicherheitsmarge einrechnen ​

3. Preise dokumentieren ​

4. Test-Credits für neue Preise ​

5. Transparenz für Nutzer ​

Problembehebung ​

Negative Credits ​

Zu hoher Verbrauch ​

Inkonsistente Preise ​

Nächste Schritte ​

Preise

Preiseinheiten

Pricing konfigurieren

LLM/VLM Pricing

TTS Pricing

ASR Pricing

Token-basiert (bevorzugt)

Zeit-basiert (Fallback)

Beispiel-Preise

Google Vertex AI (Gemini)

LLM Modelle

Cloud TTS

Cloud Speech-to-Text

Together AI

Mistral AI

OpenAI

Anthropic Claude

Credit-Berechnung

LLM/VLM Beispiel

TTS Beispiel

ASR Beispiel (Zeit-basiert)

Rundung

Bulk-Import

CSV-Format

Import durchführen

Best Practices

1. Preise regelmäßig aktualisieren

2. Sicherheitsmarge einrechnen

3. Preise dokumentieren

4. Test-Credits für neue Preise

5. Transparenz für Nutzer

Problembehebung

Negative Credits

Zu hoher Verbrauch

Inkonsistente Preise

Nächste Schritte