Budgets im AI-Chat und AI-Gateway

Information
Information
Informationen
Betriebssystem	Alle
Service	KI
Interessant für	Angestellte und Studierende
HilfeWiki des ZIM der Uni Paderborn

KI

Allgemeine Informationen

Die Nutzung von KI-Modellen verursachen Kosten bei den Providern wie OpenAI. Die Kosten hängen von unterschiedlichen Faktoren ab:

Input-Tokens: Die Menge an Text welche Sie einem KI-Modell als Eingabe geben. Dabei zählen neben der eigentlichen Chat-Nachricht auch Daten die als Kontext gesendet werden. Dies sind unteranderem der Chat-Verlauf, wenn Sie im Chat mit Dokumenten arbeiten, oder Inhalten von einer Webseiten-Suche, etc.
Output-Tokens: Die Menge an Text welche das KI-Modell generieren muss. Eine Anfrage wie "Schreibe mir 100 Seiten zum Thema X" hat also sehr wenig Input-Tokens aber eine große Menge an generiertem Text - sprich Output-Tokens.
Model-Kosten: Die Tokens (Input und Output) wird je nach Wahl des Models unterschiedlich bepreist. So kosten Flagship-Modelle oder High-Reasoning-Models oft mehr für eine Nachricht, als das Mini- oder Nano-Varianten kosten.

Provider veröffentlichen Preislisten wie die von OpenAI: https://developers.openai.com/api/docs/pricing. Der Preis wird hier pro 1M Token angegeben. Eine Million Tokens entsprechen im Englischen ungefähr 750.000 Wörtern. Kostet ein Modell laut Tabelle beispielsweise 5,00 $ pro 1M Tokens, ist der Verbrauch für ein langes Dokument mit 10.000 Tokens umgerechnet 0,05 $ (5 Cent). Eine einfache Nachricht (z.B. 200 Tokens) verbraucht nur einen Bruchteil eines Cents. Der Verbrauch kann sich aber über mehrere Chats und Tage aufsummieren.

Ihr Budget der KI-Portale[Bearbeiten | Quelltext bearbeiten]

Die Nutzung der KI-Umgebung ist für User pro Monat auf einen Verbrauch von maximal $20 limitiert. Zum Monatsbeginn wird der User-Verbrauch zurückgesetzt.

Kostenfallen im Alltag / Tipps zur Kostenoptimierung[Bearbeiten | Quelltext bearbeiten]

Bei sehr einfachen oder fast trivialen Aufgaben oder Textgenerierungen auf ein günstiges Model wechseln, wie Mini oder Nano-Varianten von OpenAI oder auf Modelle der GWDG wie das Flagship-Model Qwen.
Kontexte bewusst wählen. Nicht nur aus Kostengründen lohnt es sich bei Themenwechseln einen neuen Chat mit leerer Chat-History zu starten. Auch vermeiden neue Chats Halluzinationen zu alten Themen/Gesprächen.
Vermeiden Sie:
- Sehr lange Chat-Historien mitschleppen
- Große Dokumente mehrfach senden. Alternativ können Sie Dokumente vorher einmal durch KI zusammenfassen lassen, die wichtigsten Punkte herausstellen und den Kontext statt das komplette Dokument senden. Außerdem können Sie Embeddings / Retrieval ("Fokussierte Abschnitte des Dokuments") nutzen statt komplette Texte immer mitzuschicken.
- Automatisierte Skripte ohne Limits laufen lassen
- KI anweisen Kurz-Knapp-Treffend zu formulieren, sodass „Verbose“-Antworten (z. B. „erkläre alles sehr ausführlich“) nicht unnötig oft auftreten. Oder Antworten kürzer anfordern („max. 5 Sätze“, „stichpunktartig“)

Bei Fragen oder Problemen können Sie uns zu unseren Servicezeiten telefonisch oder per E-Mail erreichen:

☎ Helpdesk: +49 5251 60-5544 • ☎ Medien: +49 5251 60-2821 • E-Mail: zim@uni-paderborn.de

Oder Sie besuchen uns vor Ort: Sie finden das Notebook-Café gemeinsam mit dem Servicecenter Medien in H1.201.

Servicezeiten

	Mo. – Do.	Fr.
Vor-Ort-Support	08:30 – 16:00 Uhr	08:30 – 14:00 Uhr
Telefonsupport	08:30 – 16:00 Uhr	08:30 – 14:00 Uhr
Servicecenter Medien	08:30 – 16:00 Uhr	08:30 – 14:00 Uhr