Budgets im AI-Chat und AI-Gateway: Unterschied zwischen den Versionen

Information
Information
Informationen
Betriebssystem	Alle
Service	KI
Interessant für	Angestellte und Studierende
HilfeWiki des ZIM der Uni Paderborn

Version vom 18. Juni 2026, 15:52 Uhr

KI

Allgemeine Informationen

Die Nutzung von KI-Modellen verursachen Kosten bei den Providern wie OpenAI. Die Kosten hängen von unterschiedlichen Faktoren ab:

Input-Tokens: Die Menge an Text welche Sie einem KI-Modell als Eingabe geben. Dabei zählen neben der eigentlichen Chat-Nachricht auch Daten die als Kontext gesendet werden. Dies sind unteranderem der Chat-Verlauf, wenn Sie im Chat mit Dokumenten arbeiten, oder Inhalten von einer Webseiten-Suche, etc.
Output-Tokens: Die Menge an Text welche das KI-Modell generieren muss. Eine Anfrage wie "Schreibe mir 100 Seiten zum Thema X" hat also sehr wenig Input-Tokens aber eine große Menge an generiertem Text - sprich Output-Tokens.
Model-Kosten: Die Tokens (Input und Output) wird je nach Wahl des Models unterschiedlich bepreist. So kosten Flagship-Modelle oder High-Reasoning-Models oft mehr für eine Nachricht, als das Mini- oder Nano-Varianten kosten.

Provider veröffentlichen Preislisten wie die von OpenAI: https://developers.openai.com/api/docs/pricing. Der Preis wird hier pro 1M Token angegeben. Eine Million Tokens entsprechen im Englischen ungefähr 750.000 Wörtern. Kostet ein Modell laut Tabelle beispielsweise 5,00 $ pro 1M Tokens, ist der Verbrauch für ein langes Dokument mit 10.000 Tokens umgerechnet 0,05 $ (5 Cent). Eine einfache Nachricht (z.B. 200 Tokens) verbraucht nur einen Bruchteil eines Cents. Der Verbrauch kann sich aber über mehrere Chats und Tage aufsummieren.

Verbrauchsvolumen und Transparenz Ihrer Nutzung[Bearbeiten | Quelltext bearbeiten]

Die allgemeine Nutzung der KI-Umgebung ist für alle Studierende und Beschäftigte frei verfügbar. Um die Nutzung von Ressourcen fair zu verteilen ist der Verbrauch pro Person auf $20 pro Monat gedeckelt. Zum Monatsbeginn wird der Verbrauch zurückgesetzt. Die Nutzung der OpenAI-Modelle wird nach Verbrauch verrechnet. Die Nutzung der GWDG-Modelle steht Ihnen pauschal ohne Verbrauchskosten zur Verfügung. Ihr Verbrauchsbudget wird Ihnen transparent im AI-Chat und Gateway angezeigt. Im AI-Chat sehen Sie diesen in der obigen rechten Ecke. (Falls dies noch nicht der Fall sein sollte, laden Sie bitte Ihre Seite im Browser neu: Strg + F5):

Nutzen Sie diese Information, um Ihr Verbrauchsvolumen sinnvoll über den Monat zu verteilen. Nutzen Sie bewusst die kostenlosen GWDG-Modelle oder günstigere OpenAI-Modelle für simple Aufgaben. Weitere Tipps und Hinweise zur Kostenoptimierung finden Sie im nächsten Kapitel. Sollten Sie dennoch in begründeten Fällen temporär ein höheres Volumen für den aktuellen Monat dringend benötigen, um Ihre laufenden Arbeiten fortzuführen, können Sie Ihr Anliegen unter ki-kontakt@upb.de schildern.

Weiterhin bestehen je nach Provider und Model Beschränkungen von Anfragen pro Minute (RPM) und Tokens pro Minute (TPM). Wir möchten Ihnen die verfügbaren Ressourcen möglichst im vollen Umfang durchreichen, sind allerdings ebenfalls an diesen Limitierungen gebunden. Zusätzlich gilt je nach Model das maximale Kontext-Fenster zu beachten (Wie viel das KI-Model bei einer Anfrage maximal an Tokens/Zeichen verarbeiten kann).

Kostenfallen im Alltag / Tipps zur Kostenoptimierung[Bearbeiten | Quelltext bearbeiten]

Bei sehr einfachen oder fast trivialen Aufgaben oder Textgenerierungen auf ein günstiges Model wechseln, wie Mini oder Nano-Varianten von OpenAI oder auf Modelle der GWDG wie das Flagship-Model Qwen. Für welchen Anwendungsfall sich ein Model "besser" eignet, hängt stark von den eigenen Metriken ab. Wir möchten Ihnen hiermit eine Hilfestellung und Beispiel einer Einordnung geben: KI-Sprachmodelle
Kontexte bewusst wählen. Nicht nur aus Kostengründen lohnt es sich bei Themenwechseln einen neuen Chat mit leerer Chat-History zu starten. Auch vermeiden neue Chats Halluzinationen zu alten Themen/Gesprächen.
Vermeiden Sie:
- Sehr lange Chat-Historien mitschleppen
- Große Dokumente mehrfach senden. Alternativ können Sie Dokumente vorher einmal durch KI zusammenfassen lassen, die wichtigsten Punkte herausstellen und den Kontext statt das komplette Dokument senden. Außerdem können Sie Embeddings / Retrieval ("Fokussierte Abschnitte des Dokuments") nutzen statt komplette Texte immer mitzuschicken.
- Automatisierte Skripte ohne Limits laufen lassen
- KI anweisen Kurz-Knapp-Treffend zu formulieren, sodass „Verbose“-Antworten (z. B. „erkläre alles sehr ausführlich“) nicht unnötig oft auftreten. Oder Antworten kürzer anfordern („max. 5 Sätze“, „stichpunktartig“)

Bei Fragen oder Problemen können Sie uns zu unseren Servicezeiten telefonisch oder per E-Mail erreichen:

☎ Helpdesk: +49 5251 60-5544 • ☎ Medien: +49 5251 60-2821 • E-Mail: zim@uni-paderborn.de

Oder Sie besuchen uns vor Ort: Sie finden das Notebook-Café gemeinsam mit dem Servicecenter Medien in H1.201.

Servicezeiten

	Mo. – Do.	Fr.
Vor-Ort-Support	08:30 – 16:00 Uhr	08:30 – 14:00 Uhr
Telefonsupport	08:30 – 16:00 Uhr	08:30 – 14:00 Uhr
Servicecenter Medien	08:30 – 16:00 Uhr	08:30 – 14:00 Uhr

@@ Zeile 13: / Zeile 13: @@
 Provider veröffentlichen Preislisten wie die von OpenAI: https://developers.openai.com/api/docs/pricing. Der Preis wird hier pro 1M Token angegeben. Eine Million Tokens entsprechen im Englischen ungefähr 750.000 Wörtern. Kostet ein Modell laut Tabelle beispielsweise 5,00 $ pro 1M Tokens, ist der Verbrauch für ein langes Dokument mit 10.000 Tokens umgerechnet 0,05 $ (5 Cent). Eine einfache Nachricht (z.B. 200 Tokens) verbraucht nur einen Bruchteil eines Cents. Der Verbrauch kann sich aber über mehrere Chats und Tage aufsummieren.
-==== Ihr Budget der KI-Portale ====
+==== Verbrauchsvolumen und Transparenz Ihrer Nutzung ====
-Die Nutzung der KI-Umgebung ist für User pro Monat auf einen Verbrauch von maximal $20 limitiert. Zum Monatsbeginn wird der User-Verbrauch zurückgesetzt.
+Die allgemeine Nutzung der KI-Umgebung ist für alle Studierende und Beschäftigte frei verfügbar. Um die Nutzung von Ressourcen fair zu verteilen ist der Verbrauch pro Person auf $20 pro Monat gedeckelt. Zum Monatsbeginn wird der Verbrauch zurückgesetzt. Die Nutzung der OpenAI-Modelle wird nach Verbrauch verrechnet. Die Nutzung der GWDG-Modelle steht Ihnen pauschal ohne Verbrauchskosten zur Verfügung. Ihr Verbrauchsbudget wird Ihnen transparent im AI-Chat und Gateway angezeigt. Im AI-Chat sehen Sie diesen in der obigen rechten Ecke. (Falls dies noch nicht der Fall sein sollte, laden Sie bitte Ihre Seite im Browser neu: Strg + F5):
+[[Datei:Budget-Anzeige AI-Chat.png|rand]]
+Nutzen Sie diese Information, um Ihr Verbrauchsvolumen sinnvoll über den Monat zu verteilen. Nutzen Sie bewusst die kostenlosen GWDG-Modelle oder günstigere OpenAI-Modelle für simple Aufgaben. Weitere Tipps und Hinweise zur Kostenoptimierung finden Sie im nächsten Kapitel. Sollten Sie dennoch in ''begründeten'' Fällen ''temporär'' ein höheres Volumen für den aktuellen Monat dringend benötigen, um Ihre laufenden Arbeiten fortzuführen, können Sie Ihr Anliegen unter [mailto:ki-kontakt@upb.de ki-kontakt@upb.de] schildern.
+Weiterhin bestehen je nach Provider und Model Beschränkungen von Anfragen pro Minute (RPM) und Tokens pro Minute (TPM). Wir möchten Ihnen die verfügbaren Ressourcen möglichst im vollen Umfang durchreichen, sind allerdings ebenfalls an diesen Limitierungen gebunden. Zusätzlich gilt je nach Model das maximale Kontext-Fenster zu beachten (Wie viel das KI-Model bei einer Anfrage maximal an Tokens/Zeichen verarbeiten kann).
 ==== Kostenfallen im Alltag / Tipps zur Kostenoptimierung ====
-# Bei sehr einfachen oder fast trivialen Aufgaben oder Textgenerierungen auf ein günstiges Model wechseln, wie Mini oder Nano-Varianten von OpenAI oder auf Modelle der GWDG wie das Flagship-Model Qwen.
+# Bei sehr einfachen oder fast trivialen Aufgaben oder Textgenerierungen auf ein günstiges Model wechseln, wie Mini oder Nano-Varianten von OpenAI oder auf Modelle der GWDG wie das Flagship-Model Qwen. Für welchen Anwendungsfall sich ein Model "besser" eignet, hängt stark von den eigenen Metriken ab. Wir möchten Ihnen hiermit eine Hilfestellung und Beispiel einer Einordnung geben: [[KI-Sprachmodelle]]
 # Kontexte bewusst wählen. Nicht nur aus Kostengründen lohnt es sich bei Themenwechseln einen neuen Chat mit leerer Chat-History zu starten. Auch vermeiden neue Chats Halluzinationen zu alten Themen/Gesprächen.
 # Vermeiden Sie: