Budgets im AI-Chat und AI-Gateway: Unterschied zwischen den Versionen

Information
Information
Informationen
Betriebssystem	Alle
Service	KI
Interessant für	Angestellte und Studierende
HilfeWiki des ZIM der Uni Paderborn

Aktuelle Version vom 1. Juni 2026, 09:28 Uhr

KI

Allgemeine Informationen

Die Nutzung von KI-Modellen verursachen Kosten bei den Providern wie OpenAI. Die Kosten hängen von unterschiedlichen Faktoren ab:

Input-Tokens: Die Menge an Text welche Sie einem KI-Modell als Eingabe geben. Dabei zählen neben der eigentlichen Chat-Nachricht auch Daten die als Kontext gesendet werden. Dies sind unteranderem der Chat-Verlauf, wenn Sie im Chat mit Dokumenten arbeiten, oder Inhalten von einer Webseiten-Suche, etc.
Output-Tokens: Die Menge an Text welche das KI-Modell generieren muss. Eine Anfrage wie "Schreibe mir 100 Seiten zum Thema X" hat also sehr wenig Input-Tokens aber eine große Menge an generiertem Text - sprich Output-Tokens.
Model-Kosten: Die Tokens (Input und Output) wird je nach Wahl des Models unterschiedlich bepreist. So kosten Flagship-Modelle oder High-Reasoning-Models oft mehr für eine Nachricht, als das Mini- oder Nano-Varianten kosten.

Provider veröffentlichen Preislisten wie die von OpenAI: https://developers.openai.com/api/docs/pricing. Der Preis wird hier pro 1M Token angegeben. Eine Million Tokens entsprechen im Englischen ungefähr 750.000 Wörtern. Kostet ein Modell laut Tabelle beispielsweise 5,00 $ pro 1M Tokens, ist der Verbrauch für ein langes Dokument mit 10.000 Tokens umgerechnet 0,05 $ (5 Cent). Eine einfache Nachricht (z.B. 200 Tokens) verbraucht nur einen Bruchteil eines Cents. Der Verbrauch kann sich aber über mehrere Chats und Tage aufsummieren.

Ihr Budget der KI-Portale[Bearbeiten | Quelltext bearbeiten]

Die Nutzung der KI-Umgebung ist für User pro Monat auf einen Verbrauch von maximal $20 limitiert. Zum Monatsbeginn wird der User-Verbrauch zurückgesetzt.

Kostenfallen im Alltag / Tipps zur Kostenoptimierung[Bearbeiten | Quelltext bearbeiten]

Bei sehr einfachen oder fast trivialen Aufgaben oder Textgenerierungen auf ein günstiges Model wechseln, wie Mini oder Nano-Varianten von OpenAI oder auf Modelle der GWDG wie das Flagship-Model Qwen.
Kontexte bewusst wählen. Nicht nur aus Kostengründen lohnt es sich bei Themenwechseln einen neuen Chat mit leerer Chat-History zu starten. Auch vermeiden neue Chats Halluzinationen zu alten Themen/Gesprächen.
Vermeiden Sie:
- Sehr lange Chat-Historien mitschleppen
- Große Dokumente mehrfach senden. Alternativ können Sie Dokumente vorher einmal durch KI zusammenfassen lassen, die wichtigsten Punkte herausstellen und den Kontext statt das komplette Dokument senden. Außerdem können Sie Embeddings / Retrieval ("Fokussierte Abschnitte des Dokuments") nutzen statt komplette Texte immer mitzuschicken.
- Automatisierte Skripte ohne Limits laufen lassen
- KI anweisen Kurz-Knapp-Treffend zu formulieren, sodass „Verbose“-Antworten (z. B. „erkläre alles sehr ausführlich“) nicht unnötig oft auftreten. Oder Antworten kürzer anfordern („max. 5 Sätze“, „stichpunktartig“)

Bei Fragen oder Problemen können Sie uns zu unseren Servicezeiten telefonisch oder per E-Mail erreichen:

☎ Helpdesk: +49 5251 60-5544 • ☎ Medien: +49 5251 60-2821 • E-Mail: zim@uni-paderborn.de

Oder Sie besuchen uns vor Ort: Sie finden das Notebook-Café gemeinsam mit dem Servicecenter Medien in H1.201.

Servicezeiten

	Mo. – Do.	Fr.
Vor-Ort-Support	08:30 – 16:00 Uhr	08:30 – 14:00 Uhr
Telefonsupport	08:30 – 16:00 Uhr	08:30 – 14:00 Uhr
Servicecenter Medien	08:30 – 16:00 Uhr	08:30 – 14:00 Uhr

@@ Zeile 1: / Zeile 1: @@
 {{article
-|type=Anleitung
+|type=Information
 |service=Service:KI
 |targetgroup=Angestellte, Studierende
 |hasdisambig=Nein
 }}
-Kurzer Einleitungstext
+Die Nutzung von KI-Modellen verursachen Kosten bei den Providern wie OpenAI. Die Kosten hängen von unterschiedlichen Faktoren ab:
-== Was ist zu tun? ==
+# '''Input-Tokens:''' Die Menge an Text welche Sie einem KI-Modell als Eingabe geben. Dabei zählen neben der eigentlichen Chat-Nachricht auch Daten die als Kontext gesendet werden. Dies sind unteranderem der Chat-Verlauf, wenn Sie im Chat mit Dokumenten arbeiten, oder Inhalten von einer Webseiten-Suche, etc.
-* Stichpunktartige Auflistung
+# '''Output-Tokens:''' Die Menge an Text welche das KI-Modell generieren muss. Eine Anfrage wie "Schreibe mir 100 Seiten zum Thema X" hat also sehr wenig Input-Tokens aber eine große Menge an generiertem Text - sprich Output-Tokens.
-* aller Arbeitsschritte
+# '''Model-Kosten:''' Die Tokens (Input und Output) wird je nach Wahl des Models unterschiedlich bepreist. So kosten Flagship-Modelle oder High-Reasoning-Models oft mehr für eine Nachricht, als das Mini- oder Nano-Varianten kosten.
-== Schritt-für-Schritt Anleitung ==
+Provider veröffentlichen Preislisten wie die von OpenAI: https://developers.openai.com/api/docs/pricing. Der Preis wird hier pro 1M Token angegeben. Eine Million Tokens entsprechen im Englischen ungefähr 750.000 Wörtern. Kostet ein Modell laut Tabelle beispielsweise 5,00 $ pro 1M Tokens, ist der Verbrauch für ein langes Dokument mit 10.000 Tokens umgerechnet 0,05 $ (5 Cent). Eine einfache Nachricht (z.B. 200 Tokens) verbraucht nur einen Bruchteil eines Cents. Der Verbrauch kann sich aber über mehrere Chats und Tage aufsummieren.
-Jeder Arbeitschritt wird hier genau erklärt und ggf. mit Screenshots hinterlegt.
-=== Dabei sollten ===
+==== Ihr Budget der KI-Portale ====
-Unterschritte
+Die Nutzung der KI-Umgebung ist für User pro Monat auf einen Verbrauch von maximal $20 limitiert. Zum Monatsbeginn wird der User-Verbrauch zurückgesetzt.
-=== in sinnvolle Abschnitte ===
+==== Kostenfallen im Alltag / Tipps zur Kostenoptimierung ====
-unterteilt werden
-=== dazu nutzt man dann ===
+# Bei sehr einfachen oder fast trivialen Aufgaben oder Textgenerierungen auf ein günstiges Model wechseln, wie Mini oder Nano-Varianten von OpenAI oder auf Modelle der GWDG wie das Flagship-Model Qwen.
-Überschriften dritter Ordnung
+# Kontexte bewusst wählen. Nicht nur aus Kostengründen lohnt es sich bei Themenwechseln einen neuen Chat mit leerer Chat-History zu starten. Auch vermeiden neue Chats Halluzinationen zu alten Themen/Gesprächen.
+# Vermeiden Sie:
-=== Nebenbei ===
+#* Sehr lange Chat-Historien mitschleppen
-* Hier nochmal der Hinweis auf den Menüpunkt "Mitmachen" links im Hauptmenü, hinter dem sich wertvolle Anleitungen und Hinweise verstecken.
+#* Große Dokumente mehrfach senden. Alternativ können Sie Dokumente vorher einmal durch KI zusammenfassen lassen, die wichtigsten Punkte herausstellen und den Kontext statt das komplette Dokument senden. Außerdem können Sie Embeddings / Retrieval ("Fokussierte Abschnitte des Dokuments") nutzen statt komplette Texte immer mitzuschicken.
-* Erfahrene Redakteure finden unterhalb der "Kategorie:Utility templates" interessantes Handwerkszeug für fortgeschrittene Textmanipulationen.
+#* Automatisierte Skripte ohne Limits laufen lassen
+#* KI anweisen Kurz-Knapp-Treffend zu formulieren, sodass „Verbose“-Antworten (z. B. „erkläre alles sehr ausführlich“) nicht unnötig oft auftreten. Oder Antworten kürzer anfordern („max. 5 Sätze“, „stichpunktartig“)
-== Siehe auch ==
-Weitere interessante Artikel zum gleichen Themenfeld verlinken