KI-Sprachmodelle: Unterschied zwischen den Versionen

ZIM HilfeWiki - das Wiki
 
(2 dazwischenliegende Versionen desselben Benutzers werden nicht angezeigt)
Zeile 29: Zeile 29:
 
== Welche Sprachmodelle stehen mir an der Universität zur Verfügung? ==
 
== Welche Sprachmodelle stehen mir an der Universität zur Verfügung? ==
 
Unser Angebot umfasst eine Vielzahl an Open-Source-Modellen, die von der GWDG/KISSKI betrieben werden. Zusätzlich bieten wir Zugang zu den bekannten KI-Modelle von OpenAI. Die Auswahl wird stetig um neu veröffentliche Modelle erweitert und veraltete Modelle werden entfernt. Sie können die Modelle über die Chat-Oberfläche https://ai-chat.upb.de nutzen ([[AI-Chat|Hinweise zur Chat-Anwendung]]) oder mittels eines [[AI-Gateway|API-Keys über das Gateway]] der Universität. Allgemein teilt sich das Angebot in OpenAI's GPT-Modelle (Proprietäre Modelle) und im Open-Source-Bereich empfehlen wir die Modelle von Qwen3.
 
Unser Angebot umfasst eine Vielzahl an Open-Source-Modellen, die von der GWDG/KISSKI betrieben werden. Zusätzlich bieten wir Zugang zu den bekannten KI-Modelle von OpenAI. Die Auswahl wird stetig um neu veröffentliche Modelle erweitert und veraltete Modelle werden entfernt. Sie können die Modelle über die Chat-Oberfläche https://ai-chat.upb.de nutzen ([[AI-Chat|Hinweise zur Chat-Anwendung]]) oder mittels eines [[AI-Gateway|API-Keys über das Gateway]] der Universität. Allgemein teilt sich das Angebot in OpenAI's GPT-Modelle (Proprietäre Modelle) und im Open-Source-Bereich empfehlen wir die Modelle von Qwen3.
[[Datei:Artificial Analysis Intelligence Index - Results (2 Apr '26).png|alternativtext=|zentriert|mini|600x600px|Artificial Analysis Intelligence Index: Score vs. Release Date (Quelle: [https://artificialanalysis.ai/evaluations/artificial-analysis-intelligence-index?models=gpt-oss-120b%2Cllama-3-3-instruct-70b%2Cgemma-3-27b%2Cmistral-large-3%2Cdeepseek-r1-distill-llama-70b%2Cqwen3-5-35b-a3b%2Cqwen3-5-27b%2Cqwen3-5-397b-a17b%2Cqwen3-5-122b-a10b%2Cgpt-5-2-medium%2Cglm-4-7%2Cqwen3-30b-a3b-2507-reasoning#artificial-analysis-intelligence-index-score-vs-release-date https://artificialanalysis.ai/evaluations/artificial-analysis-intelligence-index?models=...])]]
+
[[Datei:Artificial Analysis Intelligence Index - Results (2 Apr '26).png|alternativtext=|zentriert|mini|600x600px|Artificial Analysis Intelligence Index: Score vs. Release Date (Quelle: [https://artificialanalysis.ai/evaluations/artificial-analysis-intelligence-index?models=gpt-oss-120b%2Cgpt-5-5-medium%2Cgemma-4-31b%2Cmistral-large-3%2Cdevstral-2%2Cqwen3-5-397b-a17b%2Cqwen3-5-122b-a10b%2Cqwen3-6-35b-a3b%2Cgpt-5-4-non-reasoning%2Cdeepseek-r1-distill-llama-70b%2Cglm-4-7#artificial-analysis-intelligence-index-score https://artificialanalysis.ai/evaluations/artificial-analysis-intelligence-index?models=...])]]
  
 
=== Allrounder / Große Sprachmodelle (LLMs) ===
 
=== Allrounder / Große Sprachmodelle (LLMs) ===
 
Im Vergleich zu spezialisierten Modellen für Aufgaben wie Bilderkennung, Programmiersprachen, Schlussfolgerungen oder (Fremd-)Sprachen sind die Modelle in der Kategorie "Allrounder" für all diese Aufgaben ein gutes Mittel. Die meisten Allrounder sind auf ausreichenden Trainingsdaten für verschiedene Sprachen trainiert. Wenn allerdings z.B. vertieftes Wissen oder ein umfangreicher Wortschatz einer Sprache benötigt wird, schneiden die Allrounder oft schlechter im Vergleich zu Experten-Modellen ab, welches auf einen größeren Korpus für die ausgewählte Sprache oder Aufgabe trainiert wurde. Die folgende Liste der Allrounder-Sprachmodelle zeigt das Angebot der UPB. (Mit einem Klick auf den Model-Bezeichner können Sie den AI-Chat direkt öffnen und das Model testen:   
 
Im Vergleich zu spezialisierten Modellen für Aufgaben wie Bilderkennung, Programmiersprachen, Schlussfolgerungen oder (Fremd-)Sprachen sind die Modelle in der Kategorie "Allrounder" für all diese Aufgaben ein gutes Mittel. Die meisten Allrounder sind auf ausreichenden Trainingsdaten für verschiedene Sprachen trainiert. Wenn allerdings z.B. vertieftes Wissen oder ein umfangreicher Wortschatz einer Sprache benötigt wird, schneiden die Allrounder oft schlechter im Vergleich zu Experten-Modellen ab, welches auf einen größeren Korpus für die ausgewählte Sprache oder Aufgabe trainiert wurde. Die folgende Liste der Allrounder-Sprachmodelle zeigt das Angebot der UPB. (Mit einem Klick auf den Model-Bezeichner können Sie den AI-Chat direkt öffnen und das Model testen:   
 
{| class="wikitable"
 
{| class="wikitable"
|<big>'''[https://ai-chat.uni-paderborn.de/?model=openai.gpt-5.2-chat-latest GPT-5.2]'''</big>
+
|<big>'''[https://ai-chat.uni-paderborn.de/?model=openai.latest-basemodel OpenAI: GPT-5.5]'''</big>  
OpenAIs aktuelles GPT-Modell ist GPT-5.2 und vereint eine Serie von Modellen. Anfragen an das Modell werden intern an ein Mini-, Nano-, Large- oder Reasoning-Modell versendet. Dieses Vorgehen soll die Entscheidung und Komplexität für Nutzende entlasten. In der Vergangenheit führte die fehlende Transparenz und Steuerung aber auch zu Kritik an der Qualität der Dialoge, da nun nicht immer das große (Thinking-)Sprachmodell verwendet wurde. Weiterhin können diese Modelle nun auch manuell ausgewählt werden ([https://ai-chat.uni-paderborn.de/?model=openai.gpt-5.2 GPT-5.2-Thinking]) und auch ältere Modelle der [https://ai-chat.uni-paderborn.de/?model=openai.gpt-4.1 GPT-4.1] und [https://ai-chat.uni-paderborn.de/?model=openai.gpt-4o GPT-4o] Serie sind verfügbar.
+
OpenAIs aktuelles GPT-Flagship ist GPT-5.5 (Stand Juni). Weiterhin können auch andere Modelle aus der GPT-Modelfamilie ausgewählt werden. Darunter eignet sich ebenfalls das GPT-5.4 Model als gutes Allrounder-Model für den produktiven Einsatz.
  
  
<u>Version</u>: gpt-5.2-chat-latest
 
  
<u>Veröffentlicht</u>: Dezember 2025
+
<u>Version</u>: gpt-5.5
 +
 
 +
<u>Veröffentlicht</u>: Frühjahr 2026
  
 
<u>Unterstützte Sprachen</u>: Multilingual mit "mehr als 80 Sprachen, darunter Englisch, Spanisch, Französisch, Deutsch, Chinesisch, Japanisch, Arabisch und viele mehr."
 
<u>Unterstützte Sprachen</u>: Multilingual mit "mehr als 80 Sprachen, darunter Englisch, Spanisch, Französisch, Deutsch, Chinesisch, Japanisch, Arabisch und viele mehr."
  
<u>Wissensstand</u>: August 2025
+
<u>Wissensstand</u>: Dezember 2025
  
  
 
Quelle: [https://platform.openai.com/docs/models/gpt-5.2 openai.com]
 
Quelle: [https://platform.openai.com/docs/models/gpt-5.2 openai.com]
|'''<big>[https://ai-chat.uni-paderborn.de/?model=gwdg.apertus-70b-instruct-2509 Apertus]</big>'''
+
|'''<big>[https://ai-chat.uni-paderborn.de/?model=gwdg.qwen3.6-35b-a3b-no-think Qwen 3.6 (Non-Reasoning)]</big>'''
Das in der Schweiz entwickelte Modell fokussierte sich auf Transparenz und Offenheit. Insbesondere bei den verwendeten Trainingsdaten und deren Offenlegung, stehe andere Modelle in der Kritik. Apertus geht dabei neue Wege.
+
Das Qwen 3.6 Modell ist eigentlich ein Reasoning-Model, verfügt allerdings über eine "Non-Reasoning" Anweisung. Die zugrunde liegende Architektur des Models ändert sich dabei nicht, aber ermöglicht es das Model anzuweisen ohne "Thinking"-Iterationen zu arbeiten und stattdessen direkt eine Antwort zu generieren. Das erlaubt es Nutzende möglichst schnell Texte zu generieren und das Model auch für einfache Aufgaben ohne benötigte Schlussfolgerungen zu nutzen.
  
  
<u>Version</u>: Apertus-70B-Instruct-2509
+
<u>Version</u>: Qwen3.6-35B-A3B
  
<u>Veröffentlicht</u>: September 2025
+
<u>Veröffentlicht</u>: April 2026
  
<u>Unterstützte Sprachen</u>: Multilingual mit "1811 nativ unterstützte Sprachen"
+
<u>Unterstützte Sprachen</u>: Multilingual mit "Unterstützung für über 119 Sprachen und Dialekte, darunter Indoeuropäisch, Sinotibetisch, Afroasiatisch, Austronesisch, Dravidisch, Turksprachen, Tai-Kadai, Uralisch, Austroasiatisch und Andere."
  
<u>Wissensstand</u>: April 2024
+
<u>Wissensstand</u>: Anfang 2026
  
  
Quellen: [https://huggingface.co/swiss-ai/Apertus-70B-Instruct-2509 huggingface.co/swiss-ai], [https://www.swiss-ai.org/apertus swiss-ai.org/apertus]
+
Quellen: [https://huggingface.co/Qwen/Qwen3.6-35B-A3B-FP8 huggingface.co/qwen], [https://qwenlm.github.io/blog/qwen3/ qwenlm.github.io]
 
|-
 
|-
|[https://ai-chat.uni-paderborn.de/?model=gwdg-qwen-3-32b-non-reasoning '''<big>Qwen 3 (Non-Reasoning)</big>''']
+
|<big>'''[https://ai-chat.uni-paderborn.de/?model=gwdg.gemma-4-27b-it Gemma 4]'''</big>Die Modell-Serie Gemma ist die Open-Source Variante der Gemini-Reihe von Google. Zu betonen ist dass das Open-Source-Modell von der GWDG/KISSKI betrieben wird und damit kein Datenfluss zu Google besteht. Im Vergleich dazu, können die Gemini-Modelle, welche nicht Open-Source sind, leider nicht von der GWDG/KISSKI betrieben werden.
Das Qwen 3 Modell ist eigentlich ein Reasoning-Model, verfügt allerdings über eine "Non-Reasoning" Anweisung. Die zugrunde liegende Architektur des Models ändert sich dabei nicht, aber ermöglicht es das Model anzuweisen ohne "Thinking"-Iterationen zu arbeiten und stattdessen direkt eine Antwort zu generieren. Das erlaubt es Nutzende möglichst schnell Texte zu generieren und das Model auch für einfache Aufgaben ohne benötigte Schlussfolgerungen zu nutzen.
 
  
  
<u>Version</u>: Qwen3-32B
+
<u>Version</u>: Gemma 4 31B Instruct
  
<u>Veröffentlicht</u>: April 2025
+
<u>Veröffentlicht</u>: April 2026
  
<u>Unterstützte Sprachen</u>: Multilingual mit "Unterstützung für über 119 Sprachen und Dialekte, darunter Indoeuropäisch, Sinotibetisch, Afroasiatisch, Austronesisch, Dravidisch, Turksprachen, Tai-Kadai, Uralisch, Austroasiatisch und Andere."
+
<u>Unterstützte Sprachen</u>: Multilingual. "Unterstützung für über 140 Sprachen" [https://ai.google.dev/gemma/docs/core?hl=de#multilingual *]
  
<u>Wissensstand</u>: September 2024
+
<u>Wissensstand</u>: ~ Ende 2024/Anfang 2025
  
  
Quellen: [https://huggingface.co/Qwen/Qwen3-32B huggingface.co/qwen], [https://qwenlm.github.io/blog/qwen3/ qwenlm.github.io]
+
Quellen: [https://ai.google.dev/gemma/docs/core?hl=de ai.google.dev/gemma], [https://huggingface.co/google/gemma-4-31B-it huggingface.co/google]
|'''<big>[https://ai-chat.uni-paderborn.de/?model=gwdg.qwen3-30b-a3b-instruct-2507 Qwen 3 (30B A3B Instruct)]</big>'''
+
|<big>'''[https://ai-chat.uni-paderborn.de/?model=gwdg.mistral-large-3-675b-instruct-2512 Mistral 3]'''</big>
Neben der Parameter-Angabe von 235B (engl.) "billion" - Gibt der Bezeichner "A3B" die Anzahl der aktivierten Parameter an.
+
Das französische Unternehmen "Mistral" wird in den Medien oft als die europäische Lösung betitelt, welche mit den großen Sprachmodellen der amerikanischen Konkurrenten mithalten kann. Durch den Unternehmenssitz innerhalb der EU, ist es im Vergleich zu anderen Anbietern in den USA, regulierter. Folglich sind Angaben zu Trainings-Daten und der Umgang mit Lizenzen freundlicher gegenüber EU-Verordnungen und -Richtlinien.
  
<u>Version</u>: Qwen3-30B-A3B-Instruct-2507
+
Hier muss allerdings unterschieden werden, dass es nur um die Entwicklung der Modelle und damit um Fragen geht, wie die Transparenz der Traningsdaten. Betrieben werden aber alle Modelle im Angebot mit der Kennzeichnung "GWDG" im KISSKI-Rechenzentrum. Im Vergleich zur Nutzung von Produkten wie ChatGPT, fließen bei der Nutzung des AI-Chats und den GWDG-Modellen also '''keine''' Daten in die USA.
  
<u>Veröffentlicht</u>: Juli 2025
 
  
<u>Unterstützte Sprachen</u>: Multilingual mit "Unterstützung für über 119 Sprachen und Dialekte, darunter Indoeuropäisch, Sinotibetisch, Afroasiatisch, Austronesisch, Dravidisch, Turksprachen, Tai-Kadai, Uralisch, Austroasiatisch und Andere."
+
<u>Version</u>: Mistral Large 3 675B ~A41B Instruct 2512
  
<u>Wissensstand</u>: April 2025
+
<u>Veröffentlicht</u>: Dezember 2025
  
 +
<u>Unterstützte Sprachen</u>: Französisch, Deutsch, Spanisch, Italienisch, Niederländisch, Portugiesisch, Russisch, Koreanisch, Japanisch, Chinesisch.
  
Quellen: [https://huggingface.co/Qwen/Qwen3-30B-A3B-Instruct-2507 huggingface.co/qwen], [https://qwenlm.github.io/blog/qwen3/ qwenlm.github.io]
+
<u>Wissensstand</u>: Dezember 2025
|-
 
|<big>[https://ai-chat.uni-paderborn.de/?model=gwdg.gemma-3-27b-it '''Gemma 3''']</big>Die Modell-Serie Gemma ist die Open-Source Variante der Gemini-Reihe von Google. Zu betonen ist dass das Open-Source-Modell von der GWDG/KISSKI betrieben wird und damit kein Datenfluss zu Google besteht. Im Vergleich dazu, können die Gemini-Modelle, welche nicht Open-Source sind, leider nicht von der GWDG/KISSKI betrieben werden.
 
  
  
<u>Version</u>: Gemma 3 27B Instruct
+
Quellen: [https://huggingface.co/mistralai/Mistral-Large-3-675B-Instruct-2512#benchmark-results huggingface.co/mistralai], [https://docs.mistral.ai/models/mistral-large-3-25-12 docs.mistral.ai], [https://mistral.ai/news/mistral-3 Mistral Blog Release]
 +
|-
 +
|'''<big>[https://ai-chat.uni-paderborn.de/?model=gwdg.apertus-70b-instruct-2509 Apertus]</big>'''
 +
Das in der Schweiz entwickelte Modell fokussierte sich auf Transparenz und Offenheit. Insbesondere bei den verwendeten Trainingsdaten und deren Offenlegung, stehe andere Modelle in der Kritik. Apertus geht dabei neue Wege.
  
<u>Veröffentlicht</u>: März 2025
 
  
<u>Unterstützte Sprachen</u>: Multilingual. "Unterstützung für über 140 Sprachen" [https://ai.google.dev/gemma/docs/core?hl=de#multilingual *]
+
<u>Version</u>: Apertus-70B-Instruct-2509
  
<u>Wissensstand</u>: August 2024
+
<u>Veröffentlicht</u>: September 2025
  
 +
<u>Unterstützte Sprachen</u>: Multilingual mit "1811 nativ unterstützte Sprachen"
  
Quellen: [https://ai.google.dev/gemma/docs/core?hl=de ai.google.dev/gemma], [https://huggingface.co/google/gemma-3-27b-it huggingface.co/google]
+
<u>Wissensstand</u>: April 2024
|[https://ai-chat.uni-paderborn.de/?model=gwdg.llama-3.3-70b-instruct '''<big>Llama 3.3</big>''']
 
Meta - der Mutterkonzern hinter Facebook und Instagram - entwickelt die bekannten Open-Source Llama Modelle. Neuere Modelle wie das Llama 4 Model sind leider unter einer Lizenz veröffentlicht worden, welche es nicht erlaubt diese in der EU zu betreiben. Meta stellt sich damit gegen die Entwicklungen innerhalb der EU und Regulierungen. Das Angebot der Hochschule ist daher auf das ältere Model Llama 3.3 begrenzt.
 
  
  
<u>Version</u>: Llama 3.3 70B
+
Quellen: [https://huggingface.co/swiss-ai/Apertus-70B-Instruct-2509 huggingface.co/swiss-ai], [https://www.swiss-ai.org/apertus swiss-ai.org/apertus]
 +
|'''<big>[https://ai-chat.uni-paderborn.de/?model=gwdg.qwen3-30b-a3b-instruct-2507 Qwen 3]</big>'''
  
<u>Veröffentlicht</u>: Dezember 2024
 
  
<u>Unterstützte Sprachen</u>: Englisch, Deutsch, Französisch, Italienisch, Portugiesisch, Hindi, Spanisch und Thailändisch.
+
<u>Version</u>: Qwen3-30B-A3B-Insstruct-2507
  
<u>Wissensstand</u>: Dezember 2023
+
<u>Veröffentlicht</u>: Juli 2025
  
 +
<u>Unterstützte Sprachen</u>: Multilingual mit "Unterstützung für über 119 Sprachen und Dialekte, darunter Indoeuropäisch, Sinotibetisch, Afroasiatisch, Austronesisch, Dravidisch, Turksprachen, Tai-Kadai, Uralisch, Austroasiatisch und Andere."
  
Quellen: [https://github.com/meta-llama/llama-models/blob/main/models/llama3_3/MODEL_CARD.md#model-information github.com/meta-llama], [https://huggingface.co/meta-llama/Llama-3.3-70B-Instruct huggingface.co/meta-llama]
+
<u>Wissensstand</u>: April 2025
|-
 
|<big>'''[https://ai-chat.uni-paderborn.de/?model=gwdg.mistral-large-3-675b-instruct-2512 Mistral 3]'''</big>
 
Das französische Unternehmen "Mistral" wird in den Medien oft als die europäische Lösung betitelt, welche mit den großen Sprachmodellen der amerikanischen Konkurrenten mithalten kann. Durch den Unternehmenssitz innerhalb der EU, ist es im Vergleich zu anderen Anbietern in den USA, regulierter. Folglich sind Angaben zu Trainings-Daten und der Umgang mit Lizenzen freundlicher gegenüber EU-Verordnungen und -Richtlinien.
 
  
Hier muss allerdings unterschieden werden, dass es nur um die Entwicklung der Modelle und damit um Fragen geht, wie die Transparenz der Traningsdaten. Betrieben werden aber alle Modelle im Angebot mit der Kennzeichnung "GWDG" im KISSKI-Rechenzentrum. Im Vergleich zur Nutzung von Produkten wie ChatGPT, fließen bei der Nutzung des AI-Chats und den GWDG-Modellen also '''keine''' Daten in die USA.
 
  
 
+
Quellen: [https://huggingface.co/Qwen/Qwen3-30B-A3B-Thinking-2507 huggingface.co/qwen/thinking], [https://qwenlm.github.io/blog/qwen3/ qwenlm.github.io]
<u>Version</u>: Mistral Large 3 675B ~A41B Instruct 2512
 
 
 
<u>Veröffentlicht</u>: Dezember 2025
 
 
 
<u>Unterstützte Sprachen</u>: Französisch, Deutsch, Spanisch, Italienisch, Niederländisch, Portugiesisch, Russisch, Koreanisch, Japanisch, Chinesisch.
 
 
 
<u>Wissensstand</u>: Dezember 2025
 
 
 
 
 
Quellen: [https://huggingface.co/mistralai/Mistral-Large-3-675B-Instruct-2512#benchmark-results huggingface.co/mistralai], [https://docs.mistral.ai/models/mistral-large-3-25-12 docs.mistral.ai], [https://mistral.ai/news/mistral-3 Mistral Blog Release]
 
|
 
 
|}
 
|}
  
Zeile 141: Zeile 126:
 
Reasoning oder Schlussfolgerungsfähigkeit ist ein entscheidender Aspekt moderner KI-Sprachmodelle. Diese Fähigkeit erlaubt es Sprachmodellen, ausgiebige logische Zusammenhänge zu erkennen und komplexe kontextbezogene Schlussfolgerungen zu ziehen. Modelle wie DeepSeek R1 und GPT o4-mini sind z.B. dafür bekannt, fortschrittliche Reasoning-Qualitäten zu besitzen, die sie in Anwendungen wie juristische Analysen oder interaktive Lernsysteme besonders nützlich machen.
 
Reasoning oder Schlussfolgerungsfähigkeit ist ein entscheidender Aspekt moderner KI-Sprachmodelle. Diese Fähigkeit erlaubt es Sprachmodellen, ausgiebige logische Zusammenhänge zu erkennen und komplexe kontextbezogene Schlussfolgerungen zu ziehen. Modelle wie DeepSeek R1 und GPT o4-mini sind z.B. dafür bekannt, fortschrittliche Reasoning-Qualitäten zu besitzen, die sie in Anwendungen wie juristische Analysen oder interaktive Lernsysteme besonders nützlich machen.
 
{| class="wikitable"
 
{| class="wikitable"
|[https://ai-chat.uni-paderborn.de/?model=gwdg.openai-gpt-oss-120b '''<big>GPT OSS</big>''']<br />
+
|[https://ai-chat.uni-paderborn.de/?model=gwdg.openai-gpt-oss-120b '''<big>GPT OSS</big>''']
 
OpenAI hat neben den proprietären Modellen auch Open-Source Modelle veröffentlicht. Zuletzt sind dies die Modelle GPT-OSS 20B und GPT-OSS 120B. Letzteres kann im Angebot der Hochschule verwendet werden. Zu betonen ist dass das Open-Source-Modell von der GWDG/KISSKI betrieben wird und damit kein Datenfluss zu OpenAI besteht. Im Vergleich zu Modellen wie GPT-5 oder o4, welche nicht Open-Source sind, können diese leider nicht von der GWDG/KISSKI betrieben werden.
 
OpenAI hat neben den proprietären Modellen auch Open-Source Modelle veröffentlicht. Zuletzt sind dies die Modelle GPT-OSS 20B und GPT-OSS 120B. Letzteres kann im Angebot der Hochschule verwendet werden. Zu betonen ist dass das Open-Source-Modell von der GWDG/KISSKI betrieben wird und damit kein Datenfluss zu OpenAI besteht. Im Vergleich zu Modellen wie GPT-5 oder o4, welche nicht Open-Source sind, können diese leider nicht von der GWDG/KISSKI betrieben werden.
  
Zeile 153: Zeile 138:
  
 
Quellen: [https://platform.openai.com/docs/models/gpt-oss-120b openai.com], [https://huggingface.co/openai/gpt-oss-120b huggingface.co/openai]
 
Quellen: [https://platform.openai.com/docs/models/gpt-oss-120b openai.com], [https://huggingface.co/openai/gpt-oss-120b huggingface.co/openai]
|'''<big>Qwen 3 Modellserie</big>'''<br />
+
|'''<big>[https://ai-chat.uni-paderborn.de/?model=gwdg.qwen3.6-35b-a3b Qwen 3.6 mit Reasoning]</big>'''
Die Qwen3-Modellserie ist laut dem Entwicklerteam (Alibaba Cloud) vergleichbar mit den Modellen DeepSeek R1, OpenAIs o1 und o3-mini, Grok-3 und Googles Gemini 2.5 Pro. Im Angebot der GWDG stehen dabei mehrere Varianten. Wobei das Model Qwen 3 32B auch mit einer Non-Reasoning-Option genutzt werden kann (Siehe Allrounder). Zudem gibt es noch zusätzliche Spezialisierte-Modelle für Coding-, Vision-Tasks oder Multimodaler Fähigkeit (Qwen3 Coder, VL oder Omni).
+
Neben der Parameter-Angabe von 235B (engl.) "billion" - Gibt der Bezeichner "A3B" die Anzahl der aktivierten Parameter an.
  
 +
<u>Version</u>: Qwen3.6-35B-A3B
  
''Varianten:''
+
<u>Veröffentlicht</u>: April 2026
  
* Klein (30B A3B) / Schnell
+
<u>Kontext-Fenster</u>: 262K
** Instruct (Siehe Allrounder)
 
** [https://ai-chat.uni-paderborn.de/?model=gwdg.qwen3-30b-a3b-thinking-2507 Thinking]
 
  
*Mittel (32B)
+
<u>Wissensstand</u>: Anfang 2026
**Non-Thinking (Siehe Allrounder)
 
**[https://ai-chat.uni-paderborn.de/?model=gwdg.qwen3-32b Thinking]
 
*[https://ai-chat.uni-paderborn.de/?model=gwdg.qwen3-235b-a22b Sehr groß (235B A22B)]
 
  
  
Im Folgenden wird auf die '''Thinking-Varianten''' genauer eingegangen.
+
Quellen: [https://huggingface.co/Qwen/Qwen3-30B-A3B-Thinking-2507 huggingface.co/qwen/thinking], [https://qwenlm.github.io/blog/qwen3/ qwenlm.github.io]
 
|-
 
|-
|'''<big>[https://ai-chat.uni-paderborn.de/?model=gwdg.qwen3-30b-a3b-thinking-2507 Qwen 3 30B A3B Thinking]</big>'''
+
|'''<big>[https://ai-chat.uni-paderborn.de/?model=gwdg.qwen3.5-122b-a10b Qwen 3.5 Sehr groß]</big>'''
Neben der Parameter-Angabe von 235B (engl.) "billion" - Gibt der Bezeichner "A3B" die Anzahl der aktivierten Parameter an.
+
Neben der Parameter-Angabe von 387B (engl.) "billion" - Gibt der Bezeichner "A17B" die Anzahl der aktivierten Parameter an.
 +
 
  
<u>Version</u>: Qwen3-30B-A3B-Thinking-2507
+
<u>Version</u>: Qwen3.5-387-A17B
  
<u>Veröffentlicht</u>: Juli 2025
+
<u>Veröffentlicht</u>: Feb 2026
  
<u>Unterstützte Sprachen</u>: Multilingual mit "Unterstützung für über 119 Sprachen und Dialekte, darunter Indoeuropäisch, Sinotibetisch, Afroasiatisch, Austronesisch, Dravidisch, Turksprachen, Tai-Kadai, Uralisch, Austroasiatisch und Andere."
+
<u>Kontext-Fenster</u>: 256K
  
 
<u>Wissensstand</u>: April 2025
 
<u>Wissensstand</u>: April 2025
  
 +
Quellen: [https://huggingface.co/Qwen/Qwen3.5-397B-A17B-GPTQ-Int4 huggingface.co/qwen], [https://qwenlm.github.io/blog/qwen3/ qwenlm.github.io]
 +
|'''<big>[https://ai-chat.uni-paderborn.de/?model=gwdg.qwen3.5-397b-a17b Qwen 3.5 Groß]</big>'''
 +
Neben der Parameter-Angabe von 122B (engl.) "billion" - Gibt der Bezeichner "A10B" die Anzahl der aktivierten Parameter an.
  
Quellen: [https://huggingface.co/Qwen/Qwen3-30B-A3B-Thinking-2507 huggingface.co/qwen/thinking], [https://qwenlm.github.io/blog/qwen3/ qwenlm.github.io]
 
|'''[https://ai-chat.uni-paderborn.de/?model=gwdg.qwen3-32b <big>Qwen 3 32B</big>]'''
 
<u>Version</u>: Qwen3-32B
 
  
<u>Veröffentlicht</u>: April 2025
+
<u>Version</u>: Qwen3.5-122B-A10B-Thinking-2507
  
<u>Unterstützte Sprachen</u>: Multilingual mit "Unterstützung für über 119 Sprachen und Dialekte, darunter Indoeuropäisch, Sinotibetisch, Afroasiatisch, Austronesisch, Dravidisch, Turksprachen, Tai-Kadai, Uralisch, Austroasiatisch und Andere."
+
<u>Veröffentlicht</u>: Feb 2026
  
<u>Wissensstand</u>: September 2024
+
<u>Kontext-Fenster</u>: 256K
 
 
Quellen: [https://huggingface.co/Qwen/Qwen3-32B huggingface.co/qwen], [https://qwenlm.github.io/blog/qwen3/ qwenlm.github.io]
 
|-
 
|'''[https://ai-chat.uni-paderborn.de/?model=gwdg.qwen3-235b-a22b <big>Qwen 3 235B A22B</big>]'''
 
Neben der Parameter-Angabe von 235B (engl.) "billion" - Gibt der Bezeichner "A22B" die Anzahl der aktivierten Parameter an.
 
 
 
<u>Version</u>: Qwen3-235B-A22B-Thinking-2507
 
 
 
<u>Veröffentlicht</u>: April 2025
 
 
 
<u>Unterstützte Sprachen</u>: Multilingual mit "Unterstützung für über 119 Sprachen und Dialekte, darunter Indoeuropäisch, Sinotibetisch, Afroasiatisch, Austronesisch, Dravidisch, Turksprachen, Tai-Kadai, Uralisch, Austroasiatisch und Andere."
 
  
 
<u>Wissensstand</u>: April 2025
 
<u>Wissensstand</u>: April 2025
  
  
Quellen: [https://huggingface.co/Qwen/Qwen3-235B-A22B-Thinking-2507 huggingface.co/qwen], [https://qwenlm.github.io/blog/qwen3/ qwenlm.github.io]
+
Quellen: [https://huggingface.co/Qwen/Qwen3.5-122B-A10B-GPTQ-Int4 huggingface.co/qwen], [https://qwenlm.github.io/blog/qwen3/ qwenlm.github.io]
 +
|-
 
|[https://ai-chat.uni-paderborn.de/?model=openai.o4-mini '''<big>o4-mini</big>''']
 
|[https://ai-chat.uni-paderborn.de/?model=openai.o4-mini '''<big>o4-mini</big>''']
 
Das Model o4 ist OpenAIs älteres Reasoning-Model vor der GPT-5-Serie. OpenAI bezeichnet GPT-5-mini als Nachfolger.
 
Das Model o4 ist OpenAIs älteres Reasoning-Model vor der GPT-5-Serie. OpenAI bezeichnet GPT-5-mini als Nachfolger.
Zeile 220: Zeile 192:
  
 
Quelle: [https://platform.openai.com/docs/models/o4-mini openai.com]
 
Quelle: [https://platform.openai.com/docs/models/o4-mini openai.com]
|-
 
 
|[https://ai-chat.uni-paderborn.de/?model=openai.o3-mini '''<big>o3-mini</big>''']
 
|[https://ai-chat.uni-paderborn.de/?model=openai.o3-mini '''<big>o3-mini</big>''']
 
Das kleine Model des o3-Reasoning-Models von OpenAI.
 
Das kleine Model des o3-Reasoning-Models von OpenAI.
Zeile 233: Zeile 204:
  
 
Quelle: [https://platform.openai.com/docs/models/o3-mini openai.com]
 
Quelle: [https://platform.openai.com/docs/models/o3-mini openai.com]
|[https://ai-chat.uni-paderborn.de/?model=gwdg.deepseek-r1 <big>DeepSeek R1</big>]
+
|-
Das Reasoning-Model DeepSeek vom gleichnamigen chinesischen Unternehmen, hatte zur Veröffentlichung Wellen in den Medien geschlagen. Grund war der Vorwurf von politischem Bias und Zensur. Das Modell R1 wurde mittlerweile auf die Version R1-0528 aktualisiert und vergleicht sich mit Modellen wie Qwen3, OpenAIs o3 und Googles Gemini 2.5 Pro.
+
|[https://ai-chat.uni-paderborn.de/?model=gwdg.deepseek-r1-distill-llama-70b <big>DeepSeek R1 Distill Llama 70B</big>]
 
 
 
 
<u>Version</u>: DeepSeek R1 0528
 
 
 
<u>Veröffentlicht</u>: Dezember 2024
 
 
 
<u>Unterstützte Sprachen</u>: Englisch, ...
 
 
 
<u>Wissensstand</u>: Dezember 2023
 
 
 
 
 
Quelle: [https://huggingface.co/deepseek-ai/DeepSeek-R1-0528 huggingface.co/deepseek-ai]
 
 
 
[https://ai-chat.uni-paderborn.de/?model=gwdg.deepseek-r1-distill-llama-70b <big>DeepSeek R1 Distill Llama 70B</big>]
 
 
 
 
Diese Distill-Modellvariante setzt als Basis-Model Metas Llama 3.3 70B ein und wurde durch das Model DeepSeek R1 weiter trainiert.
 
Diese Distill-Modellvariante setzt als Basis-Model Metas Llama 3.3 70B ein und wurde durch das Model DeepSeek R1 weiter trainiert.
  
Zeile 261: Zeile 217:
  
 
Quelle: [https://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Llama-70B huggingface.co/deepseek-ai]
 
Quelle: [https://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Llama-70B huggingface.co/deepseek-ai]
 +
|
 
|}
 
|}
  
Zeile 269: Zeile 226:
 
|'''<big>[https://ai-chat.uni-paderborn.de/?model=gwdg.internvl3.5-30b-a3b InternVL 3.5]</big>'''
 
|'''<big>[https://ai-chat.uni-paderborn.de/?model=gwdg.internvl3.5-30b-a3b InternVL 3.5]</big>'''
 
|-
 
|-
|'''<big>[https://ai-chat.uni-paderborn.de/?model=gwdg.gemma-3-27b-it Gemma 3]</big>'''
+
|'''<big>[https://ai-chat.uni-paderborn.de/?model=gwdg.gemma-4-31b-it Gemma 4]</big>'''
 
|'''<big>[https://ai-chat.uni-paderborn.de/?model=openai.gpt-4.1-mini GPT-4.1 mini]</big>'''
 
|'''<big>[https://ai-chat.uni-paderborn.de/?model=openai.gpt-4.1-mini GPT-4.1 mini]</big>'''
 
|}
 
|}
Zeile 283: Zeile 240:
 
Eingaben mit Audio-Dateien werden werden vom [https://ai-chat.uni-paderborn.de/?model=gwdg.qwen3-omni-30b-a3b-instruct Qwen3 Omni] Modell unterstützt. Das Ausgabeformat ist aber immer textbasiert. Es können also zum Beispiel Transkripte erstellt werden aber keine eigenen Stimmen o.Ä. (Avatare).
 
Eingaben mit Audio-Dateien werden werden vom [https://ai-chat.uni-paderborn.de/?model=gwdg.qwen3-omni-30b-a3b-instruct Qwen3 Omni] Modell unterstützt. Das Ausgabeformat ist aber immer textbasiert. Es können also zum Beispiel Transkripte erstellt werden aber keine eigenen Stimmen o.Ä. (Avatare).
  
=== Programmierung / Coding ===
+
=== Agentic / Coding ===
 
Auch Programmiersprachen lassen sich trainieren und damit als Unterstützung in der Software-Entwicklung nutzen. Vor allem im Bereichen der Code-Generierung, Code-Reasoning, Fehlerbehebung und Coding-Agenten.
 
Auch Programmiersprachen lassen sich trainieren und damit als Unterstützung in der Software-Entwicklung nutzen. Vor allem im Bereichen der Code-Generierung, Code-Reasoning, Fehlerbehebung und Coding-Agenten.
 
{| class="wikitable"
 
{| class="wikitable"
Zeile 305: Zeile 262:
 
Quellen: [https://huggingface.co/Qwen/Qwen3-Coder-30B-A3B-Instruct-FP8 huggingface.co/qwen], [https://qwenlm.github.io/blog/qwen3-coder/ qwenlm.github.io]
 
Quellen: [https://huggingface.co/Qwen/Qwen3-Coder-30B-A3B-Instruct-FP8 huggingface.co/qwen], [https://qwenlm.github.io/blog/qwen3-coder/ qwenlm.github.io]
 
|-
 
|-
|[https://ai-chat.uni-paderborn.de/?model=gwdg.codestral-22b <big>'''Codestral'''</big>]
+
|<big>'''[https://ai-chat.uni-paderborn.de/?model=gwdg.devstral-2-123b-instruct-2512 Devstral 2]'''</big>
 
Das Model wurde von Mistral entwickelt und für '''über 80 Programmiersprachen''' spezialisiert, wie Python, Java, C, C++, JavaScript und Bash.
 
Das Model wurde von Mistral entwickelt und für '''über 80 Programmiersprachen''' spezialisiert, wie Python, Java, C, C++, JavaScript und Bash.
  
  
<u>Version</u>: Codestral 22B v0.1
+
<u>Version</u>: Devstral 2 123B Instruct 2512
  
<u>Veröffentlicht</u>: Dezember 2024
+
<u>Veröffentlicht</u>: Dezember 2025
  
 
<u>Wissensstand</u>: Ende 2021
 
<u>Wissensstand</u>: Ende 2021

Aktuelle Version vom 19. Juni 2026, 22:48 Uhr

Allgemeine Informationen
Information
Informationen
BetriebssystemAlle
ServiceKI
Interessant fürStudierende und Angestellte
HilfeWiki des ZIM der Uni Paderborn

no displaytitle found: KI-Sprachmodelle

KI-Sprachmodelle sind ein wesentlicher Bestandteil moderner künstlicher Intelligenz und finden Anwendung in verschiedensten Bereichen, von der automatisierten Textverarbeitung bis hin zu interaktiven Dialogsystemen. Diese Modelle sind darauf trainiert, menschliche Sprache zu verstehen und zu verarbeiten, und ermöglichen es Maschinen, menschenähnliche Texte zu generieren und zu analysieren.

Open-Source-Sprachmodelle[Bearbeiten | Quelltext bearbeiten]

Open-Source- und Open-Weight-Sprachmodelle bieten eine breite Palette von Stärken, die für unterschiedliche Anwendungen optimiert sind. Hier sind einige Beispiele für solche Modelle und ihre spezifischen Vorteile:

  • Metas Llama 3.1 8B Instruct: Dieses entwickelte Modell ist bekannt für seine hohe Geschwindigkeit und allgemeine Leistungsfähigkeit. Es eignet sich hervorragend für Anwendungen, die schnelle und präzise Antworten erfordern.
  • DeepSeek R1: Besonders stark im Bereich des Reasonings und der Problemlösung. Dieses Modell aus China kann komplexe logische Schlussfolgerungen ziehen und zeigt eine hohe Performance in anspruchsvollen kognitiven Aufgaben, allerdings mit einer Tendenz zu politischem Bias.
  • Google Gemma: Verschiede Sprachmodelle unterschiedlicher Größe für Arbeiten mit Texten, Modelle für Bildererkennungen (Vision) und Modelle zur Codegenerierung. Die Modellfamilie ist die quelloffene Alternative der Gemini-Modelle.

Die Stärke von Open-Source-Sprachmodellen liegt oft in ihrer Anpassungsfähigkeit und der Unterstützung durch eine große Community, die kontinuierlich zur Verbesserung und Weiterentwicklung dieser Modelle beiträgt.

Proprietäre Sprachmodelle[Bearbeiten | Quelltext bearbeiten]

Neben den öffentlich zur Verfügung stehenden Sprachmodellen, gibt es proprietäre Sprachmodelle wie OpenAIs GPT- oder Omni-Modelfamilie. Diese werden von Unternehmen kommerziell betrieben oder mit Lizenzen kontrolliert. Ein lokales Angebot ist daher meist nicht umsetzbar. Einige bekannte Unternehmen und deren KI-Modelle sind:

Es gibt allerdings auch Modelle dieser Provider die Open-Source gestellt wurden. So ist Mistrals Small- und Research-Modelle oder OpenAIs Whisper-Model zu erwähnen.

Welche Sprachmodelle stehen mir an der Universität zur Verfügung?[Bearbeiten | Quelltext bearbeiten]

Unser Angebot umfasst eine Vielzahl an Open-Source-Modellen, die von der GWDG/KISSKI betrieben werden. Zusätzlich bieten wir Zugang zu den bekannten KI-Modelle von OpenAI. Die Auswahl wird stetig um neu veröffentliche Modelle erweitert und veraltete Modelle werden entfernt. Sie können die Modelle über die Chat-Oberfläche https://ai-chat.upb.de nutzen (Hinweise zur Chat-Anwendung) oder mittels eines API-Keys über das Gateway der Universität. Allgemein teilt sich das Angebot in OpenAI's GPT-Modelle (Proprietäre Modelle) und im Open-Source-Bereich empfehlen wir die Modelle von Qwen3.

Artificial Analysis Intelligence Index: Score vs. Release Date (Quelle: https://artificialanalysis.ai/evaluations/artificial-analysis-intelligence-index?models=...)

Allrounder / Große Sprachmodelle (LLMs)[Bearbeiten | Quelltext bearbeiten]

Im Vergleich zu spezialisierten Modellen für Aufgaben wie Bilderkennung, Programmiersprachen, Schlussfolgerungen oder (Fremd-)Sprachen sind die Modelle in der Kategorie "Allrounder" für all diese Aufgaben ein gutes Mittel. Die meisten Allrounder sind auf ausreichenden Trainingsdaten für verschiedene Sprachen trainiert. Wenn allerdings z.B. vertieftes Wissen oder ein umfangreicher Wortschatz einer Sprache benötigt wird, schneiden die Allrounder oft schlechter im Vergleich zu Experten-Modellen ab, welches auf einen größeren Korpus für die ausgewählte Sprache oder Aufgabe trainiert wurde. Die folgende Liste der Allrounder-Sprachmodelle zeigt das Angebot der UPB. (Mit einem Klick auf den Model-Bezeichner können Sie den AI-Chat direkt öffnen und das Model testen:

OpenAI: GPT-5.5

OpenAIs aktuelles GPT-Flagship ist GPT-5.5 (Stand Juni). Weiterhin können auch andere Modelle aus der GPT-Modelfamilie ausgewählt werden. Darunter eignet sich ebenfalls das GPT-5.4 Model als gutes Allrounder-Model für den produktiven Einsatz.


Version: gpt-5.5

Veröffentlicht: Frühjahr 2026

Unterstützte Sprachen: Multilingual mit "mehr als 80 Sprachen, darunter Englisch, Spanisch, Französisch, Deutsch, Chinesisch, Japanisch, Arabisch und viele mehr."

Wissensstand: Dezember 2025


Quelle: openai.com

Qwen 3.6 (Non-Reasoning)

Das Qwen 3.6 Modell ist eigentlich ein Reasoning-Model, verfügt allerdings über eine "Non-Reasoning" Anweisung. Die zugrunde liegende Architektur des Models ändert sich dabei nicht, aber ermöglicht es das Model anzuweisen ohne "Thinking"-Iterationen zu arbeiten und stattdessen direkt eine Antwort zu generieren. Das erlaubt es Nutzende möglichst schnell Texte zu generieren und das Model auch für einfache Aufgaben ohne benötigte Schlussfolgerungen zu nutzen.


Version: Qwen3.6-35B-A3B

Veröffentlicht: April 2026

Unterstützte Sprachen: Multilingual mit "Unterstützung für über 119 Sprachen und Dialekte, darunter Indoeuropäisch, Sinotibetisch, Afroasiatisch, Austronesisch, Dravidisch, Turksprachen, Tai-Kadai, Uralisch, Austroasiatisch und Andere."

Wissensstand: Anfang 2026


Quellen: huggingface.co/qwen, qwenlm.github.io

Gemma 4Die Modell-Serie Gemma ist die Open-Source Variante der Gemini-Reihe von Google. Zu betonen ist dass das Open-Source-Modell von der GWDG/KISSKI betrieben wird und damit kein Datenfluss zu Google besteht. Im Vergleich dazu, können die Gemini-Modelle, welche nicht Open-Source sind, leider nicht von der GWDG/KISSKI betrieben werden.


Version: Gemma 4 31B Instruct

Veröffentlicht: April 2026

Unterstützte Sprachen: Multilingual. "Unterstützung für über 140 Sprachen" *

Wissensstand: ~ Ende 2024/Anfang 2025


Quellen: ai.google.dev/gemma, huggingface.co/google

Mistral 3

Das französische Unternehmen "Mistral" wird in den Medien oft als die europäische Lösung betitelt, welche mit den großen Sprachmodellen der amerikanischen Konkurrenten mithalten kann. Durch den Unternehmenssitz innerhalb der EU, ist es im Vergleich zu anderen Anbietern in den USA, regulierter. Folglich sind Angaben zu Trainings-Daten und der Umgang mit Lizenzen freundlicher gegenüber EU-Verordnungen und -Richtlinien.

Hier muss allerdings unterschieden werden, dass es nur um die Entwicklung der Modelle und damit um Fragen geht, wie die Transparenz der Traningsdaten. Betrieben werden aber alle Modelle im Angebot mit der Kennzeichnung "GWDG" im KISSKI-Rechenzentrum. Im Vergleich zur Nutzung von Produkten wie ChatGPT, fließen bei der Nutzung des AI-Chats und den GWDG-Modellen also keine Daten in die USA.


Version: Mistral Large 3 675B ~A41B Instruct 2512

Veröffentlicht: Dezember 2025

Unterstützte Sprachen: Französisch, Deutsch, Spanisch, Italienisch, Niederländisch, Portugiesisch, Russisch, Koreanisch, Japanisch, Chinesisch.

Wissensstand: Dezember 2025


Quellen: huggingface.co/mistralai, docs.mistral.ai, Mistral Blog Release

Apertus

Das in der Schweiz entwickelte Modell fokussierte sich auf Transparenz und Offenheit. Insbesondere bei den verwendeten Trainingsdaten und deren Offenlegung, stehe andere Modelle in der Kritik. Apertus geht dabei neue Wege.


Version: Apertus-70B-Instruct-2509

Veröffentlicht: September 2025

Unterstützte Sprachen: Multilingual mit "1811 nativ unterstützte Sprachen"

Wissensstand: April 2024


Quellen: huggingface.co/swiss-ai, swiss-ai.org/apertus

Qwen 3


Version: Qwen3-30B-A3B-Insstruct-2507

Veröffentlicht: Juli 2025

Unterstützte Sprachen: Multilingual mit "Unterstützung für über 119 Sprachen und Dialekte, darunter Indoeuropäisch, Sinotibetisch, Afroasiatisch, Austronesisch, Dravidisch, Turksprachen, Tai-Kadai, Uralisch, Austroasiatisch und Andere."

Wissensstand: April 2025


Quellen: huggingface.co/qwen/thinking, qwenlm.github.io

Schlussfolgernde Sprachmodelle / Reasoning-Models (LRMs)[Bearbeiten | Quelltext bearbeiten]

Reasoning oder Schlussfolgerungsfähigkeit ist ein entscheidender Aspekt moderner KI-Sprachmodelle. Diese Fähigkeit erlaubt es Sprachmodellen, ausgiebige logische Zusammenhänge zu erkennen und komplexe kontextbezogene Schlussfolgerungen zu ziehen. Modelle wie DeepSeek R1 und GPT o4-mini sind z.B. dafür bekannt, fortschrittliche Reasoning-Qualitäten zu besitzen, die sie in Anwendungen wie juristische Analysen oder interaktive Lernsysteme besonders nützlich machen.

GPT OSS

OpenAI hat neben den proprietären Modellen auch Open-Source Modelle veröffentlicht. Zuletzt sind dies die Modelle GPT-OSS 20B und GPT-OSS 120B. Letzteres kann im Angebot der Hochschule verwendet werden. Zu betonen ist dass das Open-Source-Modell von der GWDG/KISSKI betrieben wird und damit kein Datenfluss zu OpenAI besteht. Im Vergleich zu Modellen wie GPT-5 oder o4, welche nicht Open-Source sind, können diese leider nicht von der GWDG/KISSKI betrieben werden.


Version: GPT OSS 120B

Veröffentlicht: August 2025

Wissensstand: Juni 2024


Quellen: openai.com, huggingface.co/openai

Qwen 3.6 mit Reasoning

Neben der Parameter-Angabe von 235B (engl.) "billion" - Gibt der Bezeichner "A3B" die Anzahl der aktivierten Parameter an.

Version: Qwen3.6-35B-A3B

Veröffentlicht: April 2026

Kontext-Fenster: 262K

Wissensstand: Anfang 2026


Quellen: huggingface.co/qwen/thinking, qwenlm.github.io

Qwen 3.5 Sehr groß

Neben der Parameter-Angabe von 387B (engl.) "billion" - Gibt der Bezeichner "A17B" die Anzahl der aktivierten Parameter an.


Version: Qwen3.5-387-A17B

Veröffentlicht: Feb 2026

Kontext-Fenster: 256K

Wissensstand: April 2025

Quellen: huggingface.co/qwen, qwenlm.github.io

Qwen 3.5 Groß

Neben der Parameter-Angabe von 122B (engl.) "billion" - Gibt der Bezeichner "A10B" die Anzahl der aktivierten Parameter an.


Version: Qwen3.5-122B-A10B-Thinking-2507

Veröffentlicht: Feb 2026

Kontext-Fenster: 256K

Wissensstand: April 2025


Quellen: huggingface.co/qwen, qwenlm.github.io

o4-mini

Das Model o4 ist OpenAIs älteres Reasoning-Model vor der GPT-5-Serie. OpenAI bezeichnet GPT-5-mini als Nachfolger.


Version: o4-mini

Veröffentlicht: April 2025

Wissensstand: Juni 2024


Quelle: openai.com

o3-mini

Das kleine Model des o3-Reasoning-Models von OpenAI.


Version: o3-mini

Veröffentlicht: Januar 2025

Wissensstand: Oktober 2023


Quelle: openai.com

DeepSeek R1 Distill Llama 70B

Diese Distill-Modellvariante setzt als Basis-Model Metas Llama 3.3 70B ein und wurde durch das Model DeepSeek R1 weiter trainiert.


Version: DeepSeek R1 Distill Llama 70B

Veröffentlicht: Dezember 2024

Wissensstand: Dezember 2023


Quelle: huggingface.co/deepseek-ai

Bilderkennung / Vision-Models[Bearbeiten | Quelltext bearbeiten]

Neben bildgenerierenden Modellen in Form von Text-zu-Bild oder Bild-zu-Bild, gibt es auch den Anwendungsfall Bild-zu-Text. KI-Modelle mit der sog. Vision-Fähigkeit sind in der Lage Bilder (+ Instruktionen) als Eingabe zu verarbeiten und Fragen oder Aufgaben in Text-Form zu beantworten. Diese Modelle können z.B. zum Generieren von Bildbeschreibungen genutzt werden, Analysen des Bildes welche für den Nutzenden ohne Hintergrundwissen nicht beantwortet werden können, Kategorisierung/Labeling von Bildern, extrahieren von sichtbaren Informationen aus dem Bild, und vieles mehr.

Qwen3 VL InternVL 3.5
Gemma 4 GPT-4.1 mini

Video-Verarbeitung[Bearbeiten | Quelltext bearbeiten]

Eingaben in Video-Formaten werden von den aktuellen Vision-Modellen Qwen3 und OpenGVLab unterstützt. Das Ausgabeformat ist aber immer textbasiert. Es können also zum Beispiel Transkripte, Untertitel oder Zusammenfassungen erstellt werden aber keine eigenen Videos.

Qwen3 VL InternVL 3.5

Audio-Verarbeitung[Bearbeiten | Quelltext bearbeiten]

Eingaben mit Audio-Dateien werden werden vom Qwen3 Omni Modell unterstützt. Das Ausgabeformat ist aber immer textbasiert. Es können also zum Beispiel Transkripte erstellt werden aber keine eigenen Stimmen o.Ä. (Avatare).

Agentic / Coding[Bearbeiten | Quelltext bearbeiten]

Auch Programmiersprachen lassen sich trainieren und damit als Unterstützung in der Software-Entwicklung nutzen. Vor allem im Bereichen der Code-Generierung, Code-Reasoning, Fehlerbehebung und Coding-Agenten.

GLM-4.7

Das Model von Z.ai fokusiert sich auf die Coding-Fähigkeit. Nach eigenen Aussagen schlägt es in aktuelle Benchmarks (AIME25, LiveCodeBenchv6,GPQA,HLE,...) vergleichbare Modelle von DeepSeek, Anthropic und OpenAI.

Version: GLM-4.7-FP8

Veröffentlicht: Dezember 2025

Quellen: huggingface.co/qwen, z.ai/blog/glm-4.7

Qwen3 Coder

Der Nachfolger von Qwen2.5 Coder, entwickelt von Alibaba Cloud, wurde weiterhin verbessert und spezialisiert sich ebenfalls in den Bereichen Agentic Coding, Agentic Browser-Use, Agentic Tool-Use (vgl. Claude Sonnet 4)

Version: Qwen3 Coder 30B A3B Instruct

Veröffentlicht: Juli 2025

Wissensstand: März 2025

Quellen: huggingface.co/qwen, qwenlm.github.io

Devstral 2

Das Model wurde von Mistral entwickelt und für über 80 Programmiersprachen spezialisiert, wie Python, Java, C, C++, JavaScript und Bash.


Version: Devstral 2 123B Instruct 2512

Veröffentlicht: Dezember 2025

Wissensstand: Ende 2021


Quelle: huggingface.co/mistralai

Aufgabenmodelle / Task-Models[Bearbeiten | Quelltext bearbeiten]

Kleine Aufgaben wie z.B. einen Titel für einen Chat zu generieren, werden oft von den kleinen Varianten der großen Sprachmodelle übernommen. Diese sind für die Aufgabe völlig ausreichend und verbrauchen weniger Ressourcen. Damit sind sie oft auch günstiger und schneller als die Verwendung der großen Sprachmodelle. Wie groß Sprachmodelle sind, kann anhand von Bezeichnern wie "mini" und "nano" oder der "Billion-Parameter" im Modelnamen eingeschätzt werden. Beispiele sind "Llama 3.1 8B" gegenüber "Llama 3.1 70B". Diese Zahl repräsentieren die Anzahl der "Einstellungen", die ein KI-Modell während des Trainingsprozesses lernt. Jeder Parameter kann als ein kleiner Baustein betrachtet werden, welches das Modell verwendet, um bestimmte Aufgaben zu erfüllen. Ein Modell mit einer höheren Anzahl an Parametern ist oft leistungsfähiger und kann komplexere Muster erkennen. Allerdings bedeutet dies auch, dass das Modell größer ist und mehr Ressourcen benötigt, um effizient zu arbeiten. Wichtig zu beachten ist, dass mehr Parameter nicht immer gleichbedeutend mit "besser" ist. Die Qualität eines Modells hängt stark vom spezifischen Einsatzkontext ab.

Llama 3.1 8B GPT-4.1 mini GPT-4o mini

Spezialisierte Modelle[Bearbeiten | Quelltext bearbeiten]

Welches Modell sollte ich nutzen?[Bearbeiten | Quelltext bearbeiten]

Die Wahl des passenden Sprachmodells hängt stark vom Anwendungsfall ab. Es gibt nicht das eine "beste" Modell, sondern vielmehr verschiedene Stärken und Schwächen, die je nach Bedarf unterschiedlich ins Gewicht fallen.

Allrounder oder spezialisierte Modelle?[Bearbeiten | Quelltext bearbeiten]

Allrounder sind vielseitig einsetzbar und eignen sich für Nutzer*innen, die flexibel mit vielen unterschiedlichen Aufgaben arbeiten wollen. Spezialisierte Modelle sind auf konkrete Aufgaben trainiert, etwa Programmierung, juristische Texte oder medizinische Fachsprache. Sie erzielen in diesen Nischen oft deutlich präzisere Ergebnisse, sind aber weniger universell einsetzbar. Wenn das Einsatzgebiet klar umrissen ist, kann ein spezialisiertes Modell besser passen. Für wechselnde oder schwer vorhersehbare Anforderungen sind Allrounder meist die bessere Wahl.

Ranglisten, Benchmarks und Scoring[Bearbeiten | Quelltext bearbeiten]

Im Internet finden sich zahlreiche Ranglisten und Benchmarks, in denen Modelle anhand ihrer Leistung in Tests bewertet werden. Dabei gilt es zu beachten:

  • Hersteller veröffentlichen oft eigene Benchmarks, die ihre Modelle ins beste Licht rücken.
  • Keine Rangliste deckt alle möglichen Anwendungsfälle ab. Ein Modell, das in akademischen Tests hervorragend abschneidet, ist nicht zwingend das nützlichste im Arbeitsalltag.
  • Externe, unabhängige Vergleichsportale können einen neutraleren Überblick bieten, sind aber trotzdem nur Anhaltspunkte.
  • Es gibt viele verschiedene Listen, welche je nach Metrik oder Evaluierungsmethode unterschiedliche Top-3 Modelle auswählen.

Rankings sind nützlich für eine grobe Orientierung, ersetzen aber nicht eigene Tests mit den tatsächlichen Aufgaben, die gelöst werden sollen.

Das Modell selbst befragen und vergleichen[Bearbeiten | Quelltext bearbeiten]

Eine praktische Methode, um die Stärken eines bestimmten Sprachmodells zu verstehen, besteht darin, das Modell selbst zu befragen. Viele Modelle können Hinweise geben, worin ihre spezifischen Stärken und Schwächen liegen, wodurch Nutzer*innen sie effektiver für ihre Zwecke einsetzen können.

Ein praktischer Ansatz zur Auswahl des richtigen Modells ist der direkte Vergleich:

  1. Dieselbe Aufgabe mit verschiedenen Modellen bearbeiten lassen.
  2. Die Ergebnisse systematisch prüfen: Verständlichkeit, Genauigkeit, Stil, Relevanz.
  3. Abwägen, welches Modell dem gewünschten Standard am nächsten kommt.

Diese Art des Praxis-Tests ist oft hilfreicher als jede externe Bewertung, da sie an Ihre individuellen Anforderungen ausgerichtet sind.

Ai-chat-multi-model-selection.png

Die Chat-Oberfläche unterstützt Sie beim Vergleichen, indem Sie über das "+"-Symbol mehrere Modelle gleichzeitig auswählen können und die Antworten direkt im Vergleich sichtbar werden.

Siehe auch[Bearbeiten | Quelltext bearbeiten]


Bei Fragen oder Problemen können Sie uns zu unseren Servicezeiten telefonisch oder per E-Mail erreichen:


☎ Helpdesk: +49 5251 60-5544 ☎ Medien: +49 5251 60-2821 E-Mail: zim@uni-paderborn.de

Oder Sie besuchen uns vor Ort: Sie finden das Notebook-Café gemeinsam mit dem Servicecenter Medien in H1.201.

Servicezeiten

Mo. – Do. Fr.
Vor-Ort-Support 08:30 – 16:00 Uhr 08:30 – 14:00 Uhr
Telefonsupport 08:30 – 16:00 Uhr 08:30 – 14:00 Uhr
Servicecenter Medien 08:30 – 16:00 Uhr 08:30 – 14:00 Uhr
Cookies helfen uns bei der Bereitstellung des ZIM HilfeWikis. Bei der Nutzung vom ZIM HilfeWiki werden die in der Datenschutzerklärung beschriebenen Cookies gespeichert.