AI-Chat: Wissensbasen aufbauen: Unterschied zwischen den Versionen

ZIM HilfeWiki - das Wiki
 
Zeile 33: Zeile 33:
  
 
=== Was passiert mit meinen Daten? ===
 
=== Was passiert mit meinen Daten? ===
Hochgeladene Dokumente werden lokal auf den Servern der Universität Paderborn verarbeitet und gespeichert. Nur Sie bzw. Freigaben auf den Wissensspeicher haben Zugriff auf diese Daten. Die Dokumente durchlaufen eine Aufbereitung, um die Dokumente für KI-Systeme verständlich und eine semantische Suche funktionsfähig zu machen. Im Gegensatz zu kommerziellen Lösungen werden die folgenden Schritt lokal an der Universität durchgeführt und erhöhen damit Ihren Datenschutz.
+
Hochgeladene Dokumente werden lokal auf den Servern der Universität Paderborn verarbeitet und gespeichert. Nur Sie bzw. Freigaben auf den Wissensspeicher haben Zugriff auf diese Daten. Die Dokumente durchlaufen eine Aufbereitung, um die Dokumente für KI-Systeme verständlich und eine semantische Suche funktionsfähig zu machen. Im Gegensatz zu kommerziellen Lösungen werden die folgenden Schritte lokal an der Universität durchgeführt und erhöhen damit Ihren Datenschutz.
  
 
# Hochladen der Dokumente auf https://ai-chat.upb.de
 
# Hochladen der Dokumente auf https://ai-chat.upb.de

Aktuelle Version vom 20. November 2025, 16:04 Uhr

Allgemeine Informationen
Anleitung
Informationen
BetriebssystemAlle
ServiceKI
Interessant fürAngestellte und Studierende
HilfeWiki des ZIM der Uni Paderborn

no displaytitle found: AI-Chat: Wissensbasen aufbauen

Für Beschäftigte ist der Arbeitsbereich im AI-Chat (https://ai-chat.upb.de ) freigeschaltet, welcher nützliche Funktionen beinhaltet. Darunter ist die Kategorie "Wissen" zu finden. KI-Modelle sind oft beschränkt auf ihre Trainingsdaten und haben keine Inhalte über ihre internen Daten. Daten dienen allerdings oft als Treiber für KI-Modelle um den Kontext Ihrer Anfrage richtig einzuordnen oder fehlendes Wissen überhaupt erst nachzuliefern ohne welches eine richtige Beantwortung der Frage nicht möglich wäre. Mit der Option "Wissen" können Sie Kollektionen Ihrer Dokumente, Texte und Inhalte verschiedener Art hochladen. Diese Daten bzw. Wissen kann in Verbindung mit den Chats, KI-Helfer (Modelle) und KI-Modelle genutzt werden, sodass hilfreiche Antworten auf Ihrem notwendigen Kontext möglich sind.

Neben "Wissen" gibt es noch die Reiter "Modelle" und "Prompts". Eine Anleitung zu den KI-Helfern (Modelle) finden Sie unter AI-Chat: Eigene KI-Assistenten erstellen und zu Prompts unter AI-Chat: Prompt-Bibliothek

Arbeitsbereich "Wissen"[Bearbeiten | Quelltext bearbeiten]

  1. Melden Sie sich mit Ihrem Uni-Account auf https://ai-chat.upb.de an. Sollten Sie den Dienst noch nicht freigeschaltet haben, folgen Sie bitte zunächst der Anleitung AI-Chat
  2. Öffnen Sie den Arbeitsbereich (1) über das linke Menü. Sollten Sie keinen Arbeitsbereich sehen, haben Sie (noch) nicht die benötigten Rechte. Der Arbeitsbereich ist für Studierende nicht freigeschaltet. Für Beschäftigte werden die Rechte nach erstmaliger Anmeldung synchronisiert.
    Screenshot_Arbeitsbereich KI
  3. Auf der nun geöffneten Seite befinden sich oben die Tabs (2) "Modelle", "Wissen" und "Prompts". Wechseln Sie auf die Seite/Tab "Wissen" und öffnen Sie diese.
  4. Über das "+Neues Wissen" am rechten Bildschirmrand (3) können Sie eine Sammlung von Wissen bzw. Dokumenten erstellen.
  5. Mit Hilfe der "..." rechts neben dem Name der Kollektion öffnet sich ein Kontextmenü. Mit der Funktion "Löschen" können Sie Ihre Dokumente jederzeit wieder aus dem System entfernen sowie Ihre aufbereiteten Daten in der (Vektor-)Datenbank.

Neues "Wissen" erstellen[Bearbeiten | Quelltext bearbeiten]

  • Sie haben bereits über den Arbeitsbereich "Wissen" die Schaltfläche "+Neues Wissen" betätigt, wie oben beschrieben. Es öffnet sich ein Dialog-Fenster mit einer Eingabemaske:
    • Zunächst geben Sie dem Wissensspeicher einen Namen "Woran arbeiten Sie?"
    • und ggf. eine Beschreibung "Was versuchen Sie zu erreichen?"
    • Der Wissensspeicher ist zunächst auf privat gestellt, möchten Sie den Wissensspeicher mit Ihrer Arbeitsgruppe (LDAP-Gruppe) teilen, können Sie aktuell auf Anfrage an ki-kontakt@upb.de diese mit AI-Chat synchronisieren lassen, sodass diese auch im AI-Chat verfügbar sind. So können Sie z.B. gezielt für Ihre Fachgruppe gemeinsam an einer Wissensbasis arbeiten. Wenn Sie noch nicht die passende Gruppe haben, folgen Sie folgender Anleitung für die Erstellung einer neuen LDAP-Gruppe: Gruppenverwaltung Neue Gruppe beantragen
    • Über die Schaltfläche "Wissen erstellen" wird die neue Kollektion angelegt.
  • Diesen Wissensspeicher füllen Sie nun mit Dateien, Verzeichnissen (Ordner) oder indem Sie Textinhalte einfügen.
  • Den "Wissensspeicher" können Sie jederzeit bearbeiten, indem Sie diesen anklicken. Damit lassen sich jederzeit der Name, die Zugangsberechtigungen und die Wissensbasis anpassen

Hinweis: Das Erstellen und auch das spätere Abrufen von Wissen dauert jeweils einen Augenblick, das ist ganz normal.

Wissensspeicher erstellen
Wissensspeicher erstellen

Wie verwendet man das "Wissen"?[Bearbeiten | Quelltext bearbeiten]

Die einmal angelegte Wissensbasis lässt sich Vielseitig mit Chats und KI-Helfern (Modellen) verbinden:

  1. Sie können den Wissensspeicher zur Basis eines Modells machen und bei der Modellerstellung auswählen.
  2. Im Chat-Dialog kann über das "+"-Symbol und der Menüauswahl "Wissensspeicher anhängen", ein Korpus ausgewählt. Auch können einzelne Dokumente, Webadressen oder alte Chats referenziert werden.
  3. Per Texteingabe können Sie ebenfalls Wissen (ggf. schneller) referenzieren. Mithilfe von „#“ + Name des Wissensspeichers, Webadresse oder Dokument im Chat-Eingabefenster. Die KI bezieht das Wissen dann bei der Bearbeitung von Anfragen mit ein.

Was passiert mit meinen Daten?[Bearbeiten | Quelltext bearbeiten]

Hochgeladene Dokumente werden lokal auf den Servern der Universität Paderborn verarbeitet und gespeichert. Nur Sie bzw. Freigaben auf den Wissensspeicher haben Zugriff auf diese Daten. Die Dokumente durchlaufen eine Aufbereitung, um die Dokumente für KI-Systeme verständlich und eine semantische Suche funktionsfähig zu machen. Im Gegensatz zu kommerziellen Lösungen werden die folgenden Schritte lokal an der Universität durchgeführt und erhöhen damit Ihren Datenschutz.

  1. Hochladen der Dokumente auf https://ai-chat.upb.de
  2. Lokale Daten-Extraktion von PDFs, Word, PowerPoint, etc. nach einfachem Text.
    • Die Umwandlung der verschiedenen Dateitypen, Formate und Layouts ist für die Daten-Extraktion eine herausfordernde Aufgabe. Die Entwicklung dieser Systeme schreitet stätig voran und werden verbessert. Auch ist der Kontext der Dokumente entscheidend wie die Daten interpretiert und verarbeitet werden. Handelt es sich um ein Research-Paper im typischen 2-Spalten-Layout? Um einen Marketing-Flyer? Präsentationsfolien mit wenig Text, vielen Bildern und Diagrammen? Wie können Tabellen über mehrere Seiten extrahiert werden? Dies sind nur einige Problemstellungen.
    • Die extrahierte Ausgabe kann im AI-Chat in der Wissensbasis begutachtet werden, indem auf die einzelnen Dokumente geklickt wird. Der Text erscheint in der linken Ausgabe.
  3. Texte in Inhaltsabschnitte zerteilen (Chunking)
  4. Die Inhaltsabschnitte in Vektoren umrechnen (Lokales Embedding)
  5. Speichern der Vektoren in einer lokalen Vektordatenbank

Die Vektoren dienen der Funktion einer Ähnlichkeitssuche. Wenn Sie einen Chat mit Ihrer Wissensbasis verbinden und eine Frage stellen, wird die Frage zunächst mit dem gleichen lokalen Embedding vektorisiert. Der Vektor der Frage kann nun in der Vektordatenbank mit den Vektoren der Inhaltsabschnitte verglichen werden. Die relevantesten Treffen werden aus der Datenbank geladen. Als Nachricht wird nun Ihre Frage mit den gewonnen Kontext als kombinierter Text an das KI-Modell geschickt. Im optimalen Fall ist also das Wissen um eine richtige Antwort zu generieren, bereits in der Nachricht enthalten, sodass ein KI-Modell nur noch einen sinnvollen Antworttext aus den Informationen generieren muss. Je nachdem welches KI-Modell Sie für diese Aufgabe auswählen (OpenAI, GWDG oder UPB) schicken Sie also eine Auswahl von Inhaltsabschnitten Ihrer Dokumente zu den KI-Providern. Wählen Sie also die UPB oder GWDG für einen erhöhten Datenschutz. Oder andernfalls die OpenAI-Modelle. Ein Training mit Ihren Daten findet nicht statt. Hier geht es lediglich um die transparente Darstellung des Datenfluss.


Bei Fragen oder Problemen können Sie uns zu unseren Servicezeiten telefonisch oder per E-Mail erreichen:

☎ Helpdesk: +49 (5251) 60-5544 ☎ Medien: +49 (5251) 60-2821 E-Mail: zim@uni-paderborn.de

Oder Sie besuchen uns vor Ort: Sie finden das Notebook-Café gemeinsam mit dem Servicecenter Medien in H1.201.

Servicezeiten

Mo - Do Fr
Vor-Ort-Support 08:30 - 16:00 08:30 - 14:00
Telefonsupport 08:30 - 16:00 08:30 - 14:00
Servicecenter Medien 08:30 - 16:00 08:30 - 14:00
Cookies helfen uns bei der Bereitstellung des ZIM HilfeWikis. Bei der Nutzung vom ZIM HilfeWiki werden die in der Datenschutzerklärung beschriebenen Cookies gespeichert.