Allgemeine Informationen
Anleitung | |
---|---|
Informationen | |
Betriebssystem | Alle |
Service | KI |
Interessant für | Angestellte und Studierende |
HilfeWiki des ZIM der Uni Paderborn |
noScribe kann Audioaufzeichnungen mit Hilfe der KI-Software Whisper automatisch in geschriebenen Texte umwandeln. Die Transkription kann auf einem lokalen Desktop-Rechner ausgeführt werden, benötigt aber einen einigermaßen aktuellen Rechner, damit die Transkription nicht zu lange dauert. Eine NVIDIA-Grafikkarte beschleunigt die Transkription, ist aber nicht erforderlich.
Hinweise zu Automatisierter Transkription[Bearbeiten | Quelltext bearbeiten]
Transkriptionen sind ein Hilfsmittel in der Forschung, um gesprochenes Wort (Gesprächsverläufe, Interviews, …) für eine spätere Analyse zu verschriftlichen. Dabei kommen verschiedene Transkriptionsmethoden zum Einsatz, die beispielswiese auch Tonfall und Sprechlautstärke wiedergeben oder Pausen, Verzögerungslaute und Versprecher berücksichtigen. Bei der Transkription findet somit bereits eine Interpretation der Daten statt. Wenn Sie automatisierte Transkriptionsverfahren verwenden, setzten Sie diese nicht unreflektiert ein, sondern kontrollieren Sie die generierten Texte, bearbeiten Sie sie nach und berücksichtigen Sie die für Ihre Forschungsfragen geeigneten Transkriptionsmethoden.
Datenschutz[Bearbeiten | Quelltext bearbeiten]
Bei der Verwendung von noScribe für eine automatiserte Transkription verbleiben die Tonaufnahmen lokal. Aus datenschutzrechtlicher Sicht müssen daher keine Vereinbarungen mit einem Cloud-Dienstleister geschlossen werden, dennoch müssen Sie den Datenschutz beachten und die erforderlichen Einwilligungen für die Anfertigung und ggf. KI-gestützte Auswertung von Audioaufnahmen einholen.
Automatisierte Transkription mit der Software noScribe[Bearbeiten | Quelltext bearbeiten]
noScribe ist
- eine KI-basierte Software zur Transkription von Interviews für qualitative Sozialforschung oder journalistische Zwecke.
- kostenlos und Open Source (GPL-3.0).
- Sie läuft vollständig lokal auf Ihrem Computer. Es werden keine Daten ins Internet gesendet.
- Sie kann verschiedene Sprecher unterscheiden und versteht rund 60 Sprachen (mehr oder weniger).
- Sie enthält einen Editor zum Überprüfen, Verifizieren und Korrigieren des Transkripts.
- Sie basiert auf Whisper von OpenAI, faster-whisper von Guillaume Klein und pyannote von Hervé Bredin.
noScribe ist über Github verfügbar (Sie verlassen den Webbereich der Universität Paderborn):
https://github.com/kaixxx/noScribe
Sie finden im Abschnitt „Download and Installation“ die Dateien zur Installation für verschiedene Betriebssysteme (Windows, MAC, …). Die Dateien sind recht groß (ca. 4 GByte) und erfordern beim Download eine stabile Netzwerkanbindung.
Installation[Bearbeiten | Quelltext bearbeiten]
Im Folgenden wird die Installation für einen Windows-PC ohne NVIDEA-Grafikkarte beschrieben, auf anderen Systemen erfolgt die Installation analog und wird auf der Github-Seite (in englischer Sprache) erläutert.
Laden Sie unter folgendem Link die Datei „noScribe_setup_<Versionsnummer>_cuda.exe“ auf Ihren Rechner herunter (Sie verlassen den Webbereich der Universität Paderborn): https://drive.switch.ch/index.php/s/EIVup04qkSHb54j Führen Sie die Datei „noScribe_setup_<Versionsnummer>_cuda.exe“ aus und installieren Sie die Software.
Danach kann noScribe gestartet werden.
Anleitung[Bearbeiten | Quelltext bearbeiten]
In der Oberfläche kann man oben links die zu transkribierende Audiodatei oder Videodatei auswählen.Darunter muss der Dateinamen angeben werden, unter dem die Transkription gespeichert werden soll. Unten links den Start-Button drücken und los geht’s …
Da die Transkription auf einem einfachen PC ein Mehrfaches der Interviewlänge dauert, empfiehlt es sich mit ein paar Minuten zu beginnen (z.B. Eingabe 00:00:00 bis 00:02:00 –die ersten zwei Minuten) und die Einstellungen zu Sprache, Qualität, Pause etc. zu testen. Nach der Transkription öffnet sich ein Editor-Fenster, in dem der Text angezeigt wird. Dort lässt sich die Transkription noch einmal anhören und kann ggf. korrigiert und wieder gespeichert werden.
Die Anleitung des Programmierers ist in englischer Sprache auf der Seite https:/ /github.com/kaixxx/noScribe?tab=readme-ov-file unter „Usage“ zu finden. Eine Videoanleitung von Forge Ideas auf Youtube beschreibt die Nuzung von noScribe (Sie verlassen den Webbereich der Universität Paderborn): https://www.youtube.com/watch?v=dNvBrLb4CDs
Hier finden Sie einen Erfahrungsbericht zu noScribe (Sie verlassen den Webbereich der Universität Paderborn): https://sozmethode.hypotheses.org/2315