Saarland University Medical Center and Saarland University Faculty of Medicine
Digitales Diktieren / Spracherkennung
Leitung: Dipl.-Inform. Lutz Trautmann
Digitales Diktieren

Mit Hilfe der Software MBS-easy der Firma Kuhlmann Informations-Systeme GmbH besteht die Möglichkeit, Diktate digital zu erfassen, auf einem zentralen Diktatserver abzuspeichern und workflowunterstützend an die zuständige Schreibkraft weiterzuleiten. Die am Universitätsklinikum des Saarlandes eingesetzte Software hat die Version 3.5.7. Diese Version zeichnet sich im Vergleich zu den Vorgängerversionen dadurch aus, dass besonderen Wert auf den Datenschutz gelegt wurden. Dazu werden Benutzer- und Diktatinformationen in einer Datenbank gehalten. Ein Anweder erhält nur mittels Benutzername und Kennwort Zugriff auf die Diktate, für die er durch ein hierarchisches Rollenkonzept berechtigt ist. Die Firma Kuhlmann IS ist dafür mit dem Datenschutz-Gütesiegel des Unabhängigen Landeszentrums für Datenschutz Schleswig-Holstein (ULD) ausgezeichnet worden. Dem Universitätsklinikum steht eine Campuslizenz der MBS-easy-Software zur Verfügung.

MBS-easy unterstützt Digitales Diktieren am stationären Rechner und den Einsatz von mobilen Diktiergeräten. Es besteht die Möglichkeit, ein digitales Diktat patienten- und fallbezogen direkt aus dem Krankenhausinformationssystem SAP IS-H*MED heraus anzulegen. Damit erhält das Diktat einen eindeutigen Bezug zu einem Patienten und einem Dokument der elektronischen Patientenakte (EPA). Das Diktat steht Sekunden später bereits im Sekretariat zur Verfügung. MBS-easy kann auch autonom betrieben werden. Diese Methode erlaubt es, ein Diktat auch ohne Patientenbezug zu erstellen und von einer Schreibkraft bearbeiten zu lassen. Dazu bietet MBS-easy entsprechende Oberflächen insbesondere die Diktatinformationsliste an, welche alle Diktate der Klinik zur Ansicht bringt und aus welcher die Schreibkraft das Diktat abhören kann.

Das Zentrum für Informations- und Kommunikationstechnik betreibt einen zentralen Diktatserver, welcher filebasiert die Diktate abspeichert und wieder zur Verfügung stellt. Das Betriebssystem dieses Servers ist Windows 2003 Server. Es handelt sich um einen Zweiprozessor-Server der Firma DELL in einem 19"-Rack-Gehäuse. Die integrierten Festplatten werden täglich vom Legato Networker auf dem Bandroboter des ZIK gesichert. Zusätzlich wird ein Testserver betrieben (virtueller Server auf Basis von VMWare mit Windows 2003 Server-Betriebssystem), der innerhalb kurzer Zeit als Ausfallserver für den produktiven Server konfiguriert werden kann.

 


Spracherkennung

Die Firma Philips Speech Recognition Systems GmbH bietet mit der Software SpeechMagic die Möglichkeit, digitale Diktate mittels Spracherkennung direkt in Text zu wandeln. Die momentan am Universitätsklinikum des Saarlandes eingesetzte Software hat die Version 5.1 mit dem Service Release 1.

Mit SpeechMagic in Verbindung mit MBS-easy als Diktiersystem besteht die Möglichkeit der offline- und der online-Spracherkennung. Bei der offline-Erkennung wird das Diktat in den Aufnahmerekorder von MBS-easy gesprochen und anschließend an den Erkennungsserver geschickt. Dieser wandelt im Hintergrund aus dem gesprochenen Wort das geschriebene und stellt beides der Schreibkraft in der MBS-Diktatinformationsliste zur Korrektur zur Verfügung. Wurde das Diktat aus einem parametrierten Dokument in SAP heraus gestartet, besteht nun die Möglichkeit der automatischen Übernahme des Textes in das SAP-Dokument. Bei der online-Erkennung wird zunächst das komplette Sprachprofil, die akustische Stimmreferenz, sowie der Sprachkontext (Wörterbuch) auf den lokalen Rechner übertragen. Beim anschließend stattfindenden Diktat kann der Autor sehen, wie der Text, den er diktiert, sich in einem Editor-Fenster aufbaut.

Mit jedem Diktat wird die akustische Stimmreferenz und das Sprachprofil des Autors aktualisiert, so dass sich eine Verbesserung der Erkennungsrate einstellen sollte. Außerdem kann mittels der Kontextadaption, die von einem SpeechMagic-User ausgeführt werden muss, das der Erkennung zu Grund liegende Wörterbuch erweitert werden. In der Kontextadaption stehen alle Wörter zur Verfügung, welche nach der Korrektur des Diktates nicht im Kontext enthalten waren. Auch dies dient dem Lernprozess des Systems.

Neben dem Diktatserver, welcher für MBS-easy benötigt wird, ist für die Spracherkennung mindestens ein weiterer Server notwendig, welcher einen Teil der Aufgaben für die Spracherkennung übernimmt. Mit zunehmender Nutzerzahl kann auch die Zahl der Erkennungsserver erhöht werden. Dazu ist nicht immer ein eigener Server notwendig. Auf einem Windows-Server, welcher lediglich als Domänenkontroller oder File-Server dient, kann durchaus auch der Erkennungsdienst für SpeechMagic mitlaufen. Ein Dispatcher-Dienst sorgt für eine gleichmäßige Lastverteilung zwischen den einzelnen Erkennungsservern. Momentan werden am Universitätsklinikum 2 parallele Erkennungsserver betrieben.

Stand: 25.04.2007