Teaser KIMD

Wie Künstliche Intelligenz die Arbeit erleichtert

Stand: 19.08.2021, 15:45 Uhr

Sie kann zwar ohne menschliche Hilfe noch "keine Geschichten erzählen", aber dafür hilft Künstliche Intelligenz an anderen wichtigen Stellen. Verschiedene Projekte im WDR machen Lust auf mehr.

Wenn die bekannte Stimme einer Radiomoderatorin heutzutage Fußball-Ergebnisse präsentiert, gehen die Hörer:innen bislang davon aus, dass es sich dabei tatsächlich um diese Moderatorin handelt. Was wäre, wenn in Zukunft diese Stimme in Wirklichkeit mit Hilfe von Künstlicher Intelligenz (KI) erzeugt wird?

Fragen der Zukunft schon heute im Fokus

Auch im WDR führt schon jetzt kein Weg an KI vorbei. Im Innovation Hub beschäftigen sich Mitarbeiter:innen aus allen Direktionen des Hauses mit drängenden Zukunftsfragen. "Wir setzen uns nicht nur mit inhaltlichen und journalistischen, sondern gleichermaßen auch mit strukturellen und technischen Innovationen auseinander", erklärt Philipp Sevenich, der seit Anfang 2020 im Team ist.

Fußball-Ergebnisse von der Lieblingsstimme

Philipp Sevenich

Philipp Sevenich

Im Bereich der Künstlichen Intelligenz experimentiert der Innovation Hub gerade zum sensiblen Thema "Synthetische Medien". Auf der re:publica 21 stellte der WDR seinen eigenen Prototypen erstmals vor. Eine mit Hilfe von KI erzeugte Stimme der bekannten Radiomoderatorin Steffi Neu kann Inhalte vortragen, die sie selbst als Person nie gesagt hat. Ein Unterschied zur realen Stimme sei kaum noch zu hören, sagt Sevenich. Das birgt Risiken, könnte aber in Zukunft ein personalisiertes Radioprogramm unter anderem über Sprachassistenzsysteme möglich machen. „Zum Beispiel könnten zukünftig auch Fußball-Spielberichte aus der 3., 4., 5. Liga, wo die Zielgruppe immer spitzer wird, Interessierten personalisiert von ihrer WDR-Lieblingsstimme vorgetragen werden“, erklärt Sevenich.

Synthetische Medien: Klare Regeln sind gefragt

Synthetische Medien bieten große Chancen. Das wird auch im Zukunftsreport deutlich, den der Innovation Hub erarbeitet hat. Ein Thema darin ist natürlich auch der gewissenhafte Umgang mit diesen Technologien, die auch Manipulationsrisiken mit sich bringen. Dessen sind sich die Expert:innen im WDR bewusst.

Auch wenn der konkrete Einsatz von synthetischen Medien noch Zukunftsmusik ist, sind klare Regeln und Handlungsempfehlungen wichtig, wie zum Beispiel ethische Leitlinien. Daran wird im WDR weiter gearbeitet.

Rechercheergebnisse innerhalb von Sekunden

Dirk Maroni

Dr. Dirk Maroni

Schon jetzt hilft Künstliche Intelligenz Journalist:innen im Alltag dabei, jede Menge Zeit zu sparen. Wie das funktioniert, zeigt Dirk Maroni, Abteilungsleiter des Informationsmanagements im WDR, am Computer. "Der Journalistenverband fordert den Verkaufsstopp", markiert er mit dem Curser in einem Textes über das Verlagshaus Dumont. Ein Klick auf "Clip erstellen", und in Sekundenschnelle ist ein Ausschnitt mit genau dieser Textpassage aus einem längeren Video herauskopiert. "Stellen Sie sich vor, das sind jetzt vier Stunden Rohmaterial, und nicht nur die 30 Sekunden, die ich hier zu Demonstrationszwecken hochgeladen habe", sagt Maroni. "Die Suche ohne KI würde ewig dauern." Der Vorteil jetzt: Man muss das Material nicht mehr durchgucken und nach der gewünschten Passage suchen. Sie wird von der KI sofort aufgespürt.

KIMD sorgte direkt für Begeisterung

Was Maroni hier vorführt, ist eine Weboberfläche mit dem Namen KIMD, die den Mitarbeiter:innen in den Redaktionen die Arbeit leichter macht. "KIMD steht für 'Künstliche Intelligenz Metadaten Demonstrator', und wir haben es ursprünglich nur entwickelt, um Journalist:innen zu zeigen, was KI kann – daher der Name", erläutert Maroni. Doch die Begeisterung war so groß, dass das Tool schon bald im WDR Newsroom eingesetzt wurde, später auch in den Regionalstudios und weiteren Redaktionen. "Mittlerweile können es alle Redaktionenim Haus nutzen", so Maroni.

Kinderleichte Navigation

Doch was kann das System noch? Mit Hilfe von Künstlicher Intelligenz ist es möglich, unter anderem gesprochenen Text aus Videos oder Audios in Schrift umzuwandeln. Auch Stimmen und Gesichter werden erkannt und wiedergefunden. KIMD ermöglicht so die kinderleichte Navigation innerhalb des Materials, um es in kurzer Zeit journalistisch weiterzuverarbeiten – beispielsweise um Social-Media-Clips zu erstellen. Die hier eingesetzte KI wird laufend weiterentwickelt und "trainiert", um die Funktionen zu perfektionieren.

Crossmedial nach Inhalten graben

Screenshot KIMD

Die Idee der crossmedialen Suche entstand ursprünglich für die Video-, Audio- und Pressearchive der ARD. Seit 2017 entwickelt ein Team aus Mitarbeiter:innen des Informationsmanagement, der Dokumentation und Archive und ProWorX ein System namens Media Data Hub – in Kooperation mit dem Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme (IAIS). Mit dem Media Data Hub können Journalist:innen crossmedial in den Archivbeständen der gesamten ARD nach Inhalten suchen. Dafür werden Metadaten auch automatisch mit KI erhoben. Wir erreichen so eine Angebotserweiterung, die "per Hand" nie zu erreichen wäre. "Das Besondere daran ist, dass wir die Erkennungsverfahren selbst trainieren und nicht auf bereits bestehende Verfahren zurückgreifen", erklärt Maroni. Das Training für die KI übernehmen dabei Mitarbeiter:innen aus der Abteilung Dokumentation und Archive, die wie das Informationsmanagement zur WDR-Verwaltungsdirektion gehört. "Die Kolleg:innen kennen sich mit Sprache und Recherche aus, ich kenne mich nur mit Technik aus“, meint Maroni. „KI ist immer eine interdisziplinäre Angelegenheit."

ARD-Mediathek: KI soll Barrierefreiheit verbessern

In der ARD-Mediathek wird KI testweise eingesetzt, um die Barrierefreiheit zu verbessern. Die ARD-Arbeitsgruppe "Sprachverständlichkeit" sucht Lösungen für eine bessere Verständlichkeit von Fernsehbeiträgen. Für Menschen mit eingeschränktem Hörvermögen wird dafür die Sprache in den Beiträgen hervorgehoben, Hintergrundgeräusche und Musik werden dagegen zurückgenommen. Unter dem Suchbegriff "Klare Sprache" sind einzelne Test-Beiträge schon auffindbar.

In Kooperation mit der Madsack Mediengruppe haben WDR und NDR eine Plattform gebaut, die KI nutzt, um automatisiert passende Beiträge aus den ARD-Mediatheken in Artikel einzubetten. Das Angebot soll auf andere Verlage ausgeweitet werden.

Die KI braucht Menschen an der Seite

Der so genannte Roboter-Journalismus, das heißt von KI erstellte journalistische Inhalte, spielt im WDR bislang noch keine entscheidende Rolle. Wetterdaten, Wahlergebnisse oder Corona-Infektionszahlen könnten zwar bereits automatisiert zusammengestellt werden, so Maroni. Aber KI alleine – ohne Mensch an der Seite – könne – Stand jetzt – keine Geschichten erzählen. "Sie ist ein Hilfsmittel, das die Arbeit einfacher machen soll", betont Maroni, der auch Mitglied im ARD-Speaker:innen-Netzwerk für Digitalthemen ist.

An einem Beispiel macht Maroni abschließend deutlich, dass Künstliche Intelligenz nur das kann, was Menschen ihr beibringen. "Die von uns trainierte KI für die Sprechererkennung hat einen Sprecher häufig falsch erkannt. Schließlich haben wir festgestellt, dass das Trainingsmaterial verunreinigt war: Es gab darin ein Klatschen bei einem Sprecher im Hintergrund, also hat die KI überall da diesen Sprecher vermeintlich wiedererkannt, wo ein Klatschen zu hören war."