Untertitel in Filmen und Fernsehsendungen sehen bisher immer gleich aus: Zwar wird der Inhalt des Gesprochenen wiedergegeben, aber Emotionen und Stimmungen lassen sich daraus nicht nachvollziehen. Gerade für Hörgeschädigte beeinträchtigt dies das Filmvergnügen.
Der aus Ettlingen stammende Informatiker Tim Schlippe will damit Schluss machen und hat mit WaveFont eine Technologie entwickelt, mit der sich Stimmungen in Untertiteln darstellen lassen. Wie das funktioniert, erklärt er uns im Interview.
Lieber Tim, du hast mit WaveFont eine Technologie entwickelt, mit der sich Stimmungen in Filmuntertiteln grafisch darstellen lassen. Erzähle mir doch in ein paar kurzen Sätzen mehr über dein Projekt.
Ich habe das Startup Silicon Surfer gegründet und mit WaveFont eine Technologie und Darstellungsweise entwickelt, mit der es erstmals möglich ist, Informationen (z.B. Betonung, Geschwindigkeit, Pausen) und Emotionen aus der Stimme automatisch und intuitiv in Untertiteln darzustellen. Vor allem für Hörgeschädigte bringt die WaveFont-Untertitelung einen Mehrwert gegenüber der herkömmlichen Darstellungsweise, weil sie Informationen aus der Stimme erhalten, von denen sie vorher komplett oder zum Teil ausgeschlossen waren. Meine Umfrage bei deutschen Gehörlosenvereinen und -verbänden zeigte beispielsweise, dass 98% der Befragten den deutlichen Mehrwert sehen.

Aufgrund der positiven Rückmeldungen werde ich WaveFont weiterentwickeln und erreichen, dass WaveFont-Untertitel optional in Mediatheken, beim Streaming, in Playern etc. eingeschaltet werden können. Um das zu finanzieren, habe ich auch eine Crowdfunding-Kampagne begonnen, die noch bis zum 5. August läuft.
Nachdem wir jetzt mehr über WaveFont wissen, möchten wir natürlich auch etwas über den Gründer erfahren. Was hast du vor deiner Gründung des Startups Silicon Surfer gemacht und wie ist die Idee zu WaveFont entstanden?

Ich habe am KIT Informatik studiert und im Bereich der Multilingualen Spracherkennung promoviert. Anschließend arbeitete ich bei einem Unternehmen, das Software für Computer-Aided Translation entwickelt und weltweit vertreibt. Seit über 2 Jahren habe ich das Startup Silicon Surfer. – ein Unternehmen, das Signalwellen verarbeitet und dafür IT-Technologien einsetzt – zunächst nebenberuflich und dann hauptberuflich.
WaveFont habe ich zusammen mit dem Professor für Interaktive Medien Prof. Dr. Matthias Wölfel und dem Typografie-Experten Angelo Stitz entwickelt. Die beiden unterstützen mich heute noch.
An welche Zielgruppe richtet sich WaveFont?
Die Konsumenten/Nutzer von WaveFont-Untertiteln sind in erster Linie Hörgeschädigte, aber auch Sprachenlernende und Menschen, die Filme ohne Ton schauen (Silent Auto-Play in Social Media, Bahnhof, Flughafen, Fitnessstudio, Sportsbar usw.).
Meine Kunden sind Fernsehsender, Filmproduzenten, Video-on-Demand-Anbieter, Mediathek-Betreiber, Werbe-Agenturen, Social Media Netzwerke und jeder, der einen Film produziert und zur Barrierefreiheit, Inklusion und Integration beitragen möchte.
Was sind die Nachteile bisheriger Untertitel?
Herkömmliche Untertitel geben Informationen darüber, WAS gesprochen wird, jedoch nicht WIE es gesagt wird: Betonungen, Pausen, Längen und Emotionen werden nicht berücksichtigt. Dadurch ist das Film- und Fernseherlebnis für hörgeschädigte Zuschauer begrenzt und die Sender erreichen Barrierefreiheit nur zu einem gewissen Grad.
Deine Technologie wurde ja bereits einer Gehörlosen-Gruppe vorgestellt. Wie war deren Reaktion?
Die Umfrageergebnisse bei den deutschen Gehörlosenvereinen und -verbänden waren durchweg positiv:
• 98% der Befragten würden Untertitel mit WaveFont nutzen.
• 96% finden, dass WaveFont einen deutlichen Mehrwert bietet.
In den letzten Monaten hatte ich noch viele weitere positive Rückmeldungen zu WaveFont-Untertiteln und u.a. auch Artikel in der Deutschen Gehörlosenzeitung und auf Taubenschlag, dem Deutschen Portal für Tube und Schwerhörige.
Wie werden die einzelnen Buchstaben semantisch dargestellt?
Unsere Analysen haben gezeigt, dass die folgenden Darstellungsweisen optimal sind:
• Wenn jemand lauter spricht, wird die Schrift dicker. Denn eine fette Schrift erzeugt mehr visuelle Aufmerksamkeit.
• Spricht jemand langsamer, was man mit einer langsamen ausgeführten Geste wie in Zeitlupe vergleichen könnte, werden breitere Buchstaben erzeugt. Breite Buchstaben bilden breitere Wörter und „verlängern“ die Zeit, die man zum Lesen braucht.
Analog wird die Schrift dünner, wenn leiser gesprochen wird und enger, wenn schneller gesprochen wird. Auch andere visuelle Darstellungsweisen oder Spracheigenschaften sind denkbar, die spezielle Zielgruppen von Lesern berücksichtigen.
Wie lange dauert die Umsetzung von Sprache in Schrift und ist auch eine Liveübertragung möglich?
Die Erzeugung von WaveFont-Untertiteln kann unter Echtzeit erfolgen und lässt sich gut in die Pipeline von Liveuntertitelungen integrieren.
Wie weit ist die Entwicklung deiner Software und was steht aktuell noch an?
Meine Software zur Erstellung von WaveFont-Untertiteln setzt unter anderem Methoden der Signalverarbeitung und Spracherkennungsalgorithmen ein, um aus Text und Ton von Gesprochenem WaveFont-Untertitel zu erstellen und im Film darzustellen. Der Ton des Gesprochenen wird aus dem Video extrahiert. Der Text kann mithilfe von Spracherkennung erzeugt werden. Alternativ kann die Software die gängigen Untertitel-Dateiformate (z.B. srt, vtt) verarbeiten, um WaveFont-Untertitel zu erzeugen.
Aktuell steht die Vermarktung von WaveFont an. Auch plane ich, WaveFont als Standardtechnologie zu etablieren und auf neue Sprachen und Schriftsysteme zu portieren. Deshalb arbeite ich auch an einem eigenen Videoplayer. Aber ich werde die Möglichkeit WaveFont-Untertitel einzuschalten auch in existierende Player einzubauen.
Über welche Stolpersteine musstest du während der Gründung steigen?
Eine große Herausforderung ist die Finanzierung: Zunächst war die Entwicklung eigenfinanziert. Verschiedene Finanzierungsförderungen wurden nicht genehmigt, weil das Produkt nicht weit genug entwickelt war. Momentan erhalte ich den Gründungszuschuss – die staatliche Transferleistung zur Förderung einer Existenzgründung.
Für die weitere Finanzierung habe ich eine Crowdfunding-Kampagne bei Startnext mit einem Fundingziel von 10.000€ gestartet, die bis zum 5. August läuft Die Kampagne ist an die Mikrocrowd der baden-württembergischen L-Bank gebunden. Bei Erreichen der Crowdfunding-Ziels wird die L-Bank einen Kredit von 10.000€ bereitstellen.
WaveFont in 5 Jahren: Wo soll es für dein Startup noch hingehen?
Momentan setze ich noch einzelne Videos (u.a. aus YouTube) in deutscher und englischer Sprache um. Dieses Angebot möchte ich schrittweise ausbauen. Mein Ziel ist es, diesen Service für verschiedene Portale mit einem riesigen Angebot für viele andere Sprachen anzubieten, damit Menschen weltweit profitieren können.