Sprache-zu-Text : Philips-Speech-CTO Wilfried Schaffner: Mr. Transcript

Philips Speech Innovator Schaffner
© Philips Speech

Er legte die ersten Grundsteine seiner Laufbahn in Sydney und Los Angeles. Erlebte nach seinem Studium an der FH Hagenberg Internethochphasen und Valley-Flair ebenso wie den Vormarsch der Cloud. 2013 war Wilfried Schaffner zurück in Österreich. Dort übernahm er gemeinsam mit Verleger Andreas Langenscheidt von Sebastian Heinzel das Online-Reiseportal Tripwolf und baute es zu einem Reiseführer-App-Business mit mehr als 13 Millionen Usern weltweit um.

So unterschiedlich die Branchen und Betätigungsfelder, seiner beruflichen Leidenschaft blieb Schaffner bis heute treu: Geschäftsmodelle rund um Software-as-a-service-Dienste in der Cloud ziehen den ausgebildeten Softwareingenieur Anfang der Zweitausenderjahre in den Bann, bald entwickelt er am anderen Ende der Welt Onlineportale und vertreibt E-Commerce-Lösungen. Auch heute bewegt sich Schaffner, seit 2018 CTO bei der in Wien domizilierten Philips Speech, einem Spezialisten für Sprache-zu-Text-Services, in der Welt der Abomodelle und Dienste in der Rechnerwolke auf sicherem Terrain.

„Früher undenkbar, erfolgt die Sprachverwaltung bei uns schon vollständig in der Cloud“, sagt Schaffner. Die Login-Daten der Cloudlösung lagern - DSGVO-konform - im steirischen Mürztal im Hochsicherheits-Serverzentrum der Kapsch BusinessCom mit 38 elektronischen Zutrittskontrollpunkten.

Cloud-User-Zahlen schießen in Höhe

Dass der Mann, dessen Mannschaft sich zuletzt über eine Verdopplung der Benutzerzahlen bei Cloudservices freuen durfte, am 1953 gegründeten Standort Wien noch einiges vorhat, passt ins Bild. So wird man künftig vermehrt - und in kürzeren Zyklen - mit Lösungen im „schnelldrehenden Segment der Spracherkennung“ (O-Ton Schaffner) auf Kunden zugehen. Nicht mit der Big-bang-Methode, sondern iterativ: „Wir entwickeln in engem Abgleich mit Kunden Prototypen und treiben gemeinsam die Entwicklung voran“, so Schaffner. Ausdruck dieser Schaffenskraft ist etwa SmartMike, ein KI-gestütztes Aufnahmemikrofon, das in der Lage ist, separat die Tonspuren von zwei Sprechern im selben Raum aufzunehmen.

„Mittels intelligenter Anordnung der Mikros am Gerät sind - unterstützt durch die Algorithmik eines neuronales Netzes - Pegelunterschiede auszumachen und sauber zu trennen. Die Marktresonanz, hört man bei Philips Speech, sei groß, speziell dort, wo dokumentiert wird „wie etwa beim Arzt-Patienten-Gespräch oder der Finanzberatung“. Entwickelt und gefertigt wird das Mikrofon (O-Ton Schaffner: „Ein wirklich österreichisches Produkt!“) in Wien. Know-how und entwicklerischer Mut, diese Lösung auf die Beine zu stellen, gab es im Unternehmen freilich schon vor Schaffners Bestellung zum CTO. „Dazu hätte man mich nicht gebraucht“, sagt er. Jedoch brachte er die Überzeugung ins Unternehmen mit, entlang des Entwicklungsprozesses spürbar mehr auf Analytics zu setzen.

Barbecue - und Struktur

Und er ist der Mann der agilen Methoden. Was nicht heißen soll, dass er dem - übrigens sehr international und altersdivers zusammengesetzten - Kollegium dessen Strukturiertheit rauben will. „Agilität heißt ja nicht weniger Struktur, ganz im Gegenteil“, sagt Schaffner. Das Ziel seien schnellere Zyklen, bei denen die Freude an der Arbeit dennoch nicht zu kurz kommt. Und so könnte eine Technologie, die mehr als zwei Sprecher sauber unterscheidet und im Labormaßstab laut Schaffner bereits funktioniert, eher früher als später marktfreif ausentwickelt sein. Wie sich ein solcher weiterer Durchbruch gebührend feiern ließe? „Vielleicht mit Barbecue“, lacht Schaffner.