About

Roeland Ordelman is specialist in audiovisual access technology and cross-media concepts with a background in research, audiovisual archiving and ICT industry. He is Innovation Manager at Netherlands Institute for Sound and Vision, one of the largest audiovisual archives in Europe, and principal investigator Speech and Language Technology in the area of Multimedia Retrieval at University of Twente, the Netherlands. He received his PhD in 2003 on the use of speech recognition technology to improve access to audiovisual archives and worked on a wide range of national and international projects in the area of multimedia retrieval. Next to more fundamental research topics such as currently audiovisual (hyper)linking, research topics addressing aspects related to the uptake of access technology in realistic, industrial use cases have his special interest. In that context, he has been involved in organizing benchmark evaluations in the MediaEval Benchmark Evaluation Series and more recently TRECVid. His current work in this area focuses on the integration of (user) evaluation and benchmarking in the context of ‘living labs’: research infrastructures that involve industry, research and user communities for mutual benefit.


Biografie (in Dutch)

Master Fonetiek

Tijdens mijn studie Spaanse Taal- en Letterkunde aan de Universiteit Utrecht midden jaren ’90 kwam ik in aanraking met Fonetiek. De meesten van mijn studiegenoten rekenden deze cursus niet tot hun favorieten maar ik was meteen verkocht. Met maar een beetje heimwee ruilde ik snel subjuntivo, reconquista, Cela en Cortázar in voor Fonetiek & Fonologie, Statistiek, Signaalbewerking en Spraaktechnologie.

Promotieonderzoek

Na mijn afstuderen met specialisatie automatische spraakherkenning vertrok ik naar de vakgroep Human Media Interaction van de Universiteit Twente (UT) om onderzoek te doen naar het gebruik van automatische spraakherkenning bij het zoeken in audio- en videoarchieven. Het idee is dat de spraak in de audio en video met behulp van spraakherkenning kan worden omgezet naar tekst voorzien van tijdcodes. Die tekst kun je vervolgens doorzoeken zoals elke andere tekst. Wanneer je de tekst gevonden hebt die je zocht kun je van daaruit direct naar de bijbehorende video of het juiste fragment in de video springen.

Post-doc

Na mijn promotie op dit onderwerp in 2003, heb ik 5 jaar als post-doc in een aantal nationale en internationale onderzoeksprogramma’s meegedraaid. Diverse onderwerpen die te maken hadden met slimmer (her)gebruik van de grote hoeveelheden audio en video (A/V) die worden geproduceerd, passeerden de revue. Met een internationaal, multi-disciplinair team van experts op het gebied van taal- en spraaktechnologie, beeldanalyse, zoektechnologie en mens-machine interactie zijn er belangrijke stappen gezet richting het efficiënter kunnen exploiteren van A/V-stromen en -archieven.

Archiefwereld en industrie

Het jaar 2008 was een interessant jaar omdat ik in dat jaar expliciet een koppeling heb gelegd vanuit het onderzoekslaboratorium naar de ‘echte’ wereld door bij de afdeling R&D van het Nederlands Instituut voor Beeld en Geluid –één van de grootste audiovisuele archieven van Europa– te gaan werken, en daarnaast een technologiebedrijf op te richten met mijn toenmalige UT collega Marijn Huijbregts. Omdat we naar aanleiding van presentaties in het land over ons onderzoek diverse aanvragen kregen om de technologie ook in de praktijk te komen inzetten, richtten we de UT-spinoff  Cross-Media Interaction (X-MI) .

Bij Beeld en Geluid ging ik me bezig houden met evalueren en implementeren van nieuwe technologie in de Beeld en Geluid workflow: veelbelovende resultaten uit onderzoek met interne en externe gebruikers testen op bruikbaarheid voor Beeld en Geluid en wanneer dat het geval lijkt, vervolgstappen zetten om de technologie ook daadwerkelijk te gaan gebruiken. Vaak is dan nog aanvullend onderzoek nodig. Bijvoorbeeld om te testen wat voor invloed een nieuwe component op andere onderdelen van de workflow heeft. Het is erg interessant en nuttig om de implicaties van de inzet van nieuwe technische mogelijkheden van nabij mee te maken, en de vragen die hierbij ontstaan terug te koppelen naar het onderzoeksveld.

Onderzoek en Innovatie

Cross-Media Interaction heeft sinds begin 2015 een andere invulling gekregen. Marijn Huijbregts richt zich met zijn bedrijf Spraaklab nu puur op spraaktechnologie. Cross-Media Interaction richt zich op onderzoek en innovatie met betrekking tot de gehele keten van audiovisuele toegang, waarbij de laatste jaren het automatisch linken van audiovisuele bronnen (video-naar-video, tekst-naar-video, spraak-naar-multimedia) een belangrijke plaats inneemt. Bij Beeld en Geluid geef ik hier vorm aan als Innovatiemanager bij de afdeling Kennis & Innovatie. Een groot deel van mijn tijd ben ik betrokken bij het runnen van zogenaamde ‘living labs’ waarin we innovatieve concepten testen in samenwerking met universitaire partners, bedrijven, en natuurlijk eindgebruikers. Daarnaast ben ik verbonden aan de Universiteit Twente als senior onderzoeker Taal- en Spraaktechnologie in Multimedia Retrieval. In deze hoedanigheid werk ik met name aan onderzoek op het gebied van audiovisueel linken en het organiseren van benchmark evaluaties.

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

%d bloggers like this: