CLARIN/CLARIAH Collaboration on Automatic Transcription Chain for Digital Humanities

In the CLARIAH project, we are developing the Media Suite, an application that supports scholarly research using audiovisual media collections. In 2017 we will also be integrating tools that support Oral History research in the Media Suite. From 10 to 12 May 2017,  scholars and technology experts discussed the development of an automatic transcription chain for spoken word collections in the context of CLARIN, the European counterpart of CLARIAH, at a CLARIN-PLUS workshop in Arezzo. We observed that CLARIAH and CLARIN use a different but interesting complementary approach to the development of such a transcription chain that encourages further collaboration.

Read more of this post

Bruikbaarheid van spraakherkenning binnen de geesteswetenschappen (1)

 

Foto: svenwerk

Foto: svenwerk

Naar aanleiding van een conferentie bij de British Library op 8 Februari 2013 over “Opening up speech archives” een post over de bruikbaarheid van spraakherkenning binnen de geesteswetenschappen. Regelmatig wordt geopperd dat spraakherkenning een nuttige rol zou kunnen spelen bij het ontsluiten van gesproken woord archieven. Onderzoekers in de geesteswetenschappen vragen zich echter af hoe bruikbaar spraakherkenning eigenlijk wel is. Spraakherkenning maakt immers fouten, soms zelfs véél fouten. Hoe betrouwbaar is het gebruik van spraakherkenning dan? En hoe ga je als onderzoeker methodologisch om met deze imperfectie? Heeft dat consequenties voor de interpretatie? En een heel praktisch punt, hoe kan een techniek als spraakherkenning breed en betaalbaar beschikbaar worden gemaakt aan onderzoekers in de geesteswetenschappen? In deel 1 van Bruikbaarheid van spraakherkenning binnen de geesteswetenschappen”  een stukje achtergrond met betrekking tot het gebruik van audiovisuele content in de geesteswetenschappen en mijn ervaring met de inzet van spraakherkenning in deze context.

Read more of this post