Om in audiovisuele bronnen te kunnen zoeken zijn tekstuele beschrijvingen onontbeerlijk. In een eerdere post ging het al over de “semantic gap” en het doorzoekbaar maken van A/V materiaal met behulp van metadata. Metadata bevatten typisch een titel, uitzenddatum en tijd, een samenvatting, genre, de makers, trefwoorden, personen die voorkomen, etc. en worden door archivarissen, of documentalisten zoals ze bij Beeld en Geluid worden genoemd, handmatig ingevoerd. Op de zoekportal van Beeld en Geluid zie je voorbeelden van metadata wanneer je zoekt op een onderwerp en klikt op een zoekresultaat.
Maar om A/V materiaal te kunnen doorzoeken, zou je naast metadata ook aan andere tekstuele bronnen kunnen denken die iets vertellen over de inhoud. Een voorbeeld van zo’n bron is Ondertiteling voor Doven en Slechthorenden, in Nederland aangeduid als TT888 omdat ze uitgezonden worden via Teletekstpagina 888. Ondertiteling “beschrijft” wat wordt gezegd in een video en is daarmee een rijke bron van informatie bij het zoeken in videoarchieven. Omdat elke titel synchroon met de spraak in beeld moet verschijnen wordt elke titel voorzien van een tijdcode. Wanneer je deze tijdcodes meeneemt in een zoekmachine, wordt het mogelijk om direct naar het juiste fragment in de video te springen. NPO Ondertiteling verzorgt handmatig de ondertiteling van Nederlandstalige programma’s van de Publieke Omroep. Via de Mediawet is vastgesteld dat 95% van het Nederlandse programma-aanbond moet worden ondertiteld. TT888 is daarmee een structurele en interessante beschrijvingsbron om het televisiemateriaal van de Publieke Omroep in het Beeld en Geluid archief doorzoekbaar te maken.
Continue reading →
0.000000
0.000000