- CLARIN-NL Welcome Page
- NewsFlash
- Abstract
- Acronyms
- CLARIN Standards & Best Practices
- Calls
- Contact Info
- Data Curation Service
- Discussion Forum
- Documents
- Etalage
- Events
- 1e CLARIN-NL bijeenkomst
- 2e CLARIN-NL bijeenkomst
- CLARIN-NL Kick off meeting Call 2
- CLARIN-NL Kick-off meeting Call 3
- CMDI (CLARIN Metadata Infrastructure) Tutorial
- Call3 Information Session
- ISOcat Tutorial
- ISOcat workshop 2010
- ISOcat workshop 2011, part 2
- ISOcat workshop
- Info-sessie Call 2
- Metadata Tutorial
- digiTAAL - Nieuwe perspectieven voor (toekomstige) onderzoekers
- Governance
- Helpdesk
- IPR
- Network activities
- Open Data
- Participants
- Project Description
- Related Projects
- Samenvatting (NL)
- Subprojects
- User Survey
- Vacature
Showcases
De volgende showcases verbeelden hoe verschillende toekomstige gebruikers van de CLARIN-infrastructuur makkelijk data en bronnen kunnen raadplegen voor hun onderzoek.
Showcase 1
Een historicus in Amsterdam houdt zich bezig met de interactie tussen Nederlandse en Duitse kranten aan de vooravond van de tweede wereldoorlog. Hoe schrijven de Duitse kranten en hoe reageren de Nederlandse kranten daarop? Zowel in Nederland als in Duitsland zijn de meeste relevante kranten uit die periode gedigitaliseerd. Echter, kranten die nu nog bestaan hebben dat elk op hun eigen wijze gedaan, waarbij het er vooral om ging de kranten op datum te kunnen terugvinden. De niet meer bestaande krantentitels werden door nationale bibliotheken gedigitaliseerd en daarbij werd vooral aandacht besteed aan het toevoegen van zoveel mogelijk metadata. Een bevriende collega-onderzoeker van de universiteit van Ulm heeft een mooi programma geschreven waarmee documenten taal-onafhankelijk geclassificeerd kunnen worden. Het probleem is dat het programma verwacht dat de data volgens het formaat van de Deutsche Digitale Bibliothek beschreven zijn. Om het onderzoek met zoveel mogelijk kranten te kunnen doen, moeten al deze kranten dus op dezelfde manier benaderbaar zijn.
Een oplossing voor dit probleem is het herschrijven (=cureren) van iedere kranten-database in een CLARIN-compatible formaat. Om het classificatieprogramma wordt vervolgens een zogeheten schil gelegd zodat het programma CLARIN-compatibele data aankan. Daarmee komt de vergelijking van Duitse en Nederlandse kranten binnen handbereik zonder dat de onderzoeker alle afzonderlijke databases één voor één, elk op zijn eigen manier hoeft te raadplegen.
Showcase 2
Een taalkundige in Utrecht werkt aan een artikel over flectie in het Nederlands. Om goed te begrijpen hoe het verschijnsel van agreement werkt, is het nodig dat zij toegang heeft tot flectieverschijnselen in variëteiten van het Nederlands. Niet alleen ten aanzien van buigingsverschijnselen in hedendaags standaard Nederlands, maar ook van de verscheidenheid in oudere stadia, dialecten en sociaal bepaalde variëteiten. Bovendien zou het wenselijk zijn om te kijken naar wat er aan flectieverschijnselen optreedt in eerste en tweede taalverwerving. Om dit te kunnen doen moet deze taalkundige toegang hebben tot een groot aantal verschillende resources. Deze resources zijn er wel, maar hebben elk hun eigen specifieke eigenschappen en zijn vaak niet of nauwelijks toegankelijk voor een buitenstaander. Als CLARIN eenmaal in werking is dan kan zij op een uniforme manier toegang krijgen tot en zoeken in databases als Corpus Gesproken Nederlands aan het INL, dialectdatabases als de Morfologische en Syntactische Atlas van de Nederlandse Dialecten van het Meertens Instituut, historische databases zoals het Corpus Gijsseling, en taalverwervingsdatabases als Childes. Uit verschillende dataverzamelingen stelt zij op vrij eenvoudige wijze haar eigen flectie-corpus samen dat een basis vormt voor nieuwe inzichten. Zo is zij in staat een nieuwe theorie te ontwikkelen over het proces van deflectie in het Nederlands, op grond van een tot dan toe ongekend rijke en gedetailleerde verzameling hedendaagse en vroegere verschijnselen.
Showcase 3
Naar aanleiding van een aantal geruchtmakende overvallen worden een aantal daders en slachtoffers geïnterviewd. De op video vastgelegde interviews worden volledig uitgeschreven en vervolgens opgelijnd. Daarnaast worden allerlei fonetische parameters (bv uitspraak van klanken, intonatie), en psychologische kenmerken (bv angst, woede, berusting) tijdsynchroon vastgelegd. Hierdoor is het mogelijk om niet alleen op woorden in de AV-bestanden te zoeken maar ook op andere kenmerken van de spraak. Aan de interviews wordt bovendien een lijst met links naar (tijdsynchrone) externe content gekoppeld. Hierdoor is het mogelijk dat er op ieder moment in zo’n interview een link naar relevante externe content gemaakt kan worden. Gedacht kan worden aan krantenartikelen, RTV-uitzendingen maar ook aan de kanttekeningen van verschillende experts bij bepaalde passages van het interview. Op deze manier ontstaat een sterk verrijkt interview waarbij de inhoud in een context is geplaatst. Daarmee ontwikkelen we een samenhangend veld van interviews en gerelateerde teksten of beelden dat de basis kan vormen voor verdergaand onderzoek.
»
