Opgave 2: Unicorn magic en zeldzame glitter

Eline Zenner, Laura Rosseel & Gillian Roberts (KULeuven)

Onze Nederlandse taal wordt tegenwoordig sterk beïnvloed door het Engels. De media, het internet, songs (oeps: liedjes) barsten van de Engelse woorden. Sommigen vinden dat ergerlijk of vervelend, weer anderen vinden dat net leuk. Taalkundigen vinden dit in de allereerste plaats interessant en proberen deze invloed te meten en te begrijpen. Het meten van die invloed is trouwens niet zo eenvoudig als je misschien zou denken, omdat je eerst en vooral moet gaan bepalen wat voor soort woorden je meetelt als ‘Engels’. Is sport een Engels woord? Hoe zit het met soulmate of lol? Wat met woorden die lang geleden in het Nederlands werden geleend? Of wat met woorden die helemaal niet Engels klinken?

Onderzoekers kunnen uiteenlopende criteria hanteren om te beslissen wat ze al dan niet meetellen als Engelse woorden. Het belangrijkste is dat ze duidelijk zijn over de keuzes die ze maken, die keuzes verantwoorden en ze consequent toepassen. Het is daarom aan te raden een algoritme op te stellen: een reeks regels die je als onderzoeker volgt wanneer je wilt berekenen hoeveel Engels er in een bepaalde tekst voorkomt.

Hieronder volgt een voorbeeld van zo’n algoritme. Het is een beslissingsboom op basis van woordenboekinformatie. Het algoritme biedt niet noodzakelijk de beste manier van tellen, maar het biedt in ieder geval een heldere manier om het te doen. Het algoritme moet elke onderzoeker die het gebruikt in staat stellen om tot hetzelfde antwoord te komen op de vraag hoeveel Engels er wordt gebruikt in een gegeven tekstfragment. En dát is precies wat we jou vragen te doen.

Hieronder staan drie fragmenten gebaseerd op Vlaamse reclamespots voor kinderen uit 2018.

Fragment 1
Een box, all-in-one, wat is de scoop? Unicorn food, flesje met geur, voeg water toe en schud. Unicorn magic, andere kleur. Vind de zeldzame glitter.

Fragment 2
Ga achter de gangsters aan met de nieuwe Turbo Racers. Ze gaan supersnel. Ze zijn niet te stoppen. Oh nee, Romeo ontsnapt! We hebben hem. Nieuw, Turbo Racers.

Fragment 3
Dit is Crazy Café. Draai de spinner en plaats, stapel of neem een voorwerp van de tafel. Als je het tafelkleed er drie keer hebt kunnen aftrekken zonder dat het servies aan diggelen valt, win je. Crazy Café!

De vraag 2.1 is hoeveel Engelse woorden er in elk fragment worden gebruikt (in te vullen op het antwoordblad). Om de vraag op te lossen maak je gebruik van (1) de instructies, (2) het algoritme en (3) het mini-woordenboek.

(1) Instructies

  1. Voor elke advertentie zijn de ‘potentiële’ Engelse elementen onderstreept. Enkel deze woorden haal je door het algoritme.
  2. Je telt het aantal Engelse woorden. We beschouwen spaties als de afbakening van een woord.
  3. Ook voor een woord dat deel uitmaakt van een langer Engelstalig zinsdeel, blijf je instructie 2 hanteren. Je telt woorden, geen uitdrukkingen.
  4. Herhalingen tellen niet mee. Treedt eenzelfde woord meermaals op in een fragment, dan tel je het maar één keer.
  5. Als een woord uit de lijst van ‘potentiële’ Engelse woorden niet in het mini-woordenboek voorkomt, betekent dat dat het niet in de Van Dale staat.

(2) Algoritme: 

(3) Gebruik onderstaand mini-woordenboek 

Oplossing

Fragment 1
Een box, all-in-one, wat is de scoop? Unicorn food, flesje met geur, voeg water toe en schud. Unicorn magic, andere kleur. Vind de zeldzame glitter.

 

Antwoord: Er zijn 6 Engelse woorden te vinden in Fragment 1.

  1. all-in-one – werd opgenomen in het Nederlands in 2011
  2. scoop – werd opgenomen in het Nederlands na 1950
  3. unicorn – staat niet in Van Dale
  4. food – staat in Van Dale, geen datum
  5. magic – staat niet in Van Dale
  6. glitter – werd opgenomen in het Nederlands na 1950

 

Waarom tellen we de andere “potentiële” Engelse woorden niet?

    • box – opgenomen in het Nederlands in 1886, dus vóór 1945 (zie beslissingsboom stap 2)

Opmerkingen:

    • all-in-one moet geteld worden als één woord, omdat de delen van het woord gescheiden worden met een koppelteken en niet met een spatie
    • unicorn food moet geteld worden als twee woorden, omdat er een spatie staat tussen ‘unicorn’ en ‘food’
    • unicorn komt twee keer voor in het fragment, maar mag maar één keer geteld worden

Fragment 2
Ga achter de gangsters aan met de nieuwe Turbo Racers. Ze gaan supersnel. Ze zijn niet te stoppen. Oh nee, Romeo ontsnapt! We hebben hem. Nieuw, Turbo Racers.

 

Antwoord: Er is 1 Engels woord te vinden in Fragment 2.

  1. racers – staat in van Dale, geen datum

 

Waarom tellen we de andere “potentiële” Engelse woorden niet?

    • gangster – werd opgenomen in het Nederlands in 1931, dus vóór 1945 (zie beslissingsboom stap 2)
    • Turbo – niet van Engelse oorsprong
    • stoppen – niet van Engelse oorsprong

Opmerkingen:

    • racers komt twee keer voor in het fragment, maar mag maar één keer geteld worden
    • Turbo Racers moet geteld worden als twee woorden, omdat er een spatie staat tussen ‘Turbo’ en ‘Racers’

 

 

Fragment 3
Dit is Crazy Café. Draai de spinner en plaats, stapel of neem een voorwerp van de tafel. Als je het tafelkleed er drie keer hebt kunnen aftrekken zonder dat het servies aan diggelen valt, win je. Crazy Café!


Antwoord: Er zijn 2 Engelse woorden te vinden in Fragment 3.

  1. crazy – werd opgenomen in het Nederlands na 1950
  2. spinner – betekenis 2: werd opgenomen in het Nederlands na 1950 (Let op! Als ‘spinner’ gebruikt was in betekenis 1, zou het woord niet meegeteld worden, want niet van Engels origine. Hier wordt het echter gebruikt in betekenis 2 en is het daarom wel te tellen als Engels.)

Waarom tellen we de andere “potentiële” Engelse woorden niet?

    • café – niet van Engelse oorsprong (Frans leenwoord)
    • win – niet van Engelse oorsprong

Noot over methodologie

Het algoritme dat in deze taak wordt gebruikt, is gebaseerd op woordenboekinformatie. Een dergelijk algoritme is niet noodzakelijk de enige, laat staan de beste manier van tellen. Een belangrijke factor om rekening mee te houden bij de vraag “is dit woord Engels of Nederlands?” is de uitspraak, en daar vind je niet altijd informatie over terug in een woordenboek.

Maar hoewel de beslissingsboom die in deze opdracht wordt gebruikt niet perfect is, biedt hij wel een eenduidige methode om het aantal Engelse elementen in een tekst te berekenen. Het algoritme stelt zo elke onderzoeker die het gebruikt in staat om tot hetzelfde antwoord te komen op de vraag hoeveel Engels er wordt gebruikt in een gegeven tekstfragment. Dat levert objectiviteit en repliceerbaarheid op, en dat is kostbaar in wetenschappelijk onderzoek.

Wie graag meer wil weten over de vraag hoe Engelse elementen in advertenties gekwantificeerd kunnen worden, kan meer lezen in het volgende artikel: Roberts, G., Zenner, E., & Rosseel, L. (2021). Exploring English in TV product advertising for Dutch-speaking children.World Englishes, 1–18. https://doi.org/10.1111/weng.12576