vrijdag 29 augustus 2014

0252 Dictee woensdag 10 sep 2014 (13): dictee frequenties in Van Dale √

Dictee - dictees [0252] 

Letter- en woordfrequenties in VD
(Welk lemma is er zoek?)

1. Zijn er meer letters met een a dan met een y? Vanzelfsprekend, maar hoe zit dat nou precies? Ik zocht in de online-VD (het is een momentopname – 29-08-2014, dat verandert natuurlijk steeds, maar wel weinig). Ik zocht op 'a*' etc. en vond (trefwoorden): A 13.144 (5,5 %), B 18.640 (7,8 %), C 7.436 (3,1 %), D 10.509 (4,4 %), E 5.436 (2,3 %), F 4.598 (1,9 %), G 11.642 (4,9 %), H 10.378 (4,3 %), I 5.312 (2,2 %), J 1.903 (0,8 %), K 16.264 (6,8 %), L 8.881 (3,7 %), M 11.728 (4,9 %), N 5.251 (2,2 %), O 11.108 (4,6 %), P 15.639 (6,5 %), Q 316 (0,1 %), R 10.656 (4,4 %), S 25.645 (10,7 %), T 11.961 (5,0 %), U 2.498 (1,0 %), V 14.826 (6,2 %), W 8.574 (3,6 %), X 111 (0,0, met 2 cijfers 0,05 %), Y 118 (0,0, met 2 cijfers 0,05 %) en Z 7.024 (2,9 %). De percentages tellen op tot 99,8 %, dat komt door die X en Y en andere afrondingen. Tel ik de getallen op, dan kom ik tot 239.598 lemma's, maar – oei! - als ik op '*' zoek kom ik tot 239.659 (61 meer). Hoe kan dat nu weer? Wel, voor de A staan nog een aantal lemma's (60, dus mis ik er 1). 

2. Hoogstwaarschijnlijk is dat het ƒ-teken; verklaring: op een iPad kwam dat voor het apenstaartje, op mijn pc alfabetisch na de f (f.z.) en voor de g, maar toen ik 'florijn' in het zoekvak typte, kwam 'binnen artikelen'  het ƒ-teken voor 'achtentwintig'. Daarmee is duidelijk wat het ontbrekende teken is, maar ook dat er 'ergens' nog iets niet klopt. Hier de overige 60 lemma's allemaal allemaal: @, ©, ®, 06-dealer, 06-nummer, 0800-nummer, 100 procentscontrole, 1080i, 11 juliviering, 11 novemberviering, 15 minutes of fame, 18 holesbaan, 18-karaats,
1984-scenario, 1 aprilgrap, 1e korporaal-chef, 1e kwartiermeester-chef, 1e meester. 1e meester-chef, 1e sergeant, 1e sergeant-chef, 1e sergeant-majoor, 1e soldaat, 1 meifeest, 1 meiviering, 2.0, 20 wekenecho, 21 juliviering, 24/7, 24-karaats, 24 urenstaking, 24 uurseconomie, 24 uursritme, 24 uursstaking, 25 meterbad,
27MC-band [VD: 2020], 2BE, 2e meester, 2pk, 2 step, 30 kilometerzone, 33 toerenplaat, 3D, 3D-bril, 3D-film, 3D-printen,
3D-printer, 3D-projectie, 3G, 3V, 3VO, 45 toerenplaat, 49-plusser, 4G, 4wd, 4x4, 50 meterbad, 65-plusser, 720p en 9/11-theorie.


3. Voor pVD-verslaafden (papieren Van Dale, 2005) heb ik ten slotte nog de aantallen pagina's per letter en de bijbehorende percentages: A 268 (6,2 %), B 321 (7,4 %), C 120 (2,8 %), D 185 (4,3 %), E 94 (2,2 %), F 72 (1,7 %), G 218 (5,1 %), H 186 (4,3 %), I 98 (2,3 %), J 32 (0,7 %), K 294 (6,8 %), L 153 (3,5 %), M 194 (4,5 %), N 90 (2,1 %), O 243 (5,6 %), P 265 (6,1 %), Q 6 (0,1 %), R 201 (4,7 %), S 454 (10,1 % - (!) 1 op 10, terwijl we 26 letters hebben), T 214 (5,0 %), U 53 (1,2 %), V 285 (6,6 %), W 145 (3,4 %), X 2 (0,0 %, op 2 cijfers 0,05 %), Y 2 (0,0 %, op 2 cijfers 0,05 %) en Z 119 (2,8 %). Telt u het even na: opgeteld 99,9 %, maar dat komt door de afrondingen – van X en Y, elk naar beneden van iets minder dan 0,05 % naar elk 0,0  %. Alle overige afrondingen pakten toevallig - gemiddeld - goed uit). Er zijn van die dingen, die je vast nooit wilde weten, en dit behoort er ongetwijfeld toe … Voor een dicteetijger annex VD-watcher annex wiskundige is dit natuurlijk gefundenes Fressen en de crème de la crème, het neusje van de zalm!

donderdag 28 augustus 2014

0251 Dictee woensdag 10 sep 2014 (12): dictee spindoctor √

Dictee - dictees [0251]

De spindoctor

1. Wat is dat nou weer: een spindoctor? Zie verderop. Je mag het overigens uitspreken als 'dohk-tuhr' of als 'dohk-tohr'. Bij een dictee kies je natuurlijk de eerste uitspraak, want anders wordt het te gemakkelijk … Allereerst de spin: geleedpotig dier, waar vooral vrouwen (?) bang voor zijn (nijdig als een spin, het is bij de wilde spinnen af, hij is de spin in het web), een soort snelbinder en een spinvormig hulpmiddeltje voor het opbinden van haar. Minder bekend zijn de spin als spinde (provisiekast) en de aswenteling in de natuurkunde (elektronenspin, de spin die je aan de bal bij (tafel)tennissen geeft en mediamanipulatie door politici: daar kom ik nog op terug).

2. De dokter (arts) kent iedereen. Een doctor is iemand die na het doen van promotieonderzoek in het bezit is van de hoogste academische graad (dr., meervoud: doctores). Een doctor honoris causa (denk maar aan het Engels honour = eer en aan een causaal = redengevend verband: een doctor vanwege de eer of zoiets) is (volgens Van Dale): iemand wie de doctorsgraad als eerbewijs verleend is. Alle elementen voor spindoctor hebben we dan wel gehad. Van Dale geeft als definitie: iemand die bijvoorbeeld politici adviseert over hun imago, optreden in de media, enzovoorts. Een mannetjesmaker dus.
 

woensdag 27 augustus 2014

0250 Dictee woensdag 10 sep 2014 (11): dictee WNT (2) √

Dictee - dictees [0250]

WNT (2)

1. In het vorige artikel heb ik overgenomen, wat Wikipedia vermeldt over het Woordenboek der Nederlandsche Taal. Recentelijk meldde zich bij mij good old Franz Gittenberger [Breskens], voormalig fotograaf en bezitter van heel veel antiquarische zaken. Hij had een artikel in de PZC gelezen over 150 jaar Dikke of Grote Van Dale (en over mij daarbij). Hij meldde zich met een paar fotokopieën van een boek dat hij thuis had staan. De rug vermeldt: J.H. van Dale – Woordenboek, en het titelblad: Nieuw Woordenboek der Nederlandsche Taal, bevattende: 1) de meest gebruikelijke woorden, spraakwendingen en spreekwoorden, 2) de bastaardwoorden, die of reeds het burgerrecht hebben verkregen of vrij algemeen worden gebezigd en 3) de meeste kunstwoorden.

2. Door: J.H. van Dale, hoofdonderwijzer en archivaris te Sluis. (Uitgegeven) 's-Gravenhage, Leiden, Arnhem: Martinus Nijhoff, A.W. Sijthoff, D.A. Thieme. Het woordenboek telde 1304 pagina's, gevolgd door een Toevoegsel van 60 pagina's (dat liep van afl tot afs) en 'Verbeteringen en Aanteekeningen'. Vroeger ging men niet alles verbeteren in het zetsel, maar voegde men een erratalijst toe (met de huidige pc worden correcties natuurlijk moeiteloos meteen verwerkt).

3. Franz vond het raar: een compleet woordenboek van a tot z en dan nog een supplement van afl tot afs. Omdat ik het antwoord niet wist, heb ik dat nagevraagd bij de NTU (Nederlandse Taalunie), die bijvoorbeeld ook het Groene Boekje uitgeeft. Het antwoord was helder: dit boek was zonder meer de tweede uitgave van de 'gewone' Dikke Van Dale van 1872. De 'Toevoeging' betreft (delen van) de WNT, voor zover die toen al verschenen waren. In de inleiding zegt pagina VII daar iets over: ik kan dat niet nakijken, maar Franz zal het na mijn telefonische informatie allicht al gevonden hebben.
 

0249 Dictee woensdag 10 sep 2014 (10): dictee Woordenboek der Nederlandsche Taal √

Dictee - dictees [0249]

Woordenboek der Nederlandsche Taal (bron: Wikipedia)

1. Het Woordenboek der Nederlandsche Taal, kortweg WNT, is een historisch woordenboek dat de Nederlandse woorden vanaf 1500 beschrijft en is het grootste woordenboek ter wereld. De eerste aflevering werd in 1864 gepubliceerd, de laatste op 16 juni 1998. Geteld vanaf 1851 is er door vijf generaties aan gewerkt. In 2001 verschenen nog drie delen Aanvullingen met nog niet eerder in het WNT behandelde, vooral 20e-eeuwse woorden. Het complete WNT bestaat dus uit 43 banden, die bij elkaar zo'n drie meter ruimte in een boekenkast vragen. Alle delen zijn ook in facsimile uitgegeven, in 1995 is een cd-rom door uitgever AND op de markt gebracht.

2. De WNT-informatie was voor de productie van de cd-rom in India overgetikt door personen die de Nederlandse taal niet machtig waren. Door een methode van typen en controletypen werd een onwaarschijnlijk laag foutenpercentage gehaald. Door deze actie is het WNT ook online raadpleegbaar. De ongeveer 1.700.000 citaten, die inmiddels voor meer dan de helft ook van een datering zijn voorzien, vertegenwoordigen het geschreven Nederlands van vijf eeuwen. Het WNT beschrijft de betekenis en geschiedenis van honderdduizenden bekende en onbekende woorden, jonge woorden en zeer oude woorden. Het WNT behandelt ongeveer 400.000 trefwoorden waarvan zo'n 95.000 hoofdtrefwoorden, verdeeld over 98.510 kolommen (49.255 pagina’s), inclusief de Aanvullingen. Opmerkelijk is dat het WNT in zijn geheel – dus ook de recentste afleveringen – is opgesteld in de in 1863 gepubliceerde spelling van De Vries en Te Winkel. Deze werd speciaal voor het WNT ontworpen. Er is gratis een online versie van het WNT beschikbaar. 

3. Om het woordenboek beter toegankelijk en gemakkelijker raadpleegbaar te maken is de structuur van de woordenboekartikelen in- en uitklapbaar gemaakt, zodat niet steeds de complete tekst doorgelezen hoeft te worden. Ook de citatenblokken kunnen naar believen worden bekeken. Alle subtrefwoorden zijn doorzoekbaar gemaakt en aan de trefwoorden in de spelling De Vries/Te Winkel uit 1863 (mensch, photo) is een equivalent toegevoegd in de huidige spelling (mens, foto). Ook zijn er koppelingen aangebracht die aan de trefwoorden informatie uit andere bronnen koppelen. Hierbij horen o.a. de taalkaarten uit de Taalatlas van Kloeke, etymologische informatie uit het Etymologisch woordenboek van het Nederlands, informatie over het Afrikaans en afbeeldingen van planten en dieren.
 

0248 Dictee woensdag 10 sep 2014 (9): dictee fenegriek √

Dictee - dictees [0248]

Fenegriek

1. Fenegriek, zou dat met Griek(s) te maken hebben? Oplossing verderop. In Van Dale en op vele andere plaatsen kun je zoeken naar woorden. Als ik bij VD naar 'kat' laat zoeken, krijg ik alle plaatsen binnen de 4500 pagina's, waar kat voorkomt. Maar de huidige zoektechnieken gaan veel verder: je kunt zogenaamde jokertekens gebruiken, het vraagteken (?) staat voor precies één teken (en ??? voor precies 3 tekens), het sterretje, de asterisk (*) voor een willekeurig aantal (ook nul!) tekens. Let op: 2020 = maximaal 2 jokertekens (* en ?).

2. Als ik dus laat zoeken op '*kat*' krijg ik alle woorden, die met kat beginnen, op kat eindigen of kat ergens in het midden hebben (zoals indiakatoen). Vooruit, daar gaat ie, ik zoek op '*griek*'. Als lemma's (trefwoorden) vind ik naast fenegriek: beslagriek (!), Byzantijns-Grieks en Grieks-orthodox, een griek (homoseksueel, ook: de Griekse liefde), grieks en dwars (schots en scheef), habberdegrieks (onbeholpen, met de Franse slag), Nieuwgrieks (hedendaags Grieks i.t.t. het Grieks uit de Bijbel) en vergrieksen (een Griekse vorm geven of krijgen).

3. Ik neem nog een paar dingen mee die ik als voorbeeldzinnen (60) aantrof: de dominee leest in zijn Griekse bijbel (het boekje, niet de inhoud!), naar de Griek gaan (dat is echt fout: volgens het Groene Boekje is het restaurant een griek met kleine letter) en de Griekse y. De 5708 treffers (hits) sub lemma (binnen de lemma's), daar begin ik niet aan. O ja, en nu de oplossing nog: volgens VD is een fenegriek een sterkriekende (jazeker: aaneen) vlinderbloemige plant met op klaver lijkende bladeren (Trigonella foenum-graecum). En ook jazeker: het komt van het Griekse (!) fenum graecum = Grieks hooi!
 

dinsdag 26 augustus 2014

0247 Dictee woensdag 10 sep 2014 (8): dictee windbreuk en windworp √

Dictee - dictees [0247]

Windbreuk en windworp

1. Wat zou dat nu weer zijn? Doet u maar een gooi, aan het eind de oplossing. De wind kennen we allemaal. Het is een zelfstandig naamwoord met als betekenis (volgens VD): voelbare, in hoofdzaak horizontale stroming in de dampkringslucht, en vervolgens het heersen van een dergelijke stroming. Toe maar. Als voorbeelden worden gegeven: de wind van voren geven of krijgen, iemand uit de wind houden (bij wielrennen), een frisse wind, hoge bomen vangen veel wind, er de wind onder hebben, wie wind zaait, zal storm oogsten, de huik (lange kapmantel zonder mouwen) naar de wind hangen = van partij veranderen als dat voordeliger lijkt.

2. Verder: de wind in de zeilen hebben en iemand de wind uit de zeilen nemen. Wind kan ook kunstmatig zijn: wind maken met de deur en veel wind maken = pochen. In 'men kan niet van de wind leven' wordt lucht bedoeld. En ook beslist kunstmatig: iemand een windje (poepje) laten ruiken = versteld doen staan, te grazen nemen. Wind kan ook windhond of windvoorn (= winde) betekenen.

3. Breuk komt van breken: kabelbreuk, breuk in de aardkorst, kaakbreuk, liesbreuk, beklemde breuk (wanneer ze in de breukpoort beklemd zit en niet meer teruggeduwd kan worden), gebroken waar (brekage), figuurlijk: huwelijksbreuk en een wiskundige breuk (drie zevende = 3/7, met teller en noemer). Een worp is een gooi (ook met de dobbelsteen), het konijn had elf jongen in één worp en een worp jonge honden. Jammer, het helpt ons allemaal niks verder, maar de oplossing is, zoals vaak, simpel: windworp = omgewaaide bomen en windbreuk = afgewaaid hout. Dat VD windworp als synoniem noemt van windbreuk *, daar geloof ik dus niets van.
* 2020 VD: synoniem van windbreuk = luchtbreuk.
 
 

0246 Dictee woensdag 10 sep 2014 (7): dictee wilfen of winozzen √

Dictee - dictees [0246]

Wilfen of winozzen

1. In een PZC-cryptogram kwam als opgave voor: "Spijkers die te onderscheiden zijn." (10 letters). Dan open je de online-VD en kijkt eens bij 'onderscheiden' (werkwoord). Dat betekent 1) als ongelijksoortig van elkaar afscheiden (deze soort onderscheidt zich door langere oren), 2) (worden met:) een ridderorde etc. ontvangen, 3) (met 'zich':) uitmunten (hij heeft zich in de oorlog onderscheiden) en 4) als zodanig onderkennen (hij weet geen koe van een paard te onderscheiden). Verder is 'onderscheiden' nog een bijvoeglijk naamwoord met als betekenis: 1) verschillend (bekers van onderscheiden grootte en vorm), 2) uiteenlopend (de onderscheiden meningen) en 3) niet gering aantal (onderscheidene winkels hebben dit in de verkoop).

2. Maar vanwege 'te' in de opgave ging het hier over een werkwoord. Enfin, verder met spijker(s). Buiten wat gewestelijke en verouderde betekenissen kom je terecht op 'puntig staafje metaal …' (timmerlieden onderscheiden 'spijkers' van 'nagels') en (Bargoens) cent of geld. Dat 'nagel' leek me wel wat. Dus verder zoeken naar '*nagel*'. Dat gaf 90 treffers, maar wacht, het waren tien letters, dus beter '????nagel', want er zal dan wel een s achter staan (meervoud). Om technische redenen mocht er toen geen vraagteken als zoeksymbool aan het begin van een woord staan in de online-VD, daarom lukte dat niet, maar gelukkig had ik ook mijn oude eVD (elektronische Van Dale) nog.

3. Daarmee lukt het wel, maar nog altijd 32 treffers. Achteraf stond het gezochte woord (sedert 2006!) er wel bij, maar ik zag het niet zo gauw. Nou ja, dan maar naar de Puzzelsite, afdeling Cryptogram. Binnen de kortste keren had ik toen natuurlijk plaknagel [Oplossing cryptogram dus: plaknagels]. En ja: een plak is natuurlijk ook een onderscheiding. Vervolgens bekroop me het gevoel: wat ben ik nu eigenlijk aan het doen? Van Dale geeft het antwoord: het staat boven aan dit verhaal: ik was aan het wilfen (surfen op het internet waarbij men niet meer weet naar welke informatie men oorspronkelijk op zoek was, WILF: What was I looking for?) of winozzen (winoz: waar was ik naar op zoek?). Waarvan akte.