Die-is-de-Mol (DidM) is geboren uit frustratie, mijn frustratie. De laatste jaren vond ik het steeds lastiger en bijna onmogelijk worden om al puzzelend de Mol te vinden. Als er nog hints in het programma zaten na het Klaas-debacle waren die vaak niet heel logisch en vergezocht. Bovendien kreeg ik steeds meer het gevoel dat ik zat te kijken naar een soort kunstmatige montagelaag bovenop het spel en niet meer naar het spel zelf.
Het programma bleef op zich leuk om naar te kijken, maar het werd van puzzelen (mis)gokken. En toch bleef het knagen, zou er ondanks alles toch een manier te bedenken zijn om de "WidM puzzel definitief te kraken"? Uit deze zoektocht is DidM ontstaan.
Na verschillende, ook minder geslaagde, experimenten heb ik een voorspellend model gebouwd dat gebaseerd is op vier pijlers
1. DidM richt zich op waarneembaar gedrag. Ik heb het zoeken naar de symbolische hints losgelaten, omdat ik geen enkele betrouwbare manier heb kunnen vinden om een bonafide hint enigszins betrouwbaar te kunnen onderscheiden van ruis.
2. DidM is opgebouwd uit twee lagen: een “spellaag” met daarin gedragspatronen van kandidaten respectievelijk Mollen en een “regielaag” met daarin gedragspatronen van de makers (denk aan montage- en regiekeuzes, molprofielen).
3. DidM is gebaseerd op een statistisch model dat de observaties vertaalt in kansen. Het algoritme berekent na elke aflevering de kans dat een bepaalde kandidaat daadwerkelijk de Mol is. Specifiek maakt DidM gebruik van een geavanceerde statistische techniek die bayesiaanse analyse wordt genoemd. Dit in tegenstelling tot de “frequentistische” statistiek die we allemaal van de middelbare school kennen en niet goed werkt in een situatie als Wie is de Mol.
4. DidM maakt gebruik van twee soorten inputvariabelen. 1. Objectief vast te stellen variabelen (bv leeftijd kandidaat, FTM). 2. Subjectieve variabelen, maar die op de een of andere manier wel (enigszins) objectiveerbaar zijn. Bijvoorbeeld omdat je de variabele kunt toetsen aan vooraf vastgesteld criteria of omdat je de ‘wisdom of the crowds’ erop los kunt laten (bv sleutelposities, niet-de-Mol gedrag).
Het zou misschien mooi zijn als DidM volledig zou kunnen draaien op objectieve variabelen, maar dat vermindert duidelijk de voorspellende kracht van het model en dus kies ik ervoor om ook te werken met intersubjectieve variabelen.
DidM is geen 'magic': ik moet hier en daar nog steeds interpretaties maken om het model te kunnen vullen met input. DidM is wel puzzelen op steroïden. Het is een potentieel krachtige manier om verborgen patronen zichtbaar te maken en de statistiek voor je te laten werken.
En, werkt het ook? Dat is natuurlijk de 1.000.000 euro vraag. Het algoritme lijkt veelbelovend, maar zal zichzelf nog wel moeten bewijzen. In 2022 wees DidM vanaf aflevering drie Everon aan als Mol en vorig jaar kwam Jurre bovendrijven vanaf aflevering twee.
Hopelijk gaat DidM ook dit jaar zijn werk doen. En lukt dat niet, dan is het ook goed, wetende dat ik zelf in ieder geval gedaan heb wat in mijn vermogen lag om de puzzel te kraken.