Auteur Topic: Die-is-de-Mol (gelezen 86003 keer)

« **Gepost op:** 8-01-2024, 21:14:56 »

Die-is-de-Mol (DidM) is geboren uit frustratie, mijn frustratie. De laatste jaren vond ik het steeds lastiger en bijna onmogelijk worden om al puzzelend de Mol te vinden. Als er nog hints in het programma zaten na het Klaas-debacle waren die vaak niet heel logisch en vergezocht. Bovendien kreeg ik steeds meer het gevoel dat ik zat te kijken naar een soort kunstmatige montagelaag bovenop het spel en niet meer naar het spel zelf.

Het programma bleef op zich leuk om naar te kijken, maar het werd van puzzelen (mis)gokken. En toch bleef het knagen, zou er ondanks alles toch een manier te bedenken zijn om de "WidM puzzel definitief te kraken"? Uit deze zoektocht is DidM ontstaan.

Na verschillende, ook minder geslaagde, experimenten heb ik een voorspellend model gebouwd dat gebaseerd is op vier pijlers

1.   DidM richt zich op waarneembaar gedrag. Ik heb het zoeken naar de symbolische hints losgelaten, omdat ik geen enkele betrouwbare manier heb kunnen vinden om een bonafide hint enigszins betrouwbaar te kunnen onderscheiden van ruis.

2.   DidM is opgebouwd uit twee lagen: een “spellaag” met daarin gedragspatronen van kandidaten respectievelijk Mollen en een “regielaag” met daarin gedragspatronen van de makers (denk aan montage- en regiekeuzes, molprofielen).

3.   DidM is gebaseerd op een statistisch model dat de observaties vertaalt in kansen. Het algoritme berekent na elke aflevering de kans dat een bepaalde kandidaat daadwerkelijk de Mol is. Specifiek maakt DidM gebruik van een geavanceerde statistische techniek die bayesiaanse analyse wordt genoemd. Dit in tegenstelling tot de “frequentistische” statistiek die we allemaal van de middelbare school kennen en niet goed werkt in een situatie als Wie is de Mol.

4.   DidM maakt gebruik van twee soorten inputvariabelen. 1. Objectief vast te stellen variabelen (bv leeftijd kandidaat, FTM). 2. Subjectieve variabelen, maar die op de een of andere manier wel (enigszins) objectiveerbaar zijn. Bijvoorbeeld omdat je de variabele kunt toetsen aan vooraf vastgesteld criteria of omdat je de ‘wisdom of the crowds’ erop los kunt laten (bv sleutelposities, niet-de-Mol gedrag).

Het zou misschien mooi zijn als DidM volledig zou kunnen draaien op objectieve variabelen, maar dat vermindert duidelijk de voorspellende kracht van het model en dus kies ik ervoor om ook te werken met intersubjectieve variabelen.

DidM is geen 'magic': ik moet hier en daar nog steeds interpretaties maken om het model te kunnen vullen met input. DidM is wel puzzelen op steroïden. Het is een potentieel krachtige manier om verborgen patronen zichtbaar te maken en de statistiek voor je te laten werken.

En, werkt het ook? Dat is natuurlijk de 1.000.000 euro vraag. Het algoritme lijkt veelbelovend, maar zal zichzelf nog wel moeten bewijzen. In 2022 wees DidM vanaf aflevering drie Everon aan als Mol en vorig jaar kwam Jurre bovendrijven vanaf aflevering twee.

Hopelijk gaat DidM ook dit jaar zijn werk doen. En lukt dat niet, dan is het ook goed, wetende dat ik zelf in ieder geval gedaan heb wat in mijn vermogen lag om de puzzel te kraken.

« **Reactie #1 Gepost op:** 8-01-2024, 21:29:18 »

Deel je de resultaten/voortgang hier?

« **Reactie #2 Gepost op:** 8-01-2024, 21:50:00 »

Na aflevering 1 is dit de top vijf Molkansen gebaseerd op DidM:

1. Fons - 0,645
2. Anna - 0,242
3. Tooske - 0,031
4. Justin - 0,029
5. Rian - 0,018

In deze fase van het spel bevat het DidM-model nog maar beperkte informatie: de kandidaatsprofielen en de data van de eerste aflevering. Aflevering 2 volgende week wordt daarom een belangrijke, gaat Fons zijn koppositie verder verstevigen of komt er toch nog een andere Mol bovendrijven?

« **Reactie #3 Gepost op:** 8-01-2024, 22:10:04 »

Respect voor het maken! Ik weet alleen niet of ik het wil weten, dus ws kom ik Hier pas weer checken als het voorbij is en Justin de mol blijkt (of Tooske of Rian

).

« **Reactie #4 Gepost op:** 9-01-2024, 08:35:03 »

Wauw, wat goed! Ik ben heel benieuwd of het deze keer opnieuw lukt en de mol boven komt drijven. Zo ja, dan mag er volgend jaar een spoiler-tag opgezet worden

« **Reactie #5 Gepost op:** 9-01-2024, 09:15:58 »

Citaat van: Allomol op 8-01-2024, 21:50:00

Na aflevering 1 is dit de top vijf aam Molkansen gebaseerd op DidM:

1. Fons - 0,645
2. Anna - 0,242
3. Tooske - 0,031
4. Justin - 0,029
5. Rian - 0,018

In deze fase van het spel bevat het DidM-model nog maar beperkte informatie: de kandidaatsprofielen en de data van de eerste aflevering. Aflevering 2 volgende week wordt daarom een belangrijke, gaat Fons zijn koppositie verder verstevigen of komt er toch nog een andere Mol bovendrijven?

Wat waren de cijfers van de twee voorgaande jaren van aflevering 1? Puur voor mezelf.

« **Reactie #6 Gepost op:** 9-01-2024, 10:07:52 »

Oké, daar gaat ie

De top 5 van seizoen 2022 na aflevering 1 zag er als volgt uit:
1. Everon - 0,259
1. Fresia - 0,259
3. Hila - 0,111
3. Thomas - 0,111
3. Welmoed - 0,111

In 2023 heb ik met de leerpunten van 2022 een aantal aanpassingen in het model doorgevoerd. Na aflevering 1 was het beeld:
1. Jurre - 0,530
2. Sander - 0,154
3. Daniel - 0,083
4. Ranomi - 0,083
5. Annick - 0,045
5. Soy - 0,045

« **Reactie #7 Gepost op:** 9-01-2024, 12:55:04 »

Interessant model!
Ben geïnteresseerd in hoe dit algoritme nu precies werkt. Wat zijn bijvoorbeeld de variabelen uit de eerste aflevering waar het model rekening mee gehouden heeft?
Objectieve variabelen zoals leeftijd bijvoorbeeld hoe kunnen die voorspellen wie eventueel de mol zou kunnen zijn? Voor mij lijkt dit niet zo veel van invloed te zijn.

« **Reactie #8 Gepost op:** 9-01-2024, 15:44:08 »

Leeftijd lijkt me meer te doelen op als een kandidaat dichter bij de gemiddelde leeftijd van de mol zit, deze een hogere score krijgt. Al lijkt me dit lichtelijk onlogisch aangezien deze statestiek met de jaren toch steeds dichter rond de 45 zou moeten gaan neigen...

« **Reactie #9 Gepost op:** 9-01-2024, 17:00:57 »

Citaat van: DRenziboy op 9-01-2024, 15:44:08

Leeftijd lijkt me meer te doelen op als een kandidaat dichter bij de gemiddelde leeftijd van de mol zit, deze een hogere score krijgt. Al lijkt me dit lichtelijk onlogisch aangezien deze statestiek met de jaren toch steeds dichter rond de 45 zou moeten gaan neigen...

Ja daarom vroeg ik me dat af. Ook omdat dit factoren zijn die niet perse bepalen of iemand meer mol-potentie heeft of niet. Althans dat denk ik dan...

« **Reactie #10 Gepost op:** 9-01-2024, 21:21:18 »

Interessant topic, interessante statistiek, ben benieuwd. Ook benieuwd waarom via deze logaritmes Fons is boven komen drijven de 1e aflevering...

« **Reactie #11 Gepost op:** 9-01-2024, 22:27:15 »

Citaat van: Koemba op 9-01-2024, 17:00:57

Ja daarom vroeg ik me dat af. Ook omdat dit factoren zijn die niet perse bepalen of iemand meer mol-potentie heeft of niet. Althans dat denk ik dan...

Je zou kunnen beweren dat een persoon van 60 moeilijker actieve molacties uit kan voeren dan een mol van 30-40
Omgekeert kan een mol van 20 moeilijker een persoon van 55 iets wijsmaken middels levenservaring...

Maar zelfs dan is het feit dat als de mol X is en een kandidaat Y. En Y ligt toevallig dichterbij de waarde Z, die gepakt is voor het model... Voegt het nog niks toe...

« **Reactie #12 Gepost op:** 10-01-2024, 00:13:42 »

Schildert Fons niet het enige correcte schilderij? Hij moet wel erg verdacht uit de cijfers komen om alsnog zo hoog te eindigen. Maar ga zeker een stuk beter op hem letten.

« **Reactie #13 Gepost op:** 10-01-2024, 15:20:21 »

Dat was mijn conclusie ook en die had ik dus meegenomen in het model. Desondanks, dit komt eruit..

Tegelijkertijd, deze percentages moet je met een korreltje zout nemen. Er zitten nog niet al te veel datapunten in het model na één aflevering en er kan dus nog wel wat gaan schuiven.

« **Reactie #14 Gepost op:** 10-01-2024, 16:28:11 »

Klopt van dat korreltje zout maar het is wel een boeiend iets, ik ga toch beter op Fons letten haha. Ook om te kijken wat het model eruit pikt als hitpoints zeg maar. Dus blijf het vooral posten wat mij betreft

« **Reactie #15 Gepost op:** 10-01-2024, 19:33:01 »

Citaat van: Allomol op 10-01-2024, 15:20:21

Dat was mijn conclusie ook en die had ik dus meegenomen in het model. Desondanks, dit komt eruit..

Tegelijkertijd, deze percentages moet je met een korreltje zout nemen. Er zitten nog niet al te veel datapunten in het model na één aflevering en er kan dus nog wel wat gaan schuiven.

Misschien begrijp ik iets verkeerd, maar als er weinig datapunten zijn zou ik zeggen dat iedereen dichter bij elkaar zou moeten liggen. Is dit iets wat meegenomen kan worden in het model?

« **Reactie #16 Gepost op:** 10-01-2024, 20:46:56 »

Nee, dat zijn toch twee verschillende dingen. Neem het volgende (te) versimpelde voorbeeld. Het werkt niet helemaal zo, maar het maakt het punt wel duidelijk.

Stel er zijn twee kandidaten A en B en vijf data-inputs. Vier datapunten wijzen naar A, één naar B. Dus A heeft een geschatte kans van 80% (4/5) en B 20%. Best een extreme inschatting dus. Nu komt er 1 datapunt bij voor B. Dan zakt de ingeschatte kans van A ineens flink naar 66% (4/6)

Nu hetzelfde maar met 10x zoveel datapunten in het model, A heeft er 40 en B 10. De ingeschatte kansen zijn weer 80% en 20%.
Als er nu weer één nieuw datapunt bij komt dat naar B wijst, dan is de nieuwe geschatte kans voor A maar een klein beetje lager: namelijk 78% (40/51).

« **Reactie #17 Gepost op:** 14-01-2024, 11:29:54 »

Ik vond Jurre en Everon qua mol en ook aanwezigheid in afleveringen en verdachtmakingen best wel vergelijkbaar.
Ik kan me dus voorstellen dat wanneer de mol dit jaar op Jurre of Everon zou lijken qua gedrag en houding dat Fons hier inderdaad boven komt drijven. Maar wat als de mol dit jaar een totaal ander type is, die bijvoorbeeld in het begin veel aanweziger is of misschien wel brutaler molt in het begin of juist meer op de achtergrond blijft? Dan werkt het niet om 'patronen' van de afgelopen twee jaar te gebruiken om de mol van dit jaar te voorspellen.
Ik vraag me af wat dit model als output zou geven als je dit toepast op bijvoorbeeld WIDM 2021 of 2020 of 2019 of nog eerder.

« **Reactie #18 Gepost op:** 14-01-2024, 16:15:15 »

Ben benieuwd naar jouw visie na aflevering 2.

« **Reactie #19 Gepost op:** 15-01-2024, 17:00:43 »

Citaat van: MarjoleinJH op 14-01-2024, 16:15:15

Ben benieuwd naar jouw visie na aflevering 2.

Same here!

Volgens mij weet ik van vorig jaar dat deze "algoritme" een eigen site heeft. Weet iemand daar de url nog van?

Auteur Topic: Die-is-de-Mol (gelezen 86003 keer)

Info center

RealityNet

Activiteitenagenda