Auteur Topic: Die-is-de-Mol  (gelezen 21487 keer)

Offline Allomol

  • Forumlid
Re: Die-is-de-Mol
« Reactie #80 Gepost op: 6-02-2024, 22:44:50 »

Met andere woorden, hadden alle tien de kandidaten afl. 0 dezelfde kans?


Ja, de startkans tot het moment bekendmaking van de kandidaten is voor elke kandidaat dezelfde. We hebben zeg 10 kandidaten dus de a priori kans op dat moment is 0,10 voor elk, Mol of niet. Je weet immers nog niks relevants.

Daarna wordt het anders. Er beginnen stukjes informatie los te komen die je gebruikt om de startposities keer op keer te updaten. Van dat moment gaan de kansen dus wel uit elkaar lopen.
Oke, en dus is alles precies wel
wat het niet lijkt te zijn?

Offline Mollem

  • Forumlid
  • love and understanding
Re: Die-is-de-Mol
« Reactie #81 Gepost op: 6-02-2024, 22:57:12 »
Dan kan ik me voorstellen dat de miniem kleine brokjes aan het begin voor significante verschillen zorgen die uiterst belangrijk zijn voor de brokjes die daarna komen, gezien de grafiek. Ben enorm benieuwd naar die begin stukjes  :)

Offline Erik Leppen

  • Forumlid
  • Geslacht: Man
  • Follow the molpunten
Re: Die-is-de-Mol
« Reactie #82 Gepost op: 6-02-2024, 23:13:12 »
Wat ik niet begrijp (dit sluit denk ik aan bij de vragen van Mollem) is hoe het kan dat zo'n model - hoe het ook is opgezet - iemand met kans >99% aanwijst als mol. Waarom zou er zo veel meer informatie naar één persoon leiden dan naar alle anderen, dat er zó'n overtuigende conclusie uit komt? Want eigenlijk is de conclusie: ofwel Fons is de mol, ofwel het model klopt niet.

(En aangezien ik Fons totáál niet verdenk...)

Is het echt zo dat in bijna alle denkbare situaties waarin het vertoonde gedrag zich voordoet, Fons de mol is? Oftewel, dat er (bijna) geen denkbare situaties bestaan met een andere mol die leiden tot wat we tot en met aflevering 5 zien?

Zo niet, hoe moeten we dan die >99% begrijpen?

Waar ik op doel is de vraag waarom er niet een, ik zeg maar wat, "35%, 23%, 15%, 8%, 7%, 6%, 6%"-achtige verdeling uitkomt.
Maar ze gaan natuurlijk niet zeggen van, de mol is, eh, Klaas

Offline Marimol

  • Forumlid
  • 10 kilo bananen......bananen zijn gezond.
Re: Die-is-de-Mol
« Reactie #83 Gepost op: 6-02-2024, 23:15:29 »
Ik ben ook benieuwd alhoewel ik snap dat je niet het achterste van je tong kunt laten  zien.

Codeerik gaat van dezelfde bayesesiaanse logica  uit start ook met een kans van 1 op 10 en voegt ook stukjes informatie toe maar komt nu op een  andere mol uit terwijl hij ook voorgaande seizoenen al vroeg de mol gevonden  had.  Ik denk dat het verschil zit in welke informatie uit welke lagen wordt toegevoegd.

Het Moldel is momenteel informatie aan het toevoegen maar de info is nog niet openbaar zag ik. Met doorklikken kon ik al wel e.e.a. zien. Maar ook hier meerdere lagen die gebruikt worden.


Offline Allomol

  • Forumlid
Re: Die-is-de-Mol
« Reactie #84 Gepost op: 7-02-2024, 01:33:39 »
Ik snap jullie vraag heel goed: hoe is het in vredesnaam mogelijk dat je op basis van zo beperkte informatie dit soort toch wel extreme uitspraken kan doen?

Het antwoord ligt in de niet helemaal-intuitieve kracht die zit in de herhaalde toepassing van het Theorema van Bayes.

Laat me een voorbeeld geven aan de hand van een simulatie. Ik versimpel sterk en moet een serie aannames doen, maar het laat denk ik vrij goed zien hoe het principe werkt.

Stel we hebben een spel met twee kandidaten A en B waarvan we weten dat er een de Mol is.  A is de Mol, maar dat weten wij niet.  En stel ook dat we één test hebben om te bepalen of een kandidaat de Mol is. Onze test is bijvoorbeeld: staat kandidaat A of B in het spel op een sleutelpositie, ja dan de nee? Stel ook we zijn in staat een bepaalde waarschijnlijkheid  koppelen aan ons vermogen om te bepalen of een kandidaat op die sleutelpositie staat. Laten we uitgaan van drie scenario's: de odds op een juist beoordeelde sleutelpositie, die zijn in scenario 1: 1:1 (50%), in scenario 2 11:20 (55%) en in scenario 3: 2:3 (67%). Stel we spelen ons spel 15 rondes achter elkaar en bepalen na elke ronde opnieuw de kans dat A resp. B de Mol is.

De resultaten van deze simulaties zijn weergeven in de bijgaande grafiek. In scenario 1 gooien we feitelijk een muntje op en voegen we dus geen relevante informatie toe, de kansen blijven 50%. Maar in de scenario's 2 en 3 voegen wel een beetje informatie toe en zie je dat de kansen over tijd naar 100% en 0% gaan voor A resp. B. . Je eindigt dus als je maar lang genoeg door kan gaan (en dat is een cruciale aanname!) of bij de 100% of bij de 0% en dus niet ergens er tussenin. Het meest extreme scenario denkbaar is met een spoilerhint a la Klaas is de Mol, dan zitten we na 1 ronde al op 100%/0%

De praktijk van WidM is natuurlijk wel complexer en een flink stukje rommeliger dan dit versimpelde, gestileerde voorbeeld. Je zou uit alle oude seizoenen bijvoorbeeld  moeten bepalen hoe vaak de Mol daadwerkelijk op een sleutelpositie stond. Dat heb ik om te beginnen al niet voor alle seizoenen gedaan. En dan nog, hebben we dit seizoen wel te maken met zo'n 'gemiddelde Mol'? En ook, hoe goed ben ikzelf eigenlijk in het vaststellen wat sleutelposities zijn en wat niet?

Maar dat we dit alles niet exact kunnen bepalen wil nog niet zeggen dat we geen acceptabele inschattingen kunnen maken. Een beetje afhankelijk van de hoeveelheid historische data uit oude seizoenen die ik heb verzameld, kies ik voor deze model-waarschijnlijkheden een waarde ergens tussen de 0,55 en 0,75. Wat ook helpt is een selectiefilter met expliciete criteria om je beslissing op te baseren ook weer gebaseerd op vroegere afleveringen. Naarmate er meer seizoenen door DidM heengaan zal er meer data beschikbaar komen om het model mee te trainen en dus ook betere inschattingen te maken van deze kansen

Zo dat is een flinke lap tekst, maar ik vond het eigenlijk wel een keertje leuk om op te schrijven. Hoop dat dit een beetje een beeld geeft wat ik probeer te doen met DidM.

Btw dit is een video die misschien wel de meest intuďtieve uitleg van de regel van Bayes geeft die ik gezien heb.

 https://youtu.be/HZGCoVF3YvM?si=W3GqPOh0jRAzZg-p
« Laatst bewerkt op: 7-02-2024, 01:39:08 door Allomol »
Oke, en dus is alles precies wel
wat het niet lijkt te zijn?

Offline Allomol

  • Forumlid
Re: Die-is-de-Mol
« Reactie #85 Gepost op: 7-02-2024, 01:45:33 »
Ik ben ook benieuwd alhoewel ik snap dat je niet het achterste van je tong kunt laten  zien.

Codeerik gaat van dezelfde bayesesiaanse logica  uit start ook met een kans van 1 op 10 en voegt ook stukjes informatie toe maar komt nu op een  andere mol uit terwijl hij ook voorgaande seizoenen al vroeg de mol gevonden  had.  Ik denk dat het verschil zit in welke informatie uit welke lagen wordt toegevoegd.

Het Moldel is momenteel informatie aan het toevoegen maar de info is nog niet openbaar zag ik. Met doorklikken kon ik al wel e.e.a. zien. Maar ook hier meerdere lagen die gebruikt worden.

De grondslagen zijn denk ik goed vergelijkbaar, de grootste verschillen zijn dat het aantal lagen in DidM aanzienlijk groter is en dat er filters met expliciete selectiecriteria voor de lagen zijn geplaatst.
Oke, en dus is alles precies wel
wat het niet lijkt te zijn?

Offline SanderFMC

  • Forumlid
Re: Die-is-de-Mol
« Reactie #86 Gepost op: 7-02-2024, 02:10:51 »
Ik moet zeggen dat ik me toen ik dit topic las ook wel verbaasd heb over een model dat met >99% zekerheid de mol aanwijst!

Stel we hebben een spel met twee kandidaten A en B waarvan we weten dat er een de Mol is.  A is de Mol, maar dat weten wij niet.  En stel ook dat we één test hebben om te bepalen of een kandidaat de Mol is. Onze test is bijvoorbeeld: staat kandidaat A of B in het spel op een sleutelpositie, ja dan de nee? Stel ook we zijn in staat een bepaalde waarschijnlijkheid  koppelen aan ons vermogen om te bepalen of een kandidaat op die sleutelpositie staat. Laten we uitgaan van drie scenario's: de odds op een juist beoordeelde sleutelpositie, die zijn in scenario 1: 1:1 (50%), in scenario 2 11:20 (55%) en in scenario 3: 2:3 (67%). Stel we spelen ons spel 15 rondes achter elkaar en bepalen na elke ronde opnieuw de kans dat A resp. B de Mol is.
Als ik dit stukje goed interpreteer, betekent dat dan dat je in deze simulatie 15 keer op rij dezelfde kansen hebt toegepast? Dan snap ik de uitkomst van de simulatie wel: als 15 keer op rij kandidaat A twee keer meer kans heeft om de mol te zijn dan kandidaat B, eindig je met grote cijfers. Maar in de praktijk is dat toch niet zo? Soms pleit er iets voor de ene kandidaat, soms voor de andere. Ik zie niet hoe de kansen in een praktijkvoorbeeld zo hoog zouden moeten kunnen oplopen, tenzij er afhankelijkheid bestaat tussen de verschillende datapunten of een confounder die alle datapunten beďnvloed (zo'n confounder zou bijvoorbeeld de tunnelvisie kunnen zijn van jouzelf, mogelijk onbewust).

De praktijk van WidM is natuurlijk wel complexer en een flink stukje rommeliger dan dit versimpelde, gestileerde voorbeeld. Je zou uit alle oude seizoenen bijvoorbeeld  moeten bepalen hoe vaak de Mol daadwerkelijk op een sleutelpositie stond. Dat heb ik om te beginnen al niet voor alle seizoenen gedaan. En dan nog, hebben we dit seizoen wel te maken met zo'n 'gemiddelde Mol'? En ook, hoe goed ben ikzelf eigenlijk in het vaststellen wat sleutelposities zijn en wat niet?

Maar dat we dit alles niet exact kunnen bepalen wil nog niet zeggen dat we geen acceptabele inschattingen kunnen maken. Een beetje afhankelijk van de hoeveelheid historische data uit oude seizoenen die ik heb verzameld, kies ik voor deze model-waarschijnlijkheden een waarde ergens tussen de 0,55 en 0,75. Wat ook helpt is een selectiefilter met expliciete criteria om je beslissing op te baseren ook weer gebaseerd op vroegere afleveringen. Naarmate er meer seizoenen door DidM heengaan zal er meer data beschikbaar komen om het model mee te trainen en dus ook betere inschattingen te maken van deze kansen
Heb je de data uit historische seizoenen bepaald voor- of nadat je wist wie de mol was in dat seizoen? In het laatste geval, denk je dat er kans bestaat op outcome bias in de trainingsdata? (dat je inschatting van wat bijvoorbeeld een sleutelpositie is wordt beďnvloed door jouw voorkennis van wie de mol is)

Ik zou het op zich best interessant vinden om te zien welke datapunten het model in gaan. Want zeggen dat je met vrijwel 100% zekerheid de mol aan kunt wijzen is best een buitengewone stelling die buitengewone data vereist.

Offline Erik Leppen

  • Forumlid
  • Geslacht: Man
  • Follow the molpunten
Re: Die-is-de-Mol
« Reactie #87 Gepost op: 7-02-2024, 11:55:30 »
Dank voor de uitleg :)

Stel we hebben een spel met twee kandidaten A en B waarvan we weten dat er een de Mol is.  A is de Mol, maar dat weten wij niet. En stel ook dat we één test hebben om te bepalen of een kandidaat de Mol is. Onze test is bijvoorbeeld: staat kandidaat A of B in het spel op een sleutelpositie, ja dan de nee? [...] De odds op een juist beoordeelde sleutelpositie, die zijn [...] in scenario 2 (55%) [...].

[...]

Je eindigt dus als je maar lang genoeg door kan gaan (en dat is een cruciale aanname!) of bij de 100% of bij de 0% en dus niet ergens er tussenin.

Alleen, je theoretische voorbeeld lijkt uit te gaan van het 15 keer toepassen van één test. Oftewel, van 15 testen die allemaal in het voordeel van dezelfde kandidaat zijn. Maar in werkelijkheid is dat niet het geval: ik neem aan dat je allerlei verschillende testen hebt (in elk geval een per opdracht) waarbij je percentages aan toewijst aan kandidaten, en dat steeds op een andere manier verdeeld is. Dus een test voor A 40% B 35% C 25%, en een test met A 28% B 38% C 34%, ik zeg maar wat. Dán zou ik wel een eindconclusie iets meer "in het midden" verwachten...

Een ander ding dat ik begrijp uit je verhaal, is dat als één test zegt dat B = 0%, dat dan voor de rest van het model B altijd op 0% zal blijven staan. Is het zo dat misschien alle andere kandidaten een keer ergens (bijna) 0% zijn geweest en Fons als enige toevallig niet? En dat daarom het model alle andere kandidaten (bijna) uitsluit?

Stel er zou nu een test worden toegevoegd met de verdeling {Fons 1%, de andere 5 kandidaten elk 19,8%}. Dan zou het wel gaan schuiven neem ik aan?
Maar ze gaan natuurlijk niet zeggen van, de mol is, eh, Klaas

Offline Allomol

  • Forumlid
Re: Die-is-de-Mol
« Reactie #88 Gepost op: 7-02-2024, 12:03:42 »
Tja, wat ga ik hier zeggen dat een beetje helderheid zou kunnen geven. Bij voorbaat mijn excuses aan iedereen die dit leest, dit gaat een vrij fundamentele, behoorlijk taaie post worden. En toch denk ik dat dit de manier is om te begrijpen waar we hier eigenlijk over praten.

Laat ik beginnen met te zeggen dat ik snap dat je je verbaast, dat doe ik namelijk ook. En we zijn niet de enigen. Misschien wel de grootste controverse in de wiskundige statistiek van de afgelopen 150 jaar is die tussen de aanhangers van de klassieke, frequentistische benadering en de Bayesianen.

Pas toen na de uitvinding van de computer en de toename van de rekenkracht bleek dat je met een Bayesiaanse aanpak een aantal praktische problemen kon oplossen die tot dan toe onoplosbaar werden geacht, is deze controverse gaan liggen. Bekende voorbeelden  zijn het kraken van de Duitse Enigma code in WO2 en het opsporen van gezonken onderzeeërs en vermiste kernbommen in de naoorlogse periode. De eerste voorbeelden komen vooral uit de militaire hoek. Dat komt denk ik omdat het leger vrij weinig ophad met de academische overpeinzingen van de frequentisten en gewoon heel snel resultaten wilde zien

Het verschil tussen de klassieke en de bayesiaanse benadering zit hem in de manier waarop omgegaan wordt met onzekerheid en daarmee hoe gekeken wordt naar het begrip 'kans'. De frequentistische benadering van de statistiek gaat ervan uit dat er een objectieve kans bestaat op een bepaalde eigenschap in een populatie en dat we die kans kunnen leren kennen door herhaaldelijk steekproeven te nemen uit deze populatie. Denk aan het klassieke opgooien van een muntje om te bepalen of we te maken hebben met een zuivere munt of niet.

Dit werkt vaak goed, maar er zijn ook regelmatig situaties waarin het niet mogelijk of niet praktisch is om herhaalde steekproeven te nemen. Dat geldt bijvoorbeeld ook voor ons op dit forum. Elke Mol in elk seizoen, alle kandidaten en elke opdracht zijn weer anders. We kunnen niet de kandidaten naar believen een bepaalde opdracht een aantal keren laten herhalen, turven wat de uitkomsten zijn en zo vaststellen wie de Mol is. Dat zou natuurlijk heel fijn zijn, maar ik denk niet dat de makers ons die kans nog gaan geven  ;D

We hebben dus een andere benadering nodig en die is er. De Bayesiaanse aanpak gaat er kort gezegd van uit dat 'objectieve kansen' in de werkelijkheid niet bestaan, maar dat er alleen subjectieve kansinschattingen zijn over een bepaalde werkelijkheid en dat je die kansinschattingen kunt verbeteren door telkens stukjes informatie toe te voegen aan alles wat je al weet.

Op de middelbare school zijn we vrijwel allemaal in aanraking gekomen met de klassieke, frequentistische statistiek, dat is hoe de meesten van ons hebben leren denken over onzekerheid en kansen. Als een frequentist naar de bayesiaanse aanpak kijkt is ie verbaasd hoe het toch mogelijk kan zijn dat relatief weinig informatie zo'n impact op de berekende kans kan hebben. De resultaten van bayesiaanse zoekalgoritmes lijken daarom voor de frequentist al gauw spectaculair: je breekt de Enigma code, vindt de onderzeeër op de oceaanbodem en ontmaskert de Mol  ::hypocriet::

Ik hoop dat deze uiteenzetting een beetje helpt.

Nog twee opmerkingen over veelvoorkomende misverstanden

1. De Bayesiaanse aanpak is net als de klassieke aanpak niet onfeilbaar en de implementatie daarvan in een voorspellend model al helemaal niet. Het is dus heel goed mogelijk dat DidM het dit seizoen niet bij het juiste eind heeft.

2. De Bayesiaanse en frequentistische methoden zijn niet twee verschillende werkelijkheden. Het zijn twee verschillende manieren om naar dezelfde werkelijkheid te kijken. Beide methoden leiden uiteindelijk ook tot dezelfde berekende kansen. Alleen met de Bayesiaanse methode lukt dat in onzekere situaties meestal een stukje sneller.

En daarmee zijn we dan weer teruggekomen bij onze Verbazing,  ::oink::


« Laatst bewerkt op: 7-02-2024, 12:06:52 door Allomol »
Oke, en dus is alles precies wel
wat het niet lijkt te zijn?

Offline Doctor WidM?

  • Forumlid
  • Brilliant!
Re: Die-is-de-Mol
« Reactie #89 Gepost op: 7-02-2024, 12:11:24 »
Ik heb veel bewondering voor de tijd en moeite die je in zo'n model steekt.  ::ok:: Toch wil ik nog een kritische vraag toevoegen aan wat hiervoor al gezegd is: in hoeverre is het resultaat van het model toe te schrijven aan 'objectieve' kennis die het in oude seizoenen heeft opgedaan en in hoeverre is het toe te schrijven aan jouw (subjectieve) inschatting van sleutelposities et cetera? Om het heel kort door de bocht te formuleren: in hoeverre kijken we naar een modelmatige extrapolatie van je eigen inschatting wie de mol is?

Ik weet dat je zegt dat je allerlei subjectieve informatie niet meeneemt (al jeuken je handen), maar ook in het bepalen van de objectief lijkende input maak je (denk ik) een bepaalde impliciete keuze.

Offline SanderFMC

  • Forumlid
Re: Die-is-de-Mol
« Reactie #90 Gepost op: 7-02-2024, 12:18:58 »
Ik denk dat de vragen van Erik Leppen en mij niet zozeer over Bayesiaanse statistiek in zijn algemeenheid gaan (ik ben daar in ieder geval wel bekend mee, en Erik Leppen is volgens mij wiskundige dus die denk ik ook wel), maar specifiek over jouw toepassing in je model. Op zich is het een goed en informatief stukje dat je schrijft (ik wil wel even benadrukken dat een klassieke en frequentistische interpretatie ook niet hetzelfde is, maar dat voert te ver voor hier), maar het beantwoordt de vragen niet echt. Ik zal de vragen nog eens stellen:

1. Is het zo dat alle, of in ieder geval bijna alle, datapunten in de richting van Fons als mol wijzen? Zo ja, is het mogelijk dat je (onbewust) vooral je eigen tunnelvisie bevestigt?
2. Had je bij het trainen van het model op basis van historische seizoenen al voorkennis over wie de toen mol was? Zo ja, kan dat de trainingsdata beďnvloed hebben omdat je met voorkennis de situaties hebt beoordeeld?
3. Is het mogelijk om de onderliggende datapunten te delen? (Als je dat wil natuurlijk)

Offline Treveo

  • Forumlid
Re: Die-is-de-Mol
« Reactie #91 Gepost op: 7-02-2024, 12:30:00 »
Wat ik op dit moment vooral zeer super interessant vind: afgelopen 2/3 seizoenen zaten volgens mij alle 3 de modellen (DidM, Codeerik en Moldel) vrij snel op de juiste Mol. Maar dit seizoen kon je zien dat de modellen telkens op een andere Mol zitten.

DidM zit vanaf het begin volle bak op Fons.
Codeerik begon op Anna, daarna switch naar Kees, maar Tooske zit niet echt ver van Kees af op de 2e plaats.
Moldel voornamelijk op Jeroen, maar die zat nooit echt flink op #1. Na Jeroen zijn exit, zit het model nu op Tooske.

Lennart van Moldel heeft na exit van Jeroen blijkbaar wat veranderingen aangebracht aan de lagen, en zo te zien heeft hij ook de oudere seizoenen opnieuw laten berekenen: https://github.com/LennartJKlein/Moldel/commit/597aa6f8335b32810c975d7ba103ca432074e169. Het is nu te zien dat Moldel het vorige seizoen met Jurre als Mol heel andere uitkomst heeft met de huidige lagen.

Moldel is open source als het goed is (buiten de datapunten), zou het kunnen dat de regie van WidM die code bestudeerd hebben om daarna de montage zo te doen dat het model er sneller naast zit qua de voorspellingen?


Offline Allomol

  • Forumlid
Re: Die-is-de-Mol
« Reactie #92 Gepost op: 7-02-2024, 12:34:44 »
Oke, nog eentje dan.

Het is voor de bouwer van een voorspellend model natuurlijk het ultieme om een model te bouwen dat alleen gevoed kan worden met objectieve data. Haico van het Moldel volgt (grotendeels) deze benadering. De resultaten hiervan blijken in de praktijk nogal wisselend. Persoonlijk denk ik dat een benadering met objectieve inputs alleen niet meer gaat lukken omdat de invloed van de regie over de jaren heen veel en veel te groot is geworden.

'Next best' is dan -en daar heb ik voor gekozen- om ook subjectieve data (zoals niet-de-Mol gedrag) toe te laten in het model en tegelijkertijd te proberen om die subjectiviteit zoveel mogelijk te reduceren. Ik doe dat in DidM doordat ik 1. me beperk tot waarneembaar gedrag van kandidaten en de productie, dus geen aannames/speculaties en 2. voor elke laag in DidM een filter heb gezet met selectiecriteria voor de opname van een observatie in het model. Ik denk dat je met deze benadering een heel eind kunt komen.

Het is een illusie om te denken dat je je eigen tunnels en biases zou kunnen uitschakelen. Dat kan niet en dat hoeft voor mij ook helemaal niet, er moet iets te puzzelen overblijven.  ::vergroot::
Oke, en dus is alles precies wel
wat het niet lijkt te zijn?

Offline Allomol

  • Forumlid
Re: Die-is-de-Mol
« Reactie #93 Gepost op: 7-02-2024, 13:12:46 »
Oke nog eentje dan en dan moet ik echt weer aan de slag  ::tandpastasmiley::

1. Is het zo dat alle, of in ieder geval bijna alle, datapunten in de richting van Fons als mol wijzen? Niet naar Fons als persoon, maar wel naar de Mol. Bedenk dat voor een 'echte' kandidaat de gekozen inputvariabelen in principe random zijn verdeeld. Zo zal je als kandidaat soms onbewust op een sleutelpositie staan en soms sta je daar niet. Bij de Mol is de hypothese dat de verdeling niet random meer is. De hypothese is dat de Mol wel een voorkeur heeft voor sleutelposities. Hij/zij zal er niet altijd op staan, maar wel vaker dan je op basis van het toeval zou mogen verwachten. Zo ja, is het mogelijk dat je (onbewust) vooral je eigen tunnelvisie bevestigt? Jazeker is dat mogelijk. Zie ook mijn antwoord hierboven over de objectieve en (semi-) subjectieve inputs en hoe ik daarmee omga.


2. Had je bij het trainen van het model op basis van historische seizoenen al voorkennis over wie de toen mol was? In 2023 had ik geen voorkennis, DidM liep toen gewoon mee net als dit jaar. In 2022 en eerder wel, dit zijn backtests geweest. Zo ja, kan dat de trainingsdata beďnvloed hebben omdat je met voorkennis de situaties hebt beoordeeld? Ja, dat kan. Het gaat hier om het bepalen van de "priors" in de regel van Bayes. Hoe vaak komt een bepaalde eigenschap voor als een kandidaat de Mol is en hoe vaak komt deze voor als een kandidaat niet de Mol is. Als die eigenschap niet objectief in maat en getal is vast te stellen komt het selectiefilter om de hoek kijken dat ik voor elke variabele heb geplaatst. Daarmee kun je een eigenschap concreet maken in observeerbaar gedrag. Bijvoorbeeld bij de laag Klassiek Molgedrag: we weten dat Mollen vaker ander kandidaten beschuldigen dan dat 'echte kandidaten' elkaar beschuldigen. Als je op dit detailniveau aankomt wordt het een kwestie van oude beelden terugkijken en beschuldigingen turven. Verder verwijs ik weer naar mijn post hierboven hoe ik omga met subjectieve inputvariabelen

3. Is het mogelijk om de onderliggende datapunten te delen? (Als je dat wil natuurlijk) Niet om flauw te zijn, maar dat ga ik niet doen. Ik zie twee mogelijkheden voor de toekomst van DidM. 1. DidM blijkt een betrouwbare, vroege voorspeller van de mol te zijn. Dan heb ik een tool gebouwd om potentieel het programma 'de nek om te draaien' en dat gaat niet gebeuren. In het verlengde daarvan wil ik ook niet dat de broncode van DidM op straat komt te liggen zodat iemand anders het model zou kunnen reverse engineeren. De inputdata beschouw ik als onlosmakelijk onderdeel van de broncode. 2. Of DidM blijkt toch niet zo betrouwbaar te zijn als verwacht en dan mag je direct alles vergeten wat ik hierboven bij 1. heb gezegd. 
« Laatst bewerkt op: 7-02-2024, 14:50:30 door Allomol »
Oke, en dus is alles precies wel
wat het niet lijkt te zijn?

Offline Mollem

  • Forumlid
  • love and understanding
Re: Die-is-de-Mol
« Reactie #94 Gepost op: 7-02-2024, 13:51:46 »
Heel mooi. Er is mij in ieder geval een hoop duidelijker geworden; dank voor de zeer uitgebreide uiteenzettingen en antwoorden. Ik ben best benieuwd of de drie modellen te mergen zijn, en of dat balans of juist disbalans brengt in de tendens; (versterkt de input elkaar, doven ze elkaar uit of middelen ze gewogen). En verder lijkt het me voor dit forum erg interessant of we in de toekomst gezamenlijk (voor wie er kennis van heeft) kunnen bouwen aan een zo objectief mogelijke dataset. Laatste wat ik zou willen is een modellist die de hele serie niet kent (  :o  ) en data genereert zonder voorkennis...

Offline Doctor WidM?

  • Forumlid
  • Brilliant!
Re: Die-is-de-Mol
« Reactie #95 Gepost op: 7-02-2024, 14:02:42 »
Dank voor je zeer geduldige toelichting  ::bravo::

Offline SanderFMC

  • Forumlid
Re: Die-is-de-Mol
« Reactie #96 Gepost op: 7-02-2024, 15:00:50 »
Dank voor het beantwoorden van de vragen Allomol! De antwoorden op vraag 1 en 2 zijn heel helder: de input is deels subjectief dus mogelijk ook beďnvloed door biases. Het antwoord op vraag 3 is dan weer teleurstellend, dat je bewust de keuze maakt de broncode en data niet te willen delen. Ik respecteer je keuze daarin, maar het zorgt er wel voor dat je mijn scepsis ondanks je uitgebreide antwoorden niet hebt weggenomen.

Offline Koemba

  • Forumlid
  • Geslacht: Vrouw
Re: Die-is-de-Mol
« Reactie #97 Gepost op: 8-02-2024, 10:38:19 »
Heel interessant weer Allomol! Ik vind het speuren naar de mol door je analyse alleen nog maar leuker geworden omdat zeer benieuwd ben of je het bij het rechte eind hebt!

Offline Allomol

  • Forumlid
Re: Die-is-de-Mol
« Reactie #98 Gepost op: 8-02-2024, 12:12:59 »
Er zit nog een deel menselijke beoordeling in DiDM.

Ik vermoed dat als je helemaal los zou willen gaan en je koppelt DiDM aan gezichtsherkenningssoftware en een LLM a la ChatGPT, je dat er misschien ook nog wel tussenuit zou kunnen halen.

En dan? Beetje de situatie als bij schaken, de computer kan iets beter dan de mens.
Oke, en dus is alles precies wel
wat het niet lijkt te zijn?

Offline Martialis1

  • Forumlid
Re: Die-is-de-Mol
« Reactie #99 Gepost op: 11-02-2024, 22:24:25 »
Er zit nog een deel menselijke beoordeling in DiDM.

Ik vermoed dat als je helemaal los zou willen gaan en je koppelt DiDM aan gezichtsherkenningssoftware en een LLM a la ChatGPT, je dat er misschien ook nog wel tussenuit zou kunnen halen.

En dan? Beetje de situatie als bij schaken, de computer kan iets beter dan de mens.

Heb je al geprobeerd wat nodig zou zijn om op een andere mol dan Fons uit te komen? Bijvoorbeeld bepaalde vragen niet mee te wegen? Ik bedoel te zeggen: is het model aan te passen zodat je op een andere kandidaat uitkomt? Want ik kan me voorstellen dat je met het model als nu ingericht je altijd op fons uit gaat komen, maar wat als je, data punten waar je het “mis” op zou kunnen hebben minder meeweegt?