maandag 13 februari 2006

Dingen die "iedereen" zou moeten weten (deel 2): Prisoner's Dilemma

De problemen die ik denk aan te pakken hebben ongeveer de volgende structuur. A heeft een lapje grond tussen de duinen en zicht op zee, en hij graaft een stuk duin af en zet er een optrekje neer. B heeft een soortgelijk lapje grond, en doet hetzelfde. C, D en E volgen, en het Grieks en Kyrillisch alfabet zullen niet volstaan om de rest van de droeve geschiedenis te schrijven. Aan het einde van de wandeling in de duinen hebben we een betonnen muur van Knokke tot de Franse grens, maar wel met zicht op zee.

In het volgende stadium verschijnen boze en ontstelde lezersbrieven in de kranten, die de teloorgang van het prachtige natuurgebied laken, de schuld werpen op de menselijke kortzichtigheid in het algemeen, en het egoisme van de moderne maatschappij in het bijzonder. En hoewel de klagers zeker een punt hebben als ze opmerken dat er iets is misgegaan, slaan hun verwijten de bal mis. Niet de kortzichtigheid, maar het zuiverste, puurste rationeel denken is hier de boosdoener.

Om dat te begrijpen moeten we op zoek naar de logica achter dit verhaal. Deze logica wordt met boeken en bibliotheken tegelijk bestudeerd onder de naam “Prisoner’s Dilemma” (een ander goed trefwoord is "Tragedy of the Commons"). Op zich is het afschrikwekkend saai, en het verhaal waaraan het zijn naam dankt maakt het er volgens mij niet beter op. Laat me dus beginnen met een uitdrukking van die logica, die volgens mij het probleem intuïtief beter uitdrukt.

Er is een meer, en daarrond wonen vissers die sneller vissen dan de vissen nieuwe vissen kunnen bijmaken. En dus nemen de visbestanden af. Iedereen beseft dat er “iets” moet gebeuren. En iedereen vindt dat “iets” betekent dat de anderen minder moeten vissen. Maar niemand doet dat, omdat zelf minder vissen terwijl de anderen veel vissen het slechtste scenario van allemaal is. Sounds familiar? Onder andere het Europese visserijbeleid weet er alles van. Hoe dan ook, hoewel het collectief optimaal resultaat ontstaat als iedereen minder vist, is de uitkomst dat de hele groep om zeep gaat.

Dit verhaal kunnen we formeel uitdrukken. Welke zijn de verschillende mogelijke uitkomsten? Bezien vanuit het individu zijn er twee mogelijkheden: veel, of weinig vissen. Het resultaat van zijn beslissing hangt evenwel niet alleen af van hemzelf, maar ook van “de anderen”. Of hij nu veel of weinig vist, onafhankelijk daarvan kan (een groot deel van) de collectiviteit ook veel, of weinig vissen. Dus zijn er voor elk van zijn twee mogelijkheden ook twee mogelijkheden voor de “tegenpartij”: alles samen vier. Als we vervolgens “veel vissen” met X aanduiden, en “weinig vissen” met Y; en als we de keuze van de visser eerst uitdrukken, en dan die van de tegenpartij, dan zien die vier mogelijkheden er als volgt uit:

(X,X) De visser vist veel, en iedereen doet hetzelfde
(Y,X) De visser vist weinig, maar (een groot deel van) de anderen vissen veel.
(X,Y) De visser vist veel, en (een groot deel van) de anderen doen dat niet.
(Y,Y) De visser vist weinig, en de anderen vissen ook weinig.

En nog een stap verder kennen we getallen toe aan de verschillende mogelijke uitkomsten.

Als iedereen veel vist, heeft iedereen vandaag te eten, maar er is geen toekomst. Laten we dat met een magere één scoren. Dus is het resultaat van (X,X) = (1,1).
Als de visser weinig vist, maar de “tegenpartij” vist veel, dan levert hij zijn bijdrage aan de oplossing van het probleem, maar de anderen exploiteren lustig verder. Deze uitkomst scoren we (Y,X) = (0,3). Hijzelf scoort nul; “de anderen” die hem de kaas van het brood afsnoepen scoren drie.
Als de visser veel vist, terwijl de “anderen” de moeite doen om weinig te vissen, dan is het natuurlijk precies omgekeerd: (X,Y) = (3,0).
En tenslotte, als iedereen zich beheerst is er wel geen weelde vandaag, maar er is wel een toekomst. Dat scoren we (Y,Y) = (2,2). Beide partijen scoren twee, wat beter is dan de toestand verder laten verrotten – waarbij (X,X) = (1,1) – maar op individuele basis is het slechter dan de drie wanneer het je lukt een slag te slaan.

Dus, onder elkaar:

(X,X) = (1,1)
(Y,X) = (0,3) (dit zijn de twee mogelijkheden indien de ander X speelt.)

(X,Y) = (3,0)
(Y,Y) = (2,2) (dit zijn de twee mogelijkheden indien de ander Y speelt.)

Merk op dat deze scoring voldoet aan hoe het beste voor iedereen – iedereen beheerst zich – de hoogste totale score haalt. Omgekeerd is het probleem negeren – iedereen vist maar raak – wat de laagste totale score oplevert. Verder bestaat er een mogelijkheid te proberen “de gemeenschap” te exploiteren: de drie die je kan scoren als “de anderen” zich “gedragen”, en jij ermee weg komt als je dat niet doet.

En een laatste punt toont de essentie. De eerste twee regels tonen de twee mogelijkheden indien de tegenspeler “X” speelt. En het punt is dat in dat geval het individu beter af is als hij zelf “X” speelt: (X,X) scoort 1 voor het individu (die staat nog steeds aan de linkerkant tussen de haakjes) tegenover 0 bij (X,Y). “X spelen” is een defensieve zet tegen de mogelijke poging door de “anderen” om jou te exploiteren.
En de laatste twee regels tonen de twee mogelijkheden indien de tegenspeler “Y” speelt. En wéér doet de speler het beter als hij zelf “X” speelt: 3 voor (X,Y) in plaats van 2 voor (Y,Y). “X spelen” als verleidelijke poging met de buit aan de haal te gaan als “de anderen” Y spelen. En zo is het resultaat dat, wat de tegenpartij ook doet, zelf X spelen (zelf veel vissen) is wat er zal gebeuren. Daarmee hebben we in getallen uitgedrukt wat we intuïtief al begrepen hadden: het probleem van de overbevissing raakt niet opgelost, omdat iedereen wacht op de anderen om de inspanningen te leveren. Er zelf mee beginnen is niet rationeel; te kwetsbaar voor exploitatie.

Als je een bepaalde logica op een consistente manier in getallen kan uitdrukken, dan heb je bewezen dat het scenario mogelijk is. Er is niets gezegd over de vraag of het veel, of weinig, of helemaal niet voorkomt. Maar als we even terugdenken aan het volbouwen van de zeedijk ten koste van de duinen, of het probleem van de overbevising in de wereld, dan zien we meteen dat het veel voorkomt. Iedereen die een lapje grond in een natuurgebied heeft, doet er beter aan dat lapje ook vol te bouwen; en dus de duinen af te graven of de bomen te rooien of whatever. Want wie de duinen niet afgraaft riskeert alleen maar zijn bouwende buren duinen aan te bieden, terwijl wie de boel toch volbouwt misschien, wie weet, wel enkele slachtoffers vindt die hem zijn optrekje temidden van de duinen gunnen. Niks “egoisme”, niks “kortzichtigheid”, gewoon, simpele, rationele, plain vanilla logica.

2 opmerkingen:

Anoniem zei

Mooie analyse, maar niet helemaal volledig.
Er zijn namelijk "Prisonner's Dilemma" situaties waar mensen toch tot samenwerking komen. Namelijk als mensen merken dat het
dillemma zich met de zelfde partners/opponenten zal herhalen in de toekomst. Want nu moeten ze rekening houden met het feit dat de keuze die ze nu maken, zijn invloed heeft op de keuze die de ander in de toekomst zal maken. Het idee dat nu voor samenwerking kiezen, de ander kan uitnodigen de volgende maal ook samen te werken, terwijl de keuze om niet samen te werken tot een afstraffingsreactie kan leiden, zorgen ervoor dat er een rationele basis bestaat om samen te werken. Er is zo zelfs ooit een tornooi van computerprogramma's geweest die tegen elkaar uitkwamen in een reeks van herhaalde dillema's. Een categorie van programma's werd "nice" genoemd omdat ze nooit als eerste de associale keuze maakte. De winnaar van dat tornooi was een
nice programma. Als je meer wil weten moet
je maar eens googlen op Axelrod Robert.
Martin Gardner heeft er ooit ook een artikel aan gewijd.

Koen Robeys zei

Heel juist. Alleen leek me dat allemaal te veel voor één blogpost, en dus was dit iets dat ik voor een "Prisoner's Dilemma deel 2" wou gebruiken. Ik zal die plannen nu maar een beetje naar voor schuiven :-)