zaterdag 25 februari 2006

Tit For Tat

(Naverteld uit Axelrod, The Evolution of Co-operation, 1984 (1990), warm aanbevolen.)

Er was eens een toernooi waarin de deelnemers computerprogramma's waren. Het toernooi bestond er in dat de programma's een (onbekend) aantal malen tegen elkaar zouden "uitkomen". En “uitkomen” betekende dat de beide programma's de keuze zouden hebben tussen het "zetten" van een X of een Y, zonder op het moment van hun beslissing te weten wat de zet van dat andere programma werd. Maar de score die ze zouden halen hing wel af van die beslissing van dat andere programma, en wel overeenkomstig de tabel waarvan eerder in dit blog al sprake was (1).

Dus: de totale score voor beide was het hoogst wanneer de twee partijen wat water in de wijn doen, maar de verleiding om dat niet te doen - alsook het risico als je het wel doet - is erg groot. En die voorwaarden werden bekendgemaakt, de uitnodigingen werden verstuurd, en de programmeurs gingen aan het werk en zonden programma’s in. Die probeerden op verschillende manieren hun scores te vergroten door diverse combinaties van samenwerken, exploiteren, enzovoort. En de programma's werden in het systeem geladen en het toernooi begon.

(Als dit een stripverhaal was, dan stond hier nu een tekening met stofwolkjes, vuistjes, sterretjes, bommetjes en gezichtjes van (bijvoorbeeld) Jerom; allemaal in één woest draaiende beweging verworst.)

Het toernooi bleek, toen de stofwolkjes waren opgetrokken, te zijn gewonnen door een programma dat "Tit for Tat" heette. De strategie van TFT was zeer simpel. Bij de eerste zet tegen een bepaalde tegenstander speelde het Y. Bij elke volgende confrontatie checkte het programma of het al tegen die tegenstander was uitgekomen, en het copiëerde eenvoudig wat die tegenstander bij de vorige zet had gedaan. Tenzij, dus het de eerste confrontatie was, want dan speelde het Y.

En dus was TFT kwetsbaar voor exploitatie. Dat betekende dat het een kogelronde nul scoorde bij de eerste confrontatie, indien de listige tegenstander probeerde er met een drie vandoor te gaan. Maar in dat geval kreeg die listige tegenstrever lik op stuk (want TFT copiëerde bij de volgende confrontatie immers de X van die tegenstrever) - en die had nu de keuze. OFWEL speelde hij bij elke volgende confrontatie X, en dan bleef TFT dat maar copiëren uit de vorige zet van die tegenstander, en tegen elkaar scoorden beide programma's reeksen ééns. OFWEL accepteerde het andere programma dat het een Y speelde, zodat TFT er op zijn beurt (omdat het nog steeds de X uit de vorige zet copiëerde) met een drie vandoor ging, maar bij de volgende zet weer wel zelf ook met een Y probeerde.

En dat zal tussen TFT en de listige programma's ongetwijfeld geleid hebben tot reeksen X-en, en dus reeksen scores van niet meer dan één. Maar intussen ontmoette TFT ook geregeld programma's die wel vaak Y speelden, en dan scoorden TFT en die vriendelijker programma's reeksen van tweeën... en de empirische waarneming - TFT won immers het toernooi - leerde dat een systeem dat probeert samen te werken, maar terugslaat bij exploitaitie, de beste strategie is. Terwijl listige strategieën wel af en toe een drie scoren, maar blijkbaar op de langere duur met lange reeksen wederzijdse X-en eindigden. Sterker nog, toen een nieuw toernooi werd uitgeschreven, met dezelfde omstandigheden, en mèt de mededeling dat TFT het vorige toernooi had gewonnen, toen namen TFT en een aantal programma's die probeerden TFT te verslaan deel, en TFT won opnieuw het toernooi.

De moraal van dit stukje van het verhaal - want het blijft nog steeds een heel klein stukje - is dat we alvast één geval hebben waarin Prisoner's Dilemma niet tot negatief, exploiterend gedrag hoeft te leiden. Indien het om een relatie gaat waarin er een toekomst is, dan is het mogelijk dat de spelers die toekomst in hun beslissing laten doorwegen. TFT is een goede strategie om hen ervan te overtuigen dat te doen: het heeft een positieve benadering, maar weet venijnig te zijn. Ook al opgemerkt hoe in de politiek coalitiepartners aan het begin van een legislatuur poeslief en positief voor elkaar zijn, en naarmate de volgende verkiezing nadert meer stekels gaan opzetten? De verleiding om een vlugge X te plaatsen en met de drie punten te gaan lopen (omdat de partner nog braaf Y speelt) wordt groter, naarmate het partnership minder toekomst heeft. Zo voorspelbaar als wat, maar zelfs vinden ze het natuurlijk allemaal Buitengewoon Geweldig Belangrijk (ze staan er immers mee op de voorpagina van de krant), en ze noemen het Politiek.

(1)
http://speelsmaarserieus.blogspot.com/2006/02/dingen-die-iedereen-zou-moeten-weten_13.html

Geen opmerkingen: