:A matemática da cooperação se fundamenta na teoria dos jogos, teoria desenvolvida por John Von Neumann. Durante a segunda guerra mundial, Neumann imigrava para os Estados Unidos, acompanhado de seu amigo, o historiador Jacob Bronowski. Questionado no táxi em direção ao aeroporto sobre sua teoria ser semelhante a um jogo de xadrez, Neumann respondeu:

“o xadrez não é um jogo. O xadrez é uma forma bem definida de computação. Você pode não ser capaz de encontrar a solução correta, mas, teoricamente, sempre há uma solução, um procedimento correto para cada posição. Jogos reais em nada se assemelham a isso. A vida real não é como no xadrez. A vida real consiste em blefes, em pequenas táticas de despistamento, em perguntar a si próprio o que o parceiro está pensando sobre qual será nosso próximo movimento. É esse o tipo de jogo sobre o qual minha teoria se interessa” (Bronowski, 1992, p.432).

A Teoria dos Jogos é utilizada para explicar os jogos de estratégias, próprios da vida real. São modelos matemáticos que nos auxiliam a predizer circunstâncias nas quais os indivíduos tendem a cooperar ou blefar.Uma maneira clássica de explicar a teoria dos jogos é o Dilema do Prisioneiro. Nesse dilema dois indivíduos suspeitos de um crime são colocados em salas separadas para interrogatório. Se um dos indivíduos acusar o outro do crime, mas se autoinocentar, e se for inocentado pelo parceiro, ficará livre e seu parceiro, preso. Se ambos se acusarem mutuamente, ambos serão presos, mas se ambos os parceiros se inocentarem, os interrogadores verão congruência no discurso e ambos serão libertos. Este tipo de dilema ilustra de que forma a teoria dos jogos pode ser formulada em diferentes contextos de interações sociais.

John Maynard Smith (1982) analisando uma teoria evolutiva denominada Estratégias Evolutivamente Estáveis e utilizando a teoria matemática dos conjuntos em programas de computador, demonstrou que numa população na qual os indivíduos entram em competição dois a dois, a seleção natural favorecerá, em longo prazo, a existência de dois tipos de comportamentos:

1. Falcão (que conduz o combate até infringir graves ferimentos ou a morte ao seu adversário);

2. Pombo (que se limita a uma forma ritualizada de combate).

Em uma população de falcões dificilmente um pombo terá vez, pois vai sempre ser agredido pelos falcões e será levado a fugir ou morrer. Por outro lado, em uma população de falcões a luta se estabelece. Em uma população de pombos, dificilmente haverá injúria ou algum tipo de prejuízo, pois os comportamentos não permitem perdas. Na tabela 1 vemos os pontos ganhos ou perdidos deste tipo de simulação de relações dois a dois possíveis dentro de uma população.

Tabela 1: Pontos ganhos e perdidos na disputa entre os dois tipos de comportamentos definidos por Smith (1982).

Para discutir melhor a questão vale ressaltar que os pombos sempre cooperam entre si, e nunca entram em conflito de maneira a diminuir suas chances de sobrevivência. Uma briga entre dois falcões, mesmo que haja um vencedor, esse acabará sofrendo muitas lesões e, não poucas vezes, ambos podem morrer em decorrência do conflito. Em uma população de pombos, que sempre cooperam, os falcões muitas vezes não têm chance, simplesmente por serem ignorados, sem realmente entrarem em conflito com um pombo. Os pombos vão embora e deixam o falcão sozinho. Então em uma população de pombos, não só não existem conflitos com perdas, mas também existe uma ampla rede de proteção mútua, que impossibilita a emergência de comportamentos do tipo falcão. Se pombos e falcões não competem pelos mesmos recursos, mais fácil ainda de abandonar o jogo, o que já oferece muita reflexão sobre quais recursos realmente valem a pena nosso esforço e risco.

Um jogo ilustrativo pode ser a dinâmica do Bem Comum, neste jogo cada criança recebe 10 biscoitos, ou moedas de R$1,00, ou ainda 10 chocolates. Elas podem ficar com os 10 chocolates para si ou depositar em uma mesa denominada de Bem Comum, cujo montante total de chocolates depositados pelos alunos será multiplicado por 3 e repartido igualitariamente entre todas as crianças participantes. Nas primeiras rodadas as crianças tendem a ficar com um número maior de chocolates para si, mas nas rodadas futuras, percebem que quanto mais todos depositarem na mesa do Bem Comum, mais chocolates todos ganharão ao final da brincadeira. Se todos os participantes depositarem os 10 chocolates no Bem Comum, cada participante sairá da brincadeira com 30 chocolates. É uma lógica fácil de perceber por crianças e elas podem levar essa aprendizagem para outros contextos de vida futuros.

A partir das duas estratégias (do pombo e do falcão) é possível definir dois tipos diferentes de adversários, os cooperadores (C) e os desertores (D). Quando um cooperador joga com um adversário também cooperador, sempre o resultado é a recompensa (R), como é o exemplo acima do Bem Comum. Quando um cooperador joga com um adversário desertor, o resultado é a estratégia sugadora (S). Quando um desertor joga com um adversário cooperador o resultado é a tentação (T). Quando um desertor joga contra um adversário também desertor o resultado é sempre a punição (P). Estes diferentes resultados estão resumidos na tabela 2:

Tabela 2: resultados das diferentes estratégias da teoria dos jogos em díades de relações.

Axelrod & Hamilton (1981), utilizando esta teoria, simularam em computador sequências de jogadas com variadas estratégias, e foram somando os diversos resultados, até obter a estratégia “tit for tat” (TFT) ou “olho por olho”, que foi a estratégia com mais pontos ao final de muitas rodadas. Toda vez que um TFT jogava com um TFT ambos iniciavam cooperando (um TFT sempre deve iniciar cooperando). Ao final da rodada, ambos obtêm recompensa enquanto resultado. Em N jogadas (número indefinido de jogadas) ocorre um cumulativo de R (recompensas) de N; Se TFT encontra um desertor puro (ALL-D) sofre no primeiro encontro, mas ganha o mesmo que ALL-D nas demais interações: punição. Isso porque TFT inicia cooperando, mas acaba desertando (olho por olho) a partir da segunda rodada, e ambos obtêm como resultado um cumulativo de P (punição).

Em uma população de TFT, ALL-D não poderá invadir se RN > T + P; ou seja, um desertor puro não poderá invadir uma população se o número de jogadas das díades de interações com recompensa for maior do que a tentação mais a punição. Portanto, se você não sabe quantas vezes vai interagir com outra pessoa (a gente nunca sabe de fato), a cooperação terá maior probabilidade de apresentar um cumulativo de R (recompensa).

No entanto, tanto TFT quanto ALL-D poderão persistir se a população não for espacialmente e geograficamente estruturada. Isso foi erroneamente importante nos manuais de criminologia do século XIX, onde uma descrição do fenótipo e características de um criminoso correspondia ao de um marinheiro daquele período (tatuagens, pelos abundantes pelo corpo – provavelmente de origem mediterrânea muitos deles). Uma obra fantástica sobre o assunto é a Falsa Medida do Homem (1991), de Stephen Jay Gold.

Em populações espacialmente estruturadas, como exemplo, uma comunidade escolar, a estratégia TFT, enquanto cooperadores entre si nas díades de relações, sempre será a melhor estratégia em N rodadas; cooperar é a melhor estratégia nesses casos. Isso talvez explique o motivo pelo qual alunos que trocam com frequência de escola como elucidado na Teoria do Desconto do Futuro, sempre tendem a aceitar um valor menor agora do que um valor maior no futuro, pois o futuro se apresenta de forma mais incerta para eles (Wilson e Daly, 2006).

O problema da confusão (erro na avaliação): em muitas situações o blefe e a deserção surgem como um erro de avaliação. Muitos podem blefar não por serem desertores puros, mas por um erro de comportamento, e levar o outro competidor a blefar também nas futuras relações. Então que, ser rigorosamente TFT apresenta uma maior probabilidade de confusão nas relações das díades.

Surge a estratégia TFT2 que não é provocada a desertar por uma confusão; esta estratégia é a estratégia da tolerância, que vê no competidor o erro e aceita que numa futura relação o mesmo não irá repetir o erro. Há perda em uma dada rodada para o jogador, mas após o erro, o adversário, revendo suas posições, pode novamente fortalecer a confiança e o resultado se mantém como o esperado, um cumulativo de R. Particularmente importante nos momentos de polarização de ideias e extremismos, a estratégia TFT2 será um bom encaminhamento em momentos de crise, por exemplo.

Na estratégia “PAVLOV” – o jogador muda seu comportamento após uma pequena perda (P ou S), repete o comportamento após receber T ou R, mas inicialmente sempre coopera. PAVLOV pode explorar continuamente um ALL-C. Embora PAVLOV se saia melhor que TFT em um mundo imperfeito, empobrece em uma população de ALL-D, pois ao mudar o comportamento de acordo com o adversário acabará tendo um cumulativo de punição e sugação de recursos.

Implicações do modelo: “Tit For Tat” será bem sucedido apenas se houver um número irrestrito de jogadas, se houver apenas uma rodada, ALL-D sempre levará vantagem. Infelizmente, em um mundo imperfeito, o blefe apresenta vantagens quando a população é muito fluida e desestruturada espacial e temporalmente.

Conclusões:

Este modelo preditivo deve levar em conta se a população é estruturada espacial e temporalmente, ou se a mesma é muito fluida e não existe estabilidade nas relações e díades de interação. Um exemplo interessante são as cidades que recebem sazonalmente turistas. Como a população é flutuante no período de alta temporada, é mais provável o blefe, pois os indivíduos não jogarão muitas vezes com os outros, aumentando sua chance de trapaças. Quando vivemos em uma pequena cidade ou vila, os blefes e trapaças constituem estratégias pouco valiosas, pois em breve os vizinhos estarão comentando que fulano trapaceou aqui e ali, não pagou a conta aqui e ali, e logo o trapaceiro poderá ser isolado da comunidade tendo que migrar ou mudar de comportamento. A punição ao blefe em muitas populações costuma ser o isolamento ou até banir o trapaceiro. Desta maneira, nas escolas e nas comunidades em que crianças estão imersas, e de onde não é possível nem desejável banir o sujeito das relações, o blefe pode ser facilmente desestimulado pela lógica da cooperação, e pessoas mal intencionadas não poderão invadir o espaço. O mesmo deverá ser pensado nas díades de relações no trabalho ou na comunidade onde ocupamos papéis de liderança.

Nosso mundo está cada dia mais conectado e globalizado, por meio de recursos tecnológicos, poderemos alcançar essa estruturação espacial e temporal de nossa população no nível planetário. Uma sociedade com regras simples em um sistema computacional, regras básicas construídas de forma democrática, substituindo nossos falhos e perversos sistemas políticos e econômicos, poderia facilmente organizar sistemas de cooperação com díades de relações cujos indivíduos envolvidos estivessem em qualquer lugar e onde uma única interação não beneficiaria o blefe.

Heylighen (1992) afirma que quando existem mudanças nos indivíduos que participam das díades (ultrassociedades), essas relações podem ser amplificadas até formar a base para as grandes organizações coletivas, e surge desta forma o pensamento moral. Indivíduos fora deste pensamento podem ser isolados do grupo ou até mortos. O moralismo é mais estável que o altruísmo puro e simples e a desvantagem do moralismo é que encoraja a hipocrisia, que é dizer-se altruísta e parecer como tal, mas de fato ser egoísta. A função do moralismo seria manter o sistema de cooperação constantemente mudando. Uma sociedade com muitas leis apenas reflete o elevado grau de hipocrisia de seus indivíduos. Quando os indivíduos são regulados por uma moral externa perniciosa, como a moral de mercado, religiosa, ou dos sistemas políticos, que não diferencia os meios dos fins, ou ainda, em sociedades autoritárias, cuja moral do estado é muito rigorosa, os indivíduos apresentam pouco espaço ou estimulação para gerar criativamente sua ética. A moral enquanto conjunto de valores e crenças de uma sociedade, se rígida, pode diminuir a ética, essa última enquanto o conjunto de valores e crenças constitutivas do indivíduo e a partir do qual ele se insere em um grupo (Bauman, 2011).

Cooperar, em um mundo onde cada um tenha o desejo de boas relações, é matematicamente, a melhor saída, em especial nos momentos de crise, de extremismos de ideias e de rupturas institucionais.

Bibliografia:

AXELROD, R.; HAMILTON, W.D. The evolution of cooperation. Science. 211, p. 1390-1396, 1981.

BRONOWSKI, J. A escalada do homem. 3. ed. São Paulo: Martins Fontes. 1992.

BAUMAN, Z. Vida em fragmentos – sobre a ética pós-moderna. Rio de Janeiro: Jorge Zahar Editor, 2011.

GOULD, S.J. A falsa medida do homem.São Paulo: Martins Fontes, 1991.

HEYLIGHEN, F. Evolution, Selfish and Cooperation. Journal of Ideas. 1992.

MAYNARD-SMITH, J. Evolution and the theory of games. Cambridge: Cambridge University Press. 1982.

WILSON, M., DALY, M. Are juvenile offenders extreme future discounters? Psychological Science. 17(11):989-994, 2006.