Documento de trabalho sobre a teoria dos jogos | Tomada de decisão | Economia

Aqui está um artigo sobre a 'Teoria dos Jogos' para as classes 9, 10, 11 e 12. Encontre parágrafos, artigos de longo e curto prazo sobre a 'Teoria dos Jogos' especialmente escritos para estudantes de escolas e faculdades.

Trabalho de Conclusão de Curso sobre a Teoria dos Jogos


Conteúdo do trabalho:

  1. Trabalho de Conclusão de Curso sobre Introdução à Teoria dos Jogos
  2. Documento sobre o dilema do prisioneiro: uma estratégia dominante
  3. Documento de trabalho sobre o paradoxo de Bertrand
  4. Documento de trabalho sobre as dimensões intertemporais
  5. Documento de trabalho sobre o teorema popular


1. Trabalho de Conclusão de Curso sobre Introdução à Teoria dos Jogos :

A teoria dos jogos é amplamente utilizada em diferentes disciplinas. O uso da teoria dos jogos está aumentando dia após dia devido à complexidade dos ganhos econômicos. Em matemática, a teoria dos jogos é usada para explicar a relação entre as variáveis. A árvore de decisão é derivada para entender os ganhos de qualquer jogo. A teoria dos jogos é de indivíduos, grupos, empresas. Todo indivíduo é um agente econômico por natureza. Em todos os pontos do jogo, o indivíduo espera alguns ganhos econômicos decorrentes de diferentes ações.

Os agentes ou empresa obtêm o benefício de avançar, conspirar ou discordar da parte oposta no jogo. Benefício igual para ambas as partes é o equilíbrio de Nash. Pode ser explicado de maneira diferente da seguinte maneira. A teoria dos jogos é uma teoria da tomada de decisões sob condições de incerteza e interdependência. Na teoria dos jogos, o comportamento humano é estudado em situação estratégica e um modo matemático é capturado. Um jogo estratégico consiste em um conjunto de jogadores, que pode ser um grupo de nós ou um nó individual.

Um conjunto de ações para cada jogador para tomar uma decisão e preferências sobre o conjunto de perfis de ação para cada jogador. Em qualquer jogo, o utilitário representa a motivação dos jogadores. Aplicações da teoria dos jogos sempre tentam encontrar equilíbrios. Se houver um conjunto de estratégias com a propriedade de que nenhum jogador pode obter lucro alterando sua estratégia enquanto os outros jogadores mantêm suas estratégias inalteradas, esse conjunto de estratégias e os correspondentes retornos constituem o equilíbrio de Nash.


2. Documento sobre o dilema do prisioneiro: uma estratégia dominante :

O dilema dos prisioneiros é geralmente definido entre dois jogadores. A Teoria dos Jogos assume que os dois jogadores agem racionalmente. Investigações realistas do comportamento coletivo, no entanto, exigem um modelo de jogo para várias pessoas, que serve como uma formulação matemática do que há de errado na sociedade humana. O estudo pode levar a uma melhor compreensão dos fatores que estimulam ou inibem o comportamento cooperativo nos sistemas sociais. Recapitula características fundamentais para quase todas as relações sociais. Vários aspectos do dilema de prisioneiros para várias pessoas foram investigados na literatura.

O dilema do prisioneiro fornece a estratégia dominante. A estratégia dominante é importante para estudar a estratégia do jogador. É uma estratégia dominante em termos da estratégia do outro jogador. Para o efeito, usamos a notação; S-Smita é a combinação de estratégias de todos os jogadores, exceto o jogador Smita. A melhor resposta do Player i ou a melhor resposta às estratégias Si, escolhidas pelos outros jogadores. Ao mesmo tempo, s * i é a melhor estratégia escolhida pelo i-ésimo jogador que lhe rende a maior recompensa.

Está escrito da seguinte maneira:

A notação acima explica que a melhor estratégia (s * i) tem maior ganho. O indivíduo escolhe as melhores estratégias que são estratégias dominantes. Portanto, as estratégias dominantes são as estratégias de equilíbrio. Tais estratégias de equilíbrio são a melhor resposta para outro jogador. A estratégia dominante não existe no jogo do bem-estar. No jogo do bem-estar, não há estratégias dominantes. Os jogadores elaboram outras ações como as melhores estratégias. Os programas de bem-estar do governo incluem o NREGA na Índia. O trabalho sancionado no âmbito deste programa é proporcionar os benefícios às pessoas pobres da zona rural.

O dilema do prisioneiro é baseado em certas suposições:

1. O dilema dos prisioneiros é um jogo para duas pessoas. Há muitas pessoas interagindo umas com as outras.

2. Assumimos que não há comunicação entre os dois presos. Se eles se comunicarem e se comprometerem a coordenar, o resultado será diferente.

No dilema dos prisioneiros, dois prisioneiros interagem apenas uma vez. Suponhamos que Smita e Deepa sejam as prisões. Se os dois cometeram o crime e foram pegos pela polícia, então eles têm várias estratégias. Se Smita e Deepa confessarem, cada um será condenado a dez anos de prisão. Mas eles têm a opção de confessar e negar. Smita e Deepa negam seu envolvimento no crime, então ambos são condenados a dois anos de prisão. Aqui há chance de aplicar o dilema do prisioneiro.

Se Smita confessar, ela seria libertada. Ao mesmo tempo, Deepa seria condenado por 15 anos de prisão. O dilema do prisioneiro é de dois a dois jogos. Isso ocorre porque dois jogadores jogam duas ações diferentes e ambos tentam obter mais benefícios de sua decisão. Ambos têm estratégias diferentes como confessar, negar etc.

Smita e Deepa têm sua própria estratégia dominante. Deepa não sabe que ação é escolhida por Smita. Se Deepa escolher a ação negar, Smita enfrenta a negação do pagamento e, se ela confessar, enfrentará o pagamento 0. Suponha que Deepa escolha confessar, ela enfrentará o pagamento por Smita de 15. Suponha que ela confesse que o pagamento é 10. No exemplo acima Deepa não se sai melhor confessando. Ela recebe 0 recompensas. A estratégia dominante no exemplo acima é confessada, confessada. A recompensa de equilíbrio para ambos os jogadores é (10, 10). Mas Deepa e Smita negam, então eles recebem (2, 2) os mesmos frutos.

Se o equilíbrio é uma estratégia dominante, o conjunto de informações não importa. Suponha que Deepa possa confessar ou negar, e então Smita se moverá antes de tomar a decisão inalterada. O dilema do prisioneiro é útil em várias teorias econômicas. É usado em preços de oligopólio, licitações, esforços de vendedores, negociações políticas e corridas de armas. Teoria e exemplos de jogos não são realistas para muitos estudiosos. Eles não encontram esse tipo de incidência. Às vezes, pensar em termos da teoria dos jogos também é importante.

Precisamos entender estratégias e jogadores em diferentes pontos. Uma observação comum em experimentos envolvendo repetição finita do dilema dos prisioneiros é que os jogadores nem sempre jogam as estratégias dominantes de período único (finking), mas obtêm alguma medida de cooperação. No entanto, em cada estágio é o único equilíbrio de Nash no jogo finitamente repetido.

Mostramos aqui como informações incompletas sobre as opções, motivação ou comportamento de um ou de ambos os jogadores podem explicar a cooperação observada. Especificamente, nós fornecemos um limite para o número de rodadas em que o Fink pode ser jogado, quando um jogador pode estar comprometido com uma estratégia de "teta-por-tato".

Tipos de jogos :

Existem diferentes tipos de jogos na teoria dos jogos. Os jogos cooperativos, não cooperativos, de bem-estar, estratégia dominante e estratégias repetidas são jogos mais úteis e precisamos entender o comportamento dos agentes.

Jogo cooperativo e não cooperativo :

No jogo cooperativo, os jogadores podem se comprometer. Às vezes eles vão além desse compromisso. É o oposto no jogo não cooperativo. No jogo não cooperativo, os jogadores não são vinculativos por seus compromissos. Todos os jogos na forma cooperativa são baseados no princípio da otimização, justiça e equidade de Pareto. A maioria dos jogos não cooperativos é de natureza econômica. Os jogadores estão maximizando sua utilidade, sujeito a restrições declaradas. A teoria dos jogos cooperativos concentra-se nas propriedades do resultado e não nas estratégias.

Tais estratégias costumam ser alcançadas pelo resultado. O jogo cooperativo é usado para modelar a negociação na microeconomia aplicada. Esse jogo é mais apropriado que o jogo não cooperativo. O dilema dos prisioneiros é um jogo não cooperativo. Esse modelo pode ser permitido para os jogadores não apenas se comprometerem, mas também fazerem restrições vinculativas. Jogos cooperativos geralmente permitem que os jogadores dividam os ganhos dos jogos cooperativos. Geralmente, os jogadores podem dividir os ganhos da cooperativa fazendo pagamentos paralelos.

Há um exemplo a seguir, que mostra os diferentes tipos de jogos:

Eu. Um jogo cooperativo sem conflito:

Os membros de uma força de trabalho escolhem tarefas igualmente pesadas para realizar a melhor coordenação entre si. É trabalhada a unidade na força de trabalho, mesmo tendo estratégias diversas.

ii. Jogo cooperativo com conflito:

O jogo em que a força de trabalho tem estratégias diferentes, mas estratégias comuns são encontradas e verifica-se que existe cooperação entre elas.

iii. Um jogo não cooperativo com conflito:

O dilema dos prisioneiros é o melhor exemplo. Aqui, dois jogadores têm estratégias diferentes. Tais estratégias permanecem independentes uma da outra.

iv. Um jogo não cooperativo sem conflito:

Duas empresas estabelecem um padrão de produto sem comunicação entre si.

Domínio Repetido: A Batalha do Mar Bismark :

Significa uma combinação de estratégia encontrada ao excluir uma estratégia dominante fraca da estratégia alternativa. Um dos jogadores recalcula para descobrir qual estratégia restante está dominada fracamente. Excluir um deles e continuar o processo até restar apenas uma estratégia para cada jogador.

Quando as pessoas interagem com o tempo, ameaças e promessas relativas a comportamentos futuros podem influenciar o comportamento atual. Os jogos repetidos capturam esse fato da vida e, portanto, foram aplicados de maneira mais ampla do que qualquer modelo da teoria dos jogos, não apenas em praticamente todos os campos da economia, mas também em finanças, direito, marketing, ciência política e sociologia.

Demos o exemplo da batalha do mar de Bismarck. A batalha do mar de Bismarck é um exemplo dado nas repetidas estratégias de dominância. É um cenário no Pacífico Sul em 1943. O General Imamura recebeu ordens de transportar tropas japonesas através do Mar Bismarck para a Nova Guiné.

Mas o general Kenney quer bombardear o transporte de tropas. É a sua estratégia e escolhido neste momento. Para fazer isso, Imamura deve escolher entre uma rota mais curta do norte para uma rota mais longa do sul para o novo Guineo e Kenney deve decidir para onde enviar seus aviões para procurar japoneses. Agora, existem estratégias alternativas planejadas. Suponha que Kenny coloque seus aviões em série na rota errada, ele possa lembrá-los, mas o número de dias de bombardeios é reduzido.

No exemplo, os jogadores são Kenney e Imamura e cada um tem o mesmo conjunto de ações {Norte, Sul}. Suas recompensas nunca são as mesmas. Imamura perde exatamente o que Kenney ganha.

Esse jogo é apresentado da seguinte forma:

No jogo acima, nem Kenney nem Imamura têm uma estratégia dominante. Kenney escolheria o norte se pensasse que Imamura escolheria o norte. Mas no sul, se ele pensava que Imamura escolheria o norte. Há um dilema político enfrentado por ambos os atores. Suponha que ele pensasse que Kenney escolheria o sul e ficaria indiferente entre as ações se pensasse que Kenney escolheria o norte. Mas podemos encontrar um equilíbrio razoável, provável e plausível, usando o conceito de domínio fraco.

Suponha que a estratégia S i seja fracamente dominada e que exista alguma outra estratégia S * i para os jogadores i. É possível obter melhor retorno em alguma combinação de estratégia. Nunca produz um pagamento menor. Matematicamente, S ' i é fracamente dominado se existir S ” i tal que

Pode-se definir um equilíbrio fraco da estratégia dominante, o perfil da estratégia encontrado ao excluir todas as estratégias fracamente dominadas de cada jogador. Estratégias fracamente dominadas não ajudam muito na Batalha do Mar Bismarck. No entanto, a estratégia do Sul de Imamura é fracamente dominada pela estratégia do Norte, porque sua recompensa do Norte nunca é menor do que sua recompensa do Sul. É maior se Kenney escolher o sul. Para Kenney, no entanto, nenhuma das estratégias é sequer fracamente dominada.

Kenney decide que Imamura escolherá o Norte e isso ocorre porque é fracamente dominante. Portanto, Kenney o elimina. Imamura escolhe o Sul de considerar essas opções. Tendo excluído a coluna da tabela, Kenney tem uma forte estratégia dominante: ele escolhe o Norte, que obtém recompensas estritamente maiores que o sul. A combinação de estratégias (Norte, Norte) é um equilíbrio dominante iterado e, de fato (Norte, Norte), foi o resultado em 1943.

Se Imamura se movesse primeiro (norte, norte), esse seria o único equilíbrio importante para um jogador. Isso ocorre porque ele está se movendo primeiro e isso dá ao outro jogador mais informações antes de ele agir. Suponha que Kenney tenha decifrado o código japonês e encontrado o plano de Imamura, pois há vazamento de informações e os dois jogadores podem se mover simultaneamente. A Batalha do Mar Bismarck é especial porque os pagamentos dos jogadores sempre somam zero. Esse recurso é importante o suficiente para merecer um nome.

Um jogo de soma zero:

Um jogo de soma zero é um jogo em que a soma dos pagamentos de todos os jogadores é zero, independentemente da estratégia escolhida. Se o jogo não for zero, então é soma variável. Em um jogo de soma zero, o que um jogador ganha outro jogador deve perder. A partir do exemplo acima, a estratégia de dominância repetida: a Batalha do Mar Bismarck é um exemplo de jogo de soma zero. Mas o jogo Dilema do Prisioneiro não é um exemplo desse jogo. Não é possível alterar os pagamentos e fazer o jogo de soma zero. Para isso, é necessário alterar o caráter essencial dos jogos.

Equilíbrio de Nash :

O equilíbrio de Nash é o conceito de equilíbrio padrão na microeconomia moderna. É um conceito amplamente utilizado em vários modelos microeconômicos. Suponha que o modelo não assuma um conceito de equilíbrio específico, mas é usado então como Nash ou algum refinamento do equilíbrio de Nash. O equilíbrio de Nash é um certo tipo de equilíbrio de expectativas racionais. O equilíbrio de Nash é uma situação em que cada jogador escolhe uma estratégia ideal, dada a estratégia escolhida pelo outro jogador.

No equilíbrio de Nash, a escolha da estratégia de cada jogador é a melhor resposta à escolha da estratégia. É a melhor resposta às estratégias realmente jogadas por seus rivais. A combinação de estratégia S * é um equilíbrio de Nash. Suponha que o jogador não tenha incentivo para se desviar de sua estratégia, então ele tem incentivo para se desviar de sua estratégia, uma vez que os outros jogadores não se desviam.

Suponhamos que uma criança e um adulto sejam convidados a ficar na caixa com um painel especial em uma extremidade e um dispensador de alimentos na outra. A pessoa adulta tem uma forte estratégia dominante para obter a comida, enquanto a criança tem uma fraca estratégia dominante. Suponha que o adulto chegue ao dispensador primeiro e, em seguida, a criança receberá apenas sua partida no valor de 1 unidade. Suponha que uma criança chegue primeiro, coma mais unidades de alimento e, se os dois chegarem ao mesmo tempo, obterá menos unidades de alimento.

Os colchetes acima não mostram um equilíbrio estratégico dominante. É porque o adulto escolherá depende do que ele acha que a criança escolherá. Suponha que o adulto acredite que a criança pressione o painel. O adulto aguardará no distribuidor. Mas os adultos acreditam que a criança esperaria e depois pressionaria. Existe um equilíbrio de dominância iterado (pressione, espere).

Usaremos uma linha de raciocínio diferente para justificar esses resultados. O exemplo acima mostra que a combinação de estratégia (pressione, espere) é um equilíbrio de Nash. A maneira de abordar o equilíbrio de Nash é propor uma combinação de estratégia. É necessário testar o clima de cada jogador, a melhor resposta à estratégia dos outros.

Suponha que o adulto escolha pressionar e a criança enfrente a escolha entre o retorno 2 da pressão e 8 da espera. Ao mesmo tempo, se o adulto estiver disposto a esperar e a criança escolher esperar, o adulto poderá escolher entre um pagamento de 8 ao pressionar e 0 de esperar. Isso confirma que a espera da imprensa é o equilíbrio de Nash e, de fato, é o único equilíbrio de Nash.

Esse equilíbrio de Nash é fraco ou forte. O fraco equilíbrio de Nash é uma desigualdade estrita. É necessário que nenhum jogador seja indiferente entre sua estratégia de equilíbrio e alguma outra estratégia. Toda estratégia dominante é o equilíbrio de Nash, mas nem toda estratégia dominante de equilíbrio de Nash é o equilíbrio. Suponha que a estratégia seja dominante e, em seguida, seja a melhor resposta a qualquer estratégia escolhida pelos outros jogadores. Inclui sua estratégia de equilíbrio. Se uma estratégia faz parte do equilíbrio de Nash, precisa apenas de uma melhor resposta para os outros jogadores.


3. Documento de trabalho sobre o paradoxo de Bertrand:

O paradoxo de Bertrand foi desenvolvido em 1883. É uma extensão do modelo de Cournot. O modelo de paradoxo de Bertrand é baseado em suposições e elas são explicadas a seguir.

Suposição:

(i) Duas empresas produzem bens idênticos que são "não diferenciados". Tais bens são substitutos perfeitos na função de utilidade do consumidor.

(ii) Os consumidores compram do produtor que cobra o preço mais baixo.

(iii) Cada empresa enfrenta um cronograma de demanda que é igual a metade da demanda do mercado a preços comuns.

(iv) As empresas sempre fornecem commodities conforme a demanda que enfrentam.

A função de demanda do mercado é q = D (p)

Cada empresa incorre em um custo c por unidade de produção. O lucro da empresa i é

Onde, a demanda de produção da empresa i é denotada Di. É dado por

O lucro agregado é definido como

Esse lucro agregado não pode exceder o lucro do monopólio

Cada empresa pode garantir um lucro não negativo. É possível cobrando um preço acima do custo marginal. Portanto, os lucros da empresa são explicados como

A empresa escolhe seus preços simultaneamente e não cooperativamente. Um equilíbrio de Nash nos preços, às vezes chamado de equilíbrio de Bertrand. É um par de preços (P * 1, P * 2 ). O preço de cada empresa maximiza o lucro da empresa, dado o preço das outras empresas. Formalmente, para todos os i = 1, 2 e

Para todos os p i

O paradoxo de Bertrand (1883) afirma que o equilíbrio único e duas empresas cobram o preço competitivo.

A prova é a seguinte

Considere por exemplo

A empresa não tem demanda e seu lucro é zero. Por outro lado, se a empresa cobra

Agora ε é positivo e pequeno. Ele obtém toda a demanda do mercado, D (P2 * - ε) e possui uma margem de lucro positiva de

Portanto, a empresa não pode estar agindo em seu próprio interesse se cobrar P 1 *.

Agora suponha que

Então o lucro da empresa é

Se a empresa reduz seu preço ligeiramente para P1 * ε ε, seu lucro se torna

É maior para pequenas. Na situação acima, a participação de mercado da empresa aumenta de maneira descontínua. Isso ocorre porque nenhuma empresa cobrará menos do que o custo unitário C. A empresa de menor preço geraria um lucro negativo. Ficamos com uma ou duas empresas cobrando exatamente c. Para mostrar que ambas as empresas cobram c. Suponha

A empresa dois, que não tem lucro e poderia aumentar um pouco o preço. Mas ainda assim pode suprir toda a demanda e obter um lucro positivo - uma contradição.

A conclusão deste modelo simples é a seguinte. Escrevemos em pontos:

Eu. O preço dessa empresa tem um custo marginal.

ii. Que as empresas não lucram

Chamamos essas duas situações de Bertrand Paradox, porque é difícil acreditar que as empresas de indústrias nunca conseguem manipular.

Preço de mercado para obter lucros:

Em um caso simétrico, as conclusões I e II não se sustentam; de fato, o seguinte pode ser mostrado:

Eu. Que ambas as empresas cobram preço p = c2, e

ii. Essa empresa 1 obtém lucro de (c 2 -c 1 ) D (c 2 ) e a empresa 2 não obtém lucro.

Assim, a empresa 1 cobra acima do custo marginal e obtém um lucro positivo. O equilíbrio de Bertrand não é mais ideal para o bem-estar. Mas, novamente, a conclusão é um pouco tensa que uma empresa obtém muito pouco lucro se C2 estiver próximo de c1 e a empresa dois não obtém lucro algum.

Solução para o Bertrand Paradox:

No modelo acima, fizemos três suposições cruciais. Agora, para provar o paradoxo de Bertrand, precisamos relaxar uma suposição das suposições acima.

A solução Edge Worth:

O valor de Edge resolveu o paradoxo de Bertrand em 1897. Ele resolveu o paradoxo de Bertrand introduzindo restrições de capacidade pelas quais as empresas não podem vender mais do que são capazes de produzir. Para entender essa idéia, suponha que a empresa 1 tenha uma capacidade de produção menor que D (c.) O equilíbrio é (P i *, P 2 *) = (c, c). Ainda é um sistema de preços de equilíbrio. A esse preço, ambas as empresas obtêm lucro zero.

Suponha que a empresa dois aumente seu preço levemente, e então a empresa enfrenta a demanda D (c), mas não pode satisfazer. A maneira racional é que alguns consumidores devem passar para a empresa dois. A empresa dois tem uma demanda diferente de zero. Como o preço é superior ao seu custo marginal, gera lucro positivo. Consequentemente, a solução Bertrand não é um equilíbrio de longo prazo. A regra geral é que, nos modelos com restrições de capacidade, as empresas obtêm lucro positivo. O preço de mercado é superior ao custo marginal.


4. Documento de trabalho sobre as dimensões intertemporais:

A segunda suposição crucial no modelo acima é que um jogo de tiro. Nem sempre parece refletir a realidade econômica como está. Na solução de Bertrand, o equilíbrio é P1 = P2> C. Mas não é um equilíbrio real no modelo.

A resposta é que uma empresa, por exemplo, poderia se beneficiar de uma ligeira queda no seu preço (isto é, para P ⎯ õ) e de sua resultante aquisição de todo o mercado. Nada acontece depois disso por causa da suposição crucial de Bertrand de um jogo curto. Na realidade, a empresa dois provavelmente diminuiria seu preço para recuperar sua participação no mercado. Se introduzirmos essa dimensão temporal e a possibilidade de reação, não está mais claro que a empresa se beneficiaria da redução de seu preço abaixo de P2.

A empresa teria que comparar o ganho de curto prazo (o aumento de sua participação no mercado) com a perda de longo prazo na guerra de preços.

Sub-jogo Perfeição:

O perfeito equilíbrio de seguir o líder I:

A perfeição do subjogo é um conceito de equilíbrio baseado na ordem dos movimentos e na distinção entre um caminho de equilíbrio e equilíbrio. O caminho do equilíbrio é o caminho através da árvore do jogo que é seguido em equilíbrio, mas o próprio equilíbrio é uma combinação de estratégia. Inclui as respostas do jogador aos desvios do outro jogador em relação ao equilíbrio.

A perfeição do caminho é uma maneira de eliminar parte do fraco equilíbrio de Nash. Um fluxo de equilíbrio de Nash foi revelado no jogo, siga o líder I, que tem três estratégias puras. O equilíbrio de Nash é uma das estratégias razoáveis. Os jogadores são Smita e Deepa, que escolhem tamanhos de disco.

Ambos os pagamentos são maiores se escolherem o mesmo tamanho e maiores se coordenarem no tamanho Grande. Smita se move primeiro para que sua estratégia se torne mais complicada. Embora ela deva especificar uma ação para cada conjunto de informações, o conjunto de informações de Deepa depende do que Smita escolher. O conjunto de estratégias da Deepa é grande e pequeno. Especifica que ela escolhe grande se smita escolhe grande. Ela escolhe pequeno se Smita escolher pequeno.

Encontramos os seguintes três equilíbrios de Nash:

A partir dos resultados acima, o equilíbrio Y é uma estratégia razoável para ambos os jogadores. Isso ocorre porque a ordem dos movimentos deve ser importante para os jogadores da decisão. O problema com a forma normal e, portanto, com o simples equilíbrio de Nash é que ela ignora quem se move primeiro. Smita se move primeiro e parece razoável que Deepa seja permitido. De fato, ela deveria repensar sua estratégia após os movimentos de Smita.

Agora considere a estratégia Z de equilíbrio de Deepa de Pequeno, Pequeno. Se Smita se desviasse do equilíbrio e ela estivesse escolhendo grandes, não seria razoável que Deepa se atenha à resposta das grandes. Ela realmente escolheria grande e Z não seria equilíbrio. Um caso semelhante mostra que (Grande, Grande) é uma estratégia irracional para Deepa e ficamos com Y como o equilíbrio único. Dizemos que o equilíbrio X e Z são o equilíbrio de Nash. Mas eles não são o equilíbrio "perfeito" de Nash.

Uma combinação de estratégia é um equilíbrio perfeito se permanecer em todos os caminhos possíveis, tanto no caminho de equilíbrio quanto em seus caminhos, que se ramificam em diferentes sub-jogos. Um sub-jogo é um jogo que consiste em um nó que é um singleton em todas as partições de informações do jogador que nós sucessores. Uma combinação de estratégia é um equilíbrio perfeito de Nash no sub-jogo se (a) é o equilíbrio de Nash para todo o jogo e (b) suas regras de ação relevantes são o equilíbrio de Nash para todos os sub-jogos.

A forma extensa de seguir o Leader I tem três sub-jogos:

(i) O jogo inteiro

(ii) O sub-jogo começando no nó B1

(iii) O sub-jogo que está começando no nó B2

A combinação de estratégia x não é um equilíbrio perfeito do sub-jogo, porque é apenas Nash nos sub-jogos (1) e (3). Mas não é o equilíbrio de Nash no sub-jogo 2. A combinação de estratégia Z não é um equilíbrio perfeito no sub-jogo. Isso ocorre porque apenas Nash nos sub-jogos (1) e (2) não está no sub-jogo (3). Mas a combinação de estratégias Y é Nash nos três sub-jogos.

Uma razão pela qual a perfeição é um bom conceito é porque o comportamento fora de equilíbrio é irracional em um equilíbrio não perfeito. Uma segunda justificativa é que um equilíbrio fraco de Nash não é robusto a pequenas mudanças no jogo.

Um exemplo de impedimento de entrada na perfeição I:

Neste jogo, assumimos que existem dois jogadores. A primeira empresa é a nova empresa participante e a outra é a empresa sênior. A informação é perfeita e incerta.

Existem duas ações e eventos observados neste jogo:

(i) A nova empresa participante decide se deve entrar ou não

(ii) Se o participante entrar, o idoso pode conspirar com ele ou lutar cortando o preço drasticamente.

A seguir, estão as recompensas para ambos neste jogo:

Os lucros do mercado são 100 no preço de monopólio e 0 no preço de entrada custa 10 conluios compartilham os lucros igualmente.

Os conjuntos de estratégias podem ser descobertos pela ordem de ações e eventos. Eles são {entrar, ficar de fora} para o participante e {conspirar se ocorrerem entradas, lutar se ocorrerem} para a empresa sênior. O jogo tem os dois equilíbrios de Nash indicados em negrito (entrar, conspirar) e (ficar de fora, lutar). O equilíbrio (ficar de fora, lutar) é fraco porque o idoso entraria em conluio logo que o novo participante estivesse de fora.

Depois que ele escolhe entrar, a melhor resposta da empresa sênior é conivente. A ameaça de lutar não é credível e só seria empregada se o idoso pudesse se comprometer a lutar, caso em que nunca luta. É porque o novo participante escolhe ficar de fora. O equilíbrio (ficar de fora, lutar) é Nash, mas não é perfeito para o sub-jogo, porque se o jogo for iniciado após o novo participante já ter entrado no melhor dos idosos. A resposta está conspirando. Isso não prova que o conluio seja inevitável no duopólio, mas o conluio é o equilíbrio para os impedimentos de entrada-I

Suponha que exista uma comunicação eficaz entre os dois jogadores e o jogo mude. A empresa sênior pode dizer ao novo participante que a entrada seria seguida de brigas. Mas o novo participante ignoraria essa ameaça não credível. Suponha que o sénior possa se comprometer previamente a combater a entrada, a ameaça se tornaria credível. Um jogo em que um jogador pode se comprometer com uma estratégia, pode ser modelado de duas maneiras.

Em primeiro lugar, como um jogo em que o equilíbrio não perfeito é aceitável. Em segundo lugar, assumimos que, alterando o jogo para substituir a ação de ambos os jogadores. A segunda abordagem é melhor que a primeira. Isso ocorre porque geralmente o modelador deseja permitir que os jogadores se comprometam com algumas ações e não com outras. O jogador pode fazer isso especificando cuidadosamente a ordem do jogo. Permitir que o equilíbrio não seja perfeito proíbe essa discriminação e geralmente multiplica o número de equilíbrios.

A perfeição do sub-jogo é muito restritiva e ainda permite que muitas combinações de estratégias sejam equilibradas em jogos de informação assimétrica. Um sub-jogo deve começar no nó único e não deve atravessar o conjunto de informações de nenhum jogador. Muitas vezes, é o único sub-jogo que será o jogo inteiro e impor a perfeição do sub-jogo. Não restringe o equilíbrio de forma alguma.


5. Documento de trabalho sobre o teorema popular:

Faz parte da sabedoria convencional da teoria dos jogos que ameaças de punições mini-max. Ele pode sustentar qualquer alocação colusiva individualmente racional como o equilíbrio de Nash de um jogo infinitamente repetido. Jogos nos quais os jogadores se reúnem em interações estratégicas repetidamente são chamados de jogos repetidos. Não é possível atribuir autoria do resultado. É conhecido como o pior. A empresa que está sendo punida está dando sua melhor resposta à ação do punidor.

Em um jogo n-pessoa infinitamente repetido, com ação finita define a cada repetição qualquer combinação de ações observada em qualquer número finito de repetições. É o resultado único de um equilíbrio perfeito no sub-jogo.

As três condições são fornecidas e são explicadas em detalhes da seguinte maneira:

Condição 1:

A taxa de perfeição do tempo é zero ou positiva e suficientemente pequena.

Condição 2:

A probabilidade de o jogo terminar em qualquer repetição é zero ou positivo e suficientemente pequeno e

Condição 3:

O conjunto de combinações de payoffs que, estritamente Pareto, domina. As combinações de mini-max payoff na extensão mista de, o jogo curto tem n dimensões.

O teorema popular explica que um comportamento específico surge em um equilíbrio perfeito. Não faz sentido em um jogo infinitamente repetido. Isso se aplica a qualquer jogo que atenda às condições de um a três que vimos no parágrafo acima. Se uma quantidade infinita de tempo sempre permaneceu em qualquer jogo, é possível encontrar uma maneira de tornar um jogador disposto a punir outro jogador por um futuro melhor.

É ainda que a punição atualmente machuque o punidor e também o castigado. Qualquer intervalo infinito de tempo é significativo; é comparado ao infinito. A ameaça de represálias futuras torna os jogadores dispostos a cumprir as punições necessárias. É o exemplo mais prático observado na indústria.

O teorema popular emergiu como o melhor teorema da microeconomia moderna. Isso implica que em jogos repetidos quaisquer resultados são um conceito de solução viável. Sob esse resultado, as condições mini-max do jogador são satisfeitas. A condição mini-max indica que um jogador minimizará a perda máxima possível. Diz-se que um resultado é viável se satisfizer esta condição para cada jogador do jogo. UMA

jogo repetido é aquele em que não há um lance final, mas há uma sequência de rodadas. Cada jogador pode coletar informações e escolher jogadas. Em matemática, o teorema é acreditado e discutido, mas não foi publicado.

Uma estratégia de gatilho sombrio é uma estratégia que pune um oponente por qualquer desvio de um determinado comportamento. Portanto, todos os jogadores do jogo devem ter um certo resultado viável. Os jogadores precisam apenas aderir a uma estratégia de gatilho quase sombria. Qualquer desvio da estratégia trará o resultado pretendido.

É punido até certo ponto que quaisquer ganhos obtidos pelo desvio por conta do desvio sejam exatamente cancelados. Assim, não há vantagem para qualquer jogador por se desviar do percurso que trará o resultado pretendido e arbitrário. O jogo continuará exatamente da maneira de obter esse resultado.

As seguintes condições são importantes para nossa compreensão:

Condição1: Desconto:

Sabemos que, com o desconto, o ganho atual da confissão é mais pesado. Os ganhos futuros da cooperação são tomados de ânimo leve. Se a taxa de desconto é muito alta, o jogo quase volta a ser um tiro. Suppose the real interest rate is high then a payment next year is little better than a payment a hundred years later. Therefore next year is practically irrelevant.

Any model that relies on a large number of repetitions also relies on the discount rate not being too high. The alarming strategy imposes the heaviest possible punishment for prisoner's dilemma. For consumer goods the discount is given because short terms gains are more as compare to long term. There are more innovations possible in long term.

Condition 2: A Probability of the Game Ending:

Time preference is fairly straight forward. The assumption is that the game ends each period with probability Q. There are different examples where game ends with time. It does not make a drastic, difference if Q > 0. The probability of game ending is taken as one or it is put less than expected number of repetition. It is still behaving like a discounted game. This is because the expected number of future repetitions is always large. It is no matter how many have already occurred. We always believe that there is end of each game.

The following two situations are different of each other:

Eu. The game will end at some uncertain data before T. In statistics, it is assumed as T.

ii. There is a constant probability of the game ending.

iii. Under the game theory, each game is like a finite game. This is because as time passes the maximum amount of time still to run shrinks to zero, even though the game will probably end T. If it lasts until T, the game looks exactly the same as at time zero.

Condition 3: The Dimensionality Condition:

The mini-max payoff is the payoff of the result. Suppose all the other players pick strategies solely to punish players i then he protects himself as best he can. There are different methods of risk diversions. The dimensionality condition is need for games with three or more dimension. It is satisfied if for each game which has same payoff. The desired behavior requires some way to the other players to punish a deviator, without punishing themselves. It is observed in terms of different dimensions in game.


 

Deixe O Seu Comentário