Menu

Reuniao 3

Daniela Maria Uez

Reunião do dia 30/05/2012

Problemas

  • O comando parry (defesa de ataque) tem apresentado falhas ao bloquear ataques adversários. Acontece raramente mas pode ser um bug.

  • Quando um time dominou todo o mapa, cada agente recebe todas as informações do mapa (vértices + arestas - passam a ser crenças de cada agente). Isso causa lentidão no processamento das crenças (devido à quantidade de crenças recebidas). Provavelmente é um bug do cenário. Mas pode-se resolver isso incluindo-se filtros de percepções nos agentes - por exemplo, cada agente percebe só o que é importante de acordo com o seu papel.

    • Deve-se verificar o algoritmos de BUF (Belief Update Function) para incluir o filtro de percepções.
  • Mesmo que o agente esteja vendo diversas arestas, o comando survey só afeta as arestas que são vizinhas ao agente.

  • Para descobrir o melhor lugar do mapa, ao invés de considerar somente os pesos dos vértices vizinhos ao vértice atual, opto-se por utilizar um algoritmo um pouco diferente:

    1. Considera-se o vértice atual + os vizinhos que tenham o mesmo valor que este como sendo um vértice único.
    2. Verifica-se se os vizinhos deste novo vértice já foram visitados ou se têm valor maior do que este. Caso todos tenham sido visitados e tenham valor menor que este, sabe-se que o vértice atual está no melhor lugar do mapa.

Estratégias

  • Problema 1: um explorador se encontra num vértice de valor x, na melhor zona do mapa. No vértice seguinte, também de valor x e que ainda não foi visitado, se encontra um sabotador inimigo. O que fazer?

    • Se um sabotador "amigo" estiver num vértice próximo, chama o sabotador.
    • Se não, o explorador vai até o vértice não visitado mesmo que o sabotador inimigo acabe por "matar" o explorador.
  • Problema 2: Se todos os vértices vizinhos àquele no qual o agente se encontra têm o mesmo peso e são não visitados, o agente vai escolher aleatoriamente o vértice a visitar. Dessa forma, pode ser que um vértice fique sem ser visitado. Pode-se resolver esse problemas utilizando objetivos de longo prazo. Por ex: O agente planeja que no passo i (ou daqui a i passos) pretende estar na posição(x,y). Para isso:

    • O agente pode guardar uma crença com o objetivo
    • Pode-se utilizar uma intenção. Essa forma exige que uma ação só seja continuada no step seguinte ao da ação atual (precisa sincronizar ações!!).
      Por exemplo, o agente passa a ter a intenção de executar as ações a1/a2/a3. O agente vai executar a ação a1 e somente no step seguinte vai executar a ação a2 (verificar a existência de um comando "wait next step"). Um problema dessa abordagem é a possibilidade do agente mudar de intenção entre a ação a1 e a ação a2. Para isso pode ser feita definição de prioridades (uma intenção de defender teria mais prioridade do que a ação de atacar, por exemplo). O gerenciamento de objetivos pode ser usado (quando um objetivo de maior prioridade começar a executar, desabilita um de menor prioridade)
  • ** Exploração : o explorador somente executa o comando probe e não o comando survey para agilizar a chegada ao melhor lugar do mapa. Somente o explorador pode executar o probe e o survey qualquer agente pode executar. Se executar os dois comandos, o explorador demorará mais para sair de vértice e ir para outro.

    • Pode-se enviar dois agentes juntos: o explorador (para executar o probe) e outro agente para executar o survey. Esse agente pode ser um sabotador - caso seja necessário atacar um inimigo - ou então um agente com visão maior do que a do explorador (este agente pode estar no vértice anterior e sempre vai enxergar o explorador).
  • Quando o explorador não sabe o peso da aresta, assume 10 (a princípio nenhuma aresta tem peso maior do que 10. Deve-se confirmar se esse é mesmo o peso máximo das arestas) para que sempre tenha energia suficiente para chegar até o destino.

A fazer

  • Enviar email para a lista sobre: OK
    a. Problemas no comando parry: estas falhas são normais? Devem acontecer?
    b. Os agentes estão recebendo muitas crenças quando o time domina o cenário
    c. Foi observado que a topologia do ambiente obedece à regra de ter uma única "melhor" área e a mesma estar no centro do mapa. Essa regra permanecerá ou é só uma coincidência do cenário de testes??

  • Cenários de testes:
    a. Ajustar times dos anos anteriores;
    b. Testas o R2a com os times dos anos anteriores.

  • Implementar persistência de crenças Em andamento

  • Implementar filtro de percepções (algoritmo de BUF) Em andamento

  • Estudar/implementar objetivos de longo prazo Em andamento

  • Pensar em estratégias de exploitação OK

  • Pensar em estratégias de reparação OK

  • Buscar as informações: OK

    • Existe um peso máximo para as arestas?
    • Qualquer agente pode comprar visão?

MongoDB Logo MongoDB