jacamo-mapc Wiki

JaCaMo Team for Multiagent Programming Contest

Brought to you by: jomifred

Reuniao 3

Authors:

Reunião do dia 30/05/2012

Problemas

O comando parry (defesa de ataque) tem apresentado falhas ao bloquear ataques adversários. Acontece raramente mas pode ser um bug.
Quando um time dominou todo o mapa, cada agente recebe todas as informações do mapa (vértices + arestas - passam a ser crenças de cada agente). Isso causa lentidão no processamento das crenças (devido à quantidade de crenças recebidas). Provavelmente é um bug do cenário. Mas pode-se resolver isso incluindo-se filtros de percepções nos agentes - por exemplo, cada agente percebe só o que é importante de acordo com o seu papel.
- Deve-se verificar o algoritmos de BUF (Belief Update Function) para incluir o filtro de percepções.
Mesmo que o agente esteja vendo diversas arestas, o comando survey só afeta as arestas que são vizinhas ao agente.
Para descobrir o melhor lugar do mapa, ao invés de considerar somente os pesos dos vértices vizinhos ao vértice atual, opto-se por utilizar um algoritmo um pouco diferente:
1. Considera-se o vértice atual + os vizinhos que tenham o mesmo valor que este como sendo um vértice único.
2. Verifica-se se os vizinhos deste novo vértice já foram visitados ou se têm valor maior do que este. Caso todos tenham sido visitados e tenham valor menor que este, sabe-se que o vértice atual está no melhor lugar do mapa.

Estratégias

Problema 1: um explorador se encontra num vértice de valor x, na melhor zona do mapa. No vértice seguinte, também de valor x e que ainda não foi visitado, se encontra um sabotador inimigo. O que fazer?
- Se um sabotador "amigo" estiver num vértice próximo, chama o sabotador.
- Se não, o explorador vai até o vértice não visitado mesmo que o sabotador inimigo acabe por "matar" o explorador.
Problema 2: Se todos os vértices vizinhos àquele no qual o agente se encontra têm o mesmo peso e são não visitados, o agente vai escolher aleatoriamente o vértice a visitar. Dessa forma, pode ser que um vértice fique sem ser visitado. Pode-se resolver esse problemas utilizando objetivos de longo prazo. Por ex: O agente planeja que no passo i (ou daqui a i passos) pretende estar na posição(x,y). Para isso:
- O agente pode guardar uma crença com o objetivo
- Pode-se utilizar uma intenção. Essa forma exige que uma ação só seja continuada no step seguinte ao da ação atual (precisa sincronizar ações!!).
  Por exemplo, o agente passa a ter a intenção de executar as ações a1/a2/a3. O agente vai executar a ação a1 e somente no step seguinte vai executar a ação a2 (verificar a existência de um comando "wait next step"). Um problema dessa abordagem é a possibilidade do agente mudar de intenção entre a ação a1 e a ação a2. Para isso pode ser feita definição de prioridades (uma intenção de defender teria mais prioridade do que a ação de atacar, por exemplo). O gerenciamento de objetivos pode ser usado (quando um objetivo de maior prioridade começar a executar, desabilita um de menor prioridade)
** Exploração : o explorador somente executa o comando probe e não o comando survey para agilizar a chegada ao melhor lugar do mapa. Somente o explorador pode executar o probe e o survey qualquer agente pode executar. Se executar os dois comandos, o explorador demorará mais para sair de vértice e ir para outro.
- Pode-se enviar dois agentes juntos: o explorador (para executar o probe) e outro agente para executar o survey. Esse agente pode ser um sabotador - caso seja necessário atacar um inimigo - ou então um agente com visão maior do que a do explorador (este agente pode estar no vértice anterior e sempre vai enxergar o explorador).
Quando o explorador não sabe o peso da aresta, assume 10 (a princípio nenhuma aresta tem peso maior do que 10. Deve-se confirmar se esse é mesmo o peso máximo das arestas) para que sempre tenha energia suficiente para chegar até o destino.

A fazer

Enviar email para a lista sobre: OK
a. Problemas no comando parry: estas falhas são normais? Devem acontecer?
b. Os agentes estão recebendo muitas crenças quando o time domina o cenário
c. Foi observado que a topologia do ambiente obedece à regra de ter uma única "melhor" área e a mesma estar no centro do mapa. Essa regra permanecerá ou é só uma coincidência do cenário de testes??
Cenários de testes:
a. Ajustar times dos anos anteriores;
b. Testas o R2a com os times dos anos anteriores.
Implementar persistência de crenças Em andamento
Implementar filtro de percepções (algoritmo de BUF) Em andamento
Estudar/implementar objetivos de longo prazo Em andamento
Pensar em estratégias de exploitação OK
Pensar em estratégias de reparação OK
Buscar as informações: OK
- Existe um peso máximo para as arestas?
- Qualquer agente pode comprar visão?