Revista Avances en Sistemas e Informática, Vol. 5 ­ No.3, Diciembre de 2008, Medellín, ISSN 1657­7663  A simple method for decision making in RoboCup  soccer simulation 3D environment  Un método simple para la toma de decisiones en  ambientes 3D de simulación de fútbol RoboCup  Recibido para revisión: 30 de Septiembre de 2008, Aceptado: 28 de Noviembre de 2008, Versión final: 9 de Diciembre de 2008  Abstract—In  this  paper new  hier archical hybr id  fuzzy­crisp  methods for decision making and action  selection of an agent in  soccer simulation 3D environment are presented. First, the skills  of  an agent are introduced, implemented and classified in  two  layers, the basic­skills and the high­level skills. In the second layer,  a two­phase  mechanism for  decision making  is introduced.  In  phase one,  some useful methods are  implemented which  check  the agent’s situation for performing required skills. In the next  phase, the team  strategy, team  formation, agent’s role and  the  agent’s positioning system are introduced. A fuzzy logical approach  is  employed to recognize the team strategy and furthermore to  tell the player  the best position to  move. At  last, we  comprised  our  implemented algorithm in the  Robocup Soccer  Simulation  3D  environment  and  results  showed  the  efficiency  of  the  introduced methodology.  Keywords—Multi­Agent systems,  Machine learning, Artificial  intelligence,  Reinforcement  lear ning,  Fuzzy  Logic,  Fuzzy  reinforcement learning, RoboCup soccer  simulation.  Resumen—En este artículo se presenta un nuevo método  difuso  hibrido para la toma de decisiones y selección de acciones de un  agente en un ambiente de simulación de fútbol 3D. Primero, se  introducen, implementan y clasifican las competencias del agente  en dos  capas:  competencias  básicas  y  competencias de  nivel  superior. En la segunda capa se introduce un mecanismo de dos  fases para la toma de decisiones. En la primera fase, se aplican  algunos métodos útiles   que permiten verificar  la situación  del  agente  para la  ejecución de  las competencias requeridas. En  la  siguiente fase, se adicionan la estrategia y formación del equipo,  y el rol y sistema de posición de los agentes. Se emplea la lógica  Khashayar Niki Maleki 1 , Mohammad Hadi Valipour 1 , Roohollah Yeylaghi Ashrafi 1 , Sadegh Mokari 1 , M. R. Jamali 1,2 , Caro Lucas 2  1. Department of Electrical and Computer Engineering, Shahid Rajaee University, Tehran, Iran  2. Control and Intelligent Processing Center of Excellence, School of Electrical and Computer Engineering,  University of Tehran, Tehran, Iran  {kh.niki, m.h.valipour, r.yeylaghi, s.mokari}@sru.ac.ir, m.jamali@ece.ut.ac.ir, lucas@ut.ac.ir  I.  INTRODUCTION  R  obocup is continuing AI research initiative that uses the  game of soccer as a unifying and motivating domain [1,  2]. The  Robocup simulation  competition pits  teams  of  11  independently­controlled autonomous agents against each other  in Robocup simulator, or Soccer Server, a real­time, dynamic  environment [3]. The only Robocup soccer simulator used to  be «2D» for years, many researches in AI have performed in  that  full  challenging  environment  for  functionality of  the  developed algorithm in a multi­agent environment [4]. But as  it has been set by RoboCup Federation [RoboCup, 2004], the  ultimate goal can be expressed by several discussion. «By mid­  21st century, a team of fully autonomous humanoid robot soccer  players shall win a soccer game, complying with the official  rules of the FIFA, against the winner of the most recent world  difusa para reconocer la estrategia de equipo y además indicarle  al jugador, la mejor posición para moverse. Por último, se incluye  el algoritmo implementado en el ambiente 3D de Simulación  de  Fútbol RoboCup y los resultados que demuestran la eficiencia de  la metodología introducida.  Palabras Clave—Sistemas multi­agente, Aprendizaje de máquina,  Inteligencia artificial, Refuerzo del aprendizaje, Lógica  difusa,  Refuerzo del aprendizaje difuso, Simulación de fútbol RoboCup. Revista Avances en Sistemas e Informática, Vol. 5 ­ No. 3, Diciembre de 2008, Medellín, ISSN 1657­7663  110  cup for human players.» [Kitano & Asada, 1998] So there was a  need for a more realistic platform rather than the previous 2D  environment which is more familiar with real soccer game. That  leaded to Robocup 3D Soccer Simulator.  As the optimal scoring problem is well suited for Machine  Learning (ML)  techniques [5],  Nowadays many  powerful  methods with different roots, has been introduced in ML such  as:  neural  networks  [5],  genetic  algorithms  [6],  genetic  programming [6], fuzzy logic [7], coordination graphs [8,9]  and also many hybrid approaches as a combination of some  aforementioned ones [4] ML techniques have been applied to  a  variety  of  problems  including  data  mining,  pattern  recognition,  classification  problems,  e.g.  road  condition  classifier  [Ferdowsizadeh,  2004],  adaptive  control,  robot  control, combinatorial optimization and game playing. There  are lots of publications in applying these methods in RoboCup  Soccer  Simulated  teams  mostly  in  2D  (and  NOT  3D)  environment [1, 2, 3, 4, 5, 6, 8, and 9] (there are much more  than referenced researches). It may have different reasons, but  having problem with low­level skills that leads to disability in  controlling  agents,  complicated  dynamics  which  makes  predictions not to work well and a vast range of performing soccer  skills in comparison with 2D simulated environment for sure  are the most important effecting factors. There are new features  and also  limitations in  this environment  which make some  distinctions  in decision  making process.  (For more detailed  information you can refer to [10, 11])  In this paper a new methodology for decision making in  RoboCup  soccer  simulated  3D  environment  with  all  abovementioned  problems  consideration  is  introduced.  Implementation of real soccer skills in two layers and utilizing  both fuzzy  and non­fuzzy  algorithms in  different layers  of  decision making are the essential keys for the accomplishment  of  this system.  Section two  reviews the  state of  art of  this  methodology in order to apply it in decision making process. In  this section the basic skills and their functionality and also some  of soccer (high­level) skills are introduced and classified. The  first layer of decision making process is discussed in section three  and the second layer in section four. Section five comprises our  results which are implemented on Scorpius Soccer Simulation  Team 1 and finally section six concludes the paper.  II. LAYERS OF SKILLS AND DECISION MAKING PROCESS  In  the proposed  methodology some  applicable skills  are  introduced and the decision making policy is developed by  considering the features and limitations of this environment.  The skills are classified in two layers, in the first layer there  are the simple actions which are already implemented by server  (basic skills)  and in  the second  layer the  actions are  more  complicated and sometimes a combination of «basic skills»  are  used (high­level  skills).  Besides,  the  decision  making  process has two steps; first step considers the agent’s abilities  of performing a high­level skill according to his circumstances  and  the  second step  considers  the  agent  positioning  and  choosing the best action regarding to the first step results.  A.  Basic skills  The basic skills are defined as the actions, which are already  implemented  by server  [10, 11]. They can  be employed  by  sending  the  proper  commands  to  soccer  server 2 .  These  commands are:  ∙  A(drive x   y   z):  moves the  agent  by  applying the  force  vector (x, y, z) to center of it.  ∙  A(kick alpha f): agent kicks the ball by applying the force f  with the angle alpha to it if the ball is in kickable distance.  ∙  A(pantilt angle1  angle2): This command changes the view  direction  of  an  agent where  «angle1»and «angle2»  are  changes (in degrees) of the pan and tilt angle, respectively.  ∙  A(say(«say  message  here»)):sends  a  message  to all  the  players that are located in 50 meter from sender.  ∙  A(catch): (for goal keeper only) holds and freezes the ball  if the ball is in the catch able area.  (See  [10,  12]  for  more  detailed  information  about  the  commands)  B. High level skills  High­level  skills  are  those  in  which  the  world  model 3  information and the basic skills are being applied. These skills  consist of the actions with ball like: pass, shoot, dribble, etc.  and actions without ball like: mark, find object and information  broadcasting.  1)  Actions with ball  To perform these actions, basically we need some information  about the ball treats, when a force with a particular angle is  applied, considering the environment parameters (e.g. air force,  friction, collision, etc). A number of complicated mechanical  formulas could help to predict the ball movements (Figure 1  shows the ball predicted motion in comparison with the real  ball position information given from the monitor 4 ). Some of  the most applicable skills with ball are as follows:  1. http://www.scorpius.ir  2. These skills are implemented in rcsoccersim3D_0.5.5  3. World  Model is a data bank in  which the  information about the  environment is stored  4. We wrote a program to parse the monitor log file. We assume that  this information is the most accurate one we may have from what  really  happens in  server. A simple method for decision making in RoboCup soccer simulation 3D environment   –  Maleki et al  111  ∙  Shoot  Shooting for sure is the most important skill in soccer and  all other skills like pass, dribble, etc are based on it. A player  in this environment can only kick the ball in front of himself,  so he needs to get behind ball in a correct position to shoot the  ball in his desired direction (see Figure 4).  ∙  Pass  The agent  kicks the  ball so  that the  other teammate  can  receive it. This can be a simple definition for the skill «pass».  As this skill can be used in different situations, the type is  defined for it. We have three kinds of pass:  1.   Secure pass: The player is completely sure that this  pass  will arrive  to  the  player he  wishes. The  most  popular usage of this type of pass is when the ball is in  danger zone 5 .  2.  Normal pass: the probability of success in pass is more  than its failure. Mostly used in the middle of the field.  3.  Risky pass: In this case, the probability of ball arrival  exists,  but the  possibility  of  failure is  more than  its  success. This  type is  used in  order  to  create  a  good  situation for team.  ∙  Dribble (run with ball)  The agent usually uses the skill «dribble» when he owns the  ball in an almost free space and can’t find the other agents with  better positions or can’t pass them the ball (see Figure 7b).  ∙  Clear ball  This is an action that agent chooses to do, when he owns the  ball  and  can  perform  no  other action  or  the  player  is  in  dangerous situation, mostly happens in defense. Depending  on the occurred circumstance, the agent may kick the ball out  of the field, toward the opponent goal or other positions.  5. Danger zone is defined in fuzzy member function (see Fig. 4)  Figure 1. The comparison between the mechanical formula used for ball  motion prediction and the real data given from the monitor.  2) Actions without ball  These skills make agents to be arranged in positions so that  they would have the most chance to create opportunities for  team or to get the opponents opportunities.  ∙  Mark  Mark skill approaches two purposes:  1.   Not to let the ball reaches the opponents (mark player).  2.   Not to let the opponents shoot to their desired position  (mark ball).  According to the purpose the player gets near to the opponent  up to the MarkSecureDistance and marks him.  ∙  Pan­tilt (object­finding skill)  The agent uses this skill to find an object and/or to update  his world model. There are two different conditions:  1.  The agent sees an object but wants to keep it in the  center of his vision not to let that object gets out sight  easily. This usually happens for ball because its location  varies very fast and easily may get out of the agent’s  sight (Figure 2).  2.  The agent doesn’t see the object; in this case he pans  with MaxPanAngle with the direction in which the last  time that object was seen.  ∙  Say (information broad casting or alerting skill)  This skill is being used for alerting the agents and also to  update their world models. Depending on how many characters  per cycle an agent can talk, he can use them in order to update  the other agents’ world models. One of the most recommended  usages of this skill is utilized in mark. When the defenders  «mark ball» the opponents they do not see the opponents which  are marked. So they need to change their view in each few  cycles, but when the ball gets near they may focus on ball and  forget about the agent. In this case or similar events we can  use say skill to update and also alert the agents. Figure 2 shows  this event.  Figure 2.  The goal keeper says a message to update the defenders world model.  They can’t see the opponents’ displacement behind them. Revista Avances en Sistemas e Informática, Vol. 5 ­ No. 3, Diciembre de 2008, Medellín, ISSN 1657­7663  112  III. DECISION MAKING PHASE 1  In  this phase,  the agent  ability of  performing an  action  according  to  the  environment  situation  (e.g.  opponents’  positions/speed, ball position/speed and their predicted states)  is tested by Decision Makers (DM) to confirm if that action  can  be done  by  the  agent in  that condition.  Some of  these  decision makers are explained below:  ∙  DM for shooting to a position  To determine if an agent can shoot to a position or not, first the  agent calculates the minimum degree, for shooting, if the degree  could be found less than MaxKickDegree then tries to find an  angle between min degree and MaxKickDegree and a force less  than MaxKickForce. If the angle and a force found with these  properties the DM returns true, otherwise it returns false.  Figure 3.  Shooting to a position requires minimum angle á to be less than (Max Kick  Angle) and minimum distance d less than (Max Kick Distance)  ∙  DM for Shoot to goal  First, the agent quantizes the goal, to n discrete positions.  For each position first checks the Shoot to position conditions,  if the result is true then checks the following condition:  Let Tb be the time takes ball to meet the target with the  maximum  speed,  and Tr  be the  rotation  time  for  the  ball  controller to adjust it’s position beside the ball. Tg represents  the time takes goalie to catch the ball (Figure4). Having calculated  the above three parameters we define ∆t as following [7]:  )  (  Tr  Tb  Tg  t + − = ∆  (1)  Figure 4. The time intervals needed for prediction calculation applied in shoot­  to­goal decision maker.  The sign of ∆t shows if the agent can shoot to that position  or not.  DM  for pass  This DM gets the ball position and the pass receiver as input  parameters. to know where to use which type we implemented  a fuzzy algorithm. This fuzzy algorithm according to the ball  position and the player situation tells us which type is more  proper and also gives the Max Allowed Pass Error:  Figure 5. Fuzzy input member functions; a. ball position input variable  b. pass receiver situation input variable  a  b  Fuzzy rule base for pass is as follows:  1. If (position is Danger) then (pass type is Secure).  2. If (position is Safe) and (situation is Bad) then (pass type is  Secure).  3. If (position is Safe) and (situation is Normal) then (pass  type is Normal).  4. If (position is Safe) and (situation is Good) then (pass type  is Risky).  5. If (position is Risk) and (situation is Bad) then (pass type is  Secure).  6. If (position is Risk) and (situation is Normal) then (pass  type is Normal).  7. If (position is Risk) and (situation is Good) then (pass type  is Risky). A simple method for decision making in RoboCup soccer simulation 3D environment   –  Maleki et al  113  Figure 6. The relationship between ball position­pass receiver situation and  Max Pass Error according to the fuzzy algorithm.  After the pass type and Max Pass Error became determined,  agent checks his ability for performing this type of pass.  First the agent checks if he can shoot to the pass position or  not then the amount of risk will be calculated. The following  factors have to be checked in order to calculate the risk of pass:  1. Opponents around the ball  2. The relative agent position with ball.  3. The max error for getting position behind the ball  4. The position of opponents around the player we want to  pass to, and their distances with him.  5. The ball path  Let t1 be the time takes player to get position behind ball. It  depends on factors 1,2, and  3 which vary with pass type, and  t2 be the time takes for opponents to reach the ball, the player  can pass when t1 is less than t2.(See Figure 7.a)  Let t(i) be the time takes for opponent i to intercept the ball  considering the ball height from the field at position p(i) with  error E1, and t1(i) is the time takes for ball to reach p(i) with  error E2, where E1 and E2 vary with pass type. If  t1(i)