Los ALGORITMOS AMBIDIESTROS
CIENCIAS. Dilema de Exploración-Explotación, nos muestra el conflicto entre explotar una fuente de recompensa conocida y explorar otras fuentes menos conocidas.
Para adaptarse de manera flexible a las exigencias del entorno, los animales están constantemente teniendo que elegir entre explotar y explorar. Cuando optan por una acción conocida, previsible y gratificante están explotando. Cuando eligen una opción novedosa, cuyo principal valor es obtener nueva información sobre el espacio de posibilidades, están explorando. A pesar de una extensa investigación en diferentes ámbitos, los mecanismos sobre cómo los animales, y también otras entidades, como las organizaciones, resuelven el dilema explotación-exploración aún está pendiente.
Dilemas en las decisiones
Soñemos con una tibia tarde de verano entrando a una cervecería para comprar una refrescante cerveza. Después de entrar, nos enfrentamos a una carta con docenas de diferentes tipos y sabores. Una buena estrategia sería elegir nuestro sabor favorito, por ejemplo, Lager, ya que la probabilidad de que la encontremos satisfactoria es muy alta. Sin embargo, también venden sabores que parecen atractivos, pero que no conocemos, por ejemplo, Trigo del sur de Alemania.
¿Seleccionaremos el sabor que sabemos nos gustará o el sabor que nunca hemos probado, pudiendo encontrar un nuevo sabor favorito o una gran decepción? Este problema de decisión es un ejemplo del dilema de Exploración-Explotación, que muestra el conflicto entre explotar una fuente de recompensa conocida y explorar otras fuentes menos conocidas que pueden terminar en un resultado más gratificante o una oportunidad desperdiciada.
Las personas podemos resolver el dilema de Exploración-Explotación mediante la adopción de diferentes estrategias exploratorias utilizando diferentes marcos teóricos que explican distintos factores que impulsan la exploración. La teoría del Aprendizaje Reforzado, por ejemplo, considera que la exploración puede ser aleatoria: un tomador de decisiones que aprende a maximizar una señal de recompensa puede, también, tomar decisiones asociadas con un valor de recompensa más bajo (exploración) a través de un proceso aleatorio de generación de alternativas.
En la década de los noventa, el dilema se trató en el ámbito del Aprendizaje Organizacional para explicar los procesos de adaptación en las organizaciones. De este modo, en organizaciones que innovan la construcción de la "ambi-destreza" ha atraído una creciente atención, por cuanto se relaciona con una combinación de altos niveles de exploración y explotación que están positivamente relacionadas con los resultados de innovación.
No obstante que esta problemática ha tenido una amplia investigación en diferentes campos, aún no está claro cómo se entienden ambas competencias, en forma complementaria o excluyente.
EL DILEMA EXPLORACIÓN-EXPLOTACIÓN EN la INTELIGENCIA DE ENJAMBRES
La Exploración y la Explotación son los dos comportamientos de búsqueda básicos utilizados en los Algoritmos de Inteligencia de Enjambres, técnicas de Inteligencia Computacional inspiradas en el comportamiento colectivo de los animales, actualmente muy utilizadas para resolver problemas de Optimización Combinatoria. Aquí, la Exploración se refiere a buscar en un área no explorada de posibles soluciones, mientras que la Explotación se refiere a la búsqueda de soluciones en un área acotada de buenas soluciones.
Aumentar el número de exploraciones aumenta el rendimiento del algoritmo, en términos de la calidad de las soluciones encontradas, a expensas del tiempo de ejecución. El éxito de estos algoritmos dependerá, en gran medida, de cómo se equilibran estos dos comportamientos de búsqueda. Nuestra investigación actual en la PUCV se dirige a la generación de Algoritmos de Inteligencia de Enjambre Ambidiestros.
Algoritmos ambidiestros
Los algoritmos que favorecen la explotación poseen una mayor velocidad, encontrando soluciones iniciales, pero a riesgo de quedarse con una solución no muy buena. Aquellos que exploran en exceso pueden no encontrar soluciones satisfactorias o hacerlo después de transcurrido demasiado tiempo.
Tal como en las decisiones personales y en las organizaciones que innovan, estas dos fuerzas -Exploración y Explotación- son opuestas, aunque igualmente importantes y complementarias, de ahí que se considere una tarea fundamental encontrar un balance adecuado en la Toma de Decisiones y en la Optimización Computacional.