O que é seleção de ações?
A seleção de ações é um processo que envolve como um sistema inteligente projetado reagirá próximo a um determinado problema. Geralmente é um campo estudado em psicologia, robótica e inteligência artificial. A seleção de ações é sinônimo de tomada de decisão e escolha comportamental. Os dados coletados são pesquisados e detalhados para poder adaptá-los a sistemas artificiais como robótica, videogame e programação de inteligência artificial.
Muitos dos dados nas ciências da vida podem ser observados e experimentados para evocar uma resposta variável. Todas as criaturas vivas têm sua própria reação instintiva à comida, predadores e companheiros. Criar um ambiente controlado em que os animais estudados sempre realizem soluções diferentes para diferentes problemas fornece aos pesquisadores e programadores uma base para o avanço de seus estudos. Por sua vez, isso levou pesquisadores e programadores a tentar recriar essas respostas instintivas de maneira controlada.
Para pesquisadores e programadores, as perguntas mais comuns usadas na seleção de ações estão focadas no que fazer depois e no que acontece a seguir. As respostas, por sua vez, podem ser recicladas para um novo lote de seleção de ação experimental. Exemplos principais de seleção de ações podem ser encontrados em jogos e programação de inteligência artificial. Em jogos de computador, ele pode ser encontrado em jogos de tiro em primeira pessoa (FPS) como Halo e Counter-Strike. O Creatures , um jogo baseado em animais de estimação, usa um mecanismo de inteligência artificial que pode tomar suas próprias decisões, adaptando-se às tarefas.
O que faz da seleção de ações um campo exclusivo é que sempre há um guia rigoroso a seguir para obter um nível aceitável de dados. O guia sempre se baseará em um assunto que é padronizado em um humano ou animal. Para a maioria, se não todos os pesquisadores e programadores, um assunto sempre precisará ser colocado em um local em que o ambiente seja imprevisível e esteja sempre mudando. O sujeito também precisará reagir a tempo enquanto executa várias tarefas. Ele também deve interagir com seres humanos reais, a fim de gerar um fator aleatório.
Com esses muitos fatores aleatórios e uma orientação rígida a seguir, a pesquisa nunca termina, pois sempre haverá um conjunto diferente de circunstâncias para cada experimento. Um fator primário que faz com que pesquisadores e programadores estudem esse campo intensivamente é o tempo de resposta. A cada experimento bem-sucedido em que o sujeito aprendeu uma ação, um caminho diferente de ação surgirá. Por sua vez, isso cria um assunto mais complexo quando comparado a uma versão anterior.