Download como arquivo ICAL
"Human-Help in Automated Planning Under Uncertainty"
Sexta-feira 21 Setembro 2018, 14:00 - 18:00
Contato: Este endereço de email está sendo protegido de spambots. Você precisa do JavaScript ativado para vê-lo.

Candidato: ignasi Andres Franch

 

Orientadora: Profa. Dra. Leliane Nunes de Barros

 

Resumo: Planejamento é a sub-área de Inteligência Artificial que estuda o processo de selecionar ações
que levam um agente, por exemplo um robot, a um estado meta. Em muitos cenários realistas,
qualquer escolha de ações pode levar o robot num beco-sem-saída, isto é, um estado a partir do
qual a meta não pode ser alcançada. Nestes casos, o robot pode pro-ativamente pedir ajuda humana
para alcançar a meta, uma abordagem chamada autonomia simbiótica. Neste trabalho, propomos
duas abordagens diferentes para tratar este problema: (i) planejamento contingente, onde o estado
inicial é parcialmente observável, configurando um estado de crença, e existe não-determinismo
nos resultados das ações do robô; e (ii) planejamento probabilistico, onde as ações tem resultados
probabilísticos.
Em geral, em problemas de planejamento contingente as ações tem custos unitários e objetivo do
agente é minimizar o tamanho da solução que satisfaz uma das propriedades seguintes (em ordem de
preferencia): (1) soluções fortes que garantem que o agente sempre alcança a meta; (2) soluções fortecíclicas
que garantem que o agente eventualmente alcança a meta, e (3) soluções fracas que não tem
garantias de alcançar a meta. Nossa meta neste cenário e usar ajuda do humano para transformar
soluções fracas em soluções fortes (cíclicas). Nos resolvemos estes problemas usando soluções estadoda-
arte baseadas em K-traduções, incluindo um conjunto distinto de ações representando a ajuda do
humano de dois tipos: observações e ações-literais. Também definimos uma classificação de becossem-
saída no espaço de estados de crença e fazemos experimentos em problemas diversos com esses
tipos de becos-sem-saída. Além disso, mostramos como reduzir o tamanho do conjunto de ações e
observações do humano usando a noção de relevância sobre o grafo causal, uma estrutura de dados
usada para computar heurísticas eficientes em planejamento clássico.
Por otra parte, planejamento probabilístico assume que os estados são completamente observáveis
e as ações tem custos não uniforme, e existem dois tipos de soluções: soluções próprias, nas quais
o agente tem uma probabilidade de 1 de chegar na meta, ou soluções impróprias, em que o agente
tem uma probabilidade maior que zero de não chegar na meta. O objetivo do agente é encontrar
uma política que satisfaça um critério determinado, e.g. minimizar o custo esperado ou maximizar a
probabilidade de alcançar a meta. Neste cenário, uma abordagem popular é planejar para maximizar
a probabilidade de alcançar a meta. Embora esta estratégia aumenta a robustez e autonomia esperada
do robô, não especifica um comportamento para o caso em que se encontre um beco-sem-saída.
Nestes problemas, nós propomos não somente criar ações-literais como nos problemas de planejamento
contingente (sem precisar de observações do humano), mas também propomos diferentes
critérios de otimização baseadas nas abordagens atuais para resolver problemas de planejamento
probabilístico com becos-sem-saída, como minimizar a probabilidade de usar ações do humano ou
minimizar o numero esperado de ações do humano. Os resultados experimentais mostram a escalabilidade
de nossas soluções, assim como uma análise comparativa das políticas geradas por esses critérios.

Local Auditório Jacy Monteiro - Bloco B do IME