
No mundo dos bots, o Reinforcement Learning tende a ser cada vez mais usado através da combinação de técnicas de aprendizado supervisionado e não-supervisionado, para que o modelo descubra não apenas o caminho certo ou errado para um diálogo, mas a resposta mais pertinente para cada interação.
Quem trabalha com bots e assistentes virtuais para larga escala sabe que é difícil, senão quase impossível, escrever um programa que possa responder de forma orgânica e precisa a todas as combinações possíveis e cenários de interação com humanos.
É por isso que muitos chatbots que cobrem uma ampla gama de intenções do usuário vêm enfrentando desempenho ruim, por conta da confusão e sobreposição de intenções.
Com o uso de Reinforcement Learning, bots de autoaperfeiçoamento poderão ser treinados de forma autônoma, levando em consideração o feedback em simulações em fases de teste e na interação ao vivo com usuários reais. Em consequência, a performance do bot só melhora.
Para os times de produto e curadoria de bots, as técnicas de Reinforcement Learning são especialmente úteis, uma vez que esses modelos não exigem muito conhecimento ou dados pré-existentes para fornecer soluções assertivas.
Em 2021, as tendências de RL aplicados à Natural Processing Learning incluem o uso em resumo e tradução de textos, análise de discurso e traduções automáticas, apenas para citar algumas aplicações.
No TIVIT Labs, por exemplo, combinamos o Aprendizado de Máquina e curadoria humana para criar as melhores jornadas para a nossa colaboradora virtual, a IVI Virtual Employee.