Campeão
LarLar > blog > Campeão

Campeão

Jul 16, 2023

Nature volume 620, páginas 982–987 (2023)Cite este artigo

889 Altmétrico

Detalhes das métricas

As corridas de drones com visão em primeira pessoa (FPV) são um esporte televisionado em que competidores profissionais pilotam aeronaves de alta velocidade através de um circuito 3D. Cada piloto vê o ambiente a partir da perspectiva de seu drone por meio de vídeo transmitido por uma câmera a bordo. Alcançar o nível de pilotos profissionais com um drone autônomo é um desafio porque o robô precisa voar em seus limites físicos enquanto estima sua velocidade e localização no circuito exclusivamente a partir de sensores embarcados1. Aqui apresentamos o Swift, um sistema autônomo que pode competir com veículos físicos no nível dos campeões mundiais humanos. O sistema combina aprendizagem por reforço profundo (RL) em simulação com dados coletados no mundo físico. Swift competiu contra três campeões humanos, incluindo os campeões mundiais de duas ligas internacionais, em corridas frente a frente no mundo real. Swift venceu várias corridas contra cada um dos campeões humanos e demonstrou o tempo de corrida mais rápido registrado. Este trabalho representa um marco para a robótica móvel e a inteligência de máquinas2, que pode inspirar a implantação de soluções híbridas baseadas em aprendizagem em outros sistemas físicos.

Deep RL3 permitiu alguns avanços recentes em inteligência artificial. Políticas treinadas com RL profundo superaram os humanos em jogos competitivos complexos, incluindo Atari4,5,6, Go5,7,8,9, xadrez5,9, StarCraft10, Dota 2 (ref. 11) e Gran Turismo12,13. Estas impressionantes demonstrações das capacidades da inteligência das máquinas limitaram-se principalmente a ambientes de simulação e de jogos de tabuleiro, que apoiam a procura de políticas numa réplica exacta das condições de teste. Superar essa limitação e demonstrar desempenho de nível campeão em competições físicas é um problema antigo na robótica móvel autônoma e na inteligência artificial14,15,16.

As corridas de drones FPV são um esporte televisionado no qual pilotos humanos altamente treinados levam os veículos aéreos aos seus limites físicos em manobras ágeis de alta velocidade (Fig. 1a). Os veículos utilizados nas corridas FPV são quadricópteros, que estão entre as máquinas mais ágeis já construídas (Fig. 1b). Durante uma corrida, os veículos exercem forças que superam o seu próprio peso por um fator de cinco ou mais, atingindo velocidades superiores a 100 km h-1 e acelerações várias vezes maiores que a da gravidade, mesmo em espaços confinados. Cada veículo é controlado remotamente por um piloto humano que usa um fone de ouvido que mostra um fluxo de vídeo de uma câmera a bordo, criando uma experiência imersiva de “visão em primeira pessoa” (Fig. 1c).

a, Swift (azul) compete frente a frente com Alex Vanover, campeão mundial da Drone Racing League de 2019 (vermelho). A pista é composta por sete portões quadrados que devem ser passados ​​​​em ordem em cada volta. Para vencer uma corrida, um competidor deve completar três voltas consecutivas antes do seu adversário. b, Uma visão aproximada do Swift, iluminado com LEDs azuis, e um drone pilotado por humanos, iluminado com LEDs vermelhos. Os drones autônomos utilizados neste trabalho dependem apenas de medições sensoriais a bordo, sem suporte de infraestrutura externa, como sistemas de captura de movimento. c, Da esquerda para a direita: Thomas Bitmatta, Marvin Schaepper e Alex Vanover pilotando seus drones pela pista. Cada piloto usa um fone de ouvido que mostra um fluxo de vídeo transmitido em tempo real por uma câmera a bordo de sua aeronave. Os headsets proporcionam uma experiência imersiva de “visão em primeira pessoa”. c, Foto de Regina Sablotny.

As tentativas de criar sistemas autônomos que alcancem o desempenho de pilotos humanos datam da primeira competição autônoma de corridas de drones em 2016 (ref. 17). Seguiu-se uma série de inovações, incluindo o uso de redes profundas para identificar a próxima localização do portão18,19,20, a transferência de políticas de corrida da simulação para a realidade21,22 e a contabilização da incerteza na percepção23,24. A competição de corridas de drones autônomos AlphaPilot de 2019 apresentou algumas das melhores pesquisas na área25. No entanto, as duas primeiras equipes ainda levaram quase o dobro do tempo de um piloto humano profissional para completar a pista26,27. Mais recentemente, os sistemas autônomos começaram a atingir o desempenho humano especializado28,29,30. No entanto, esses trabalhos dependem de uma estimativa de estado quase perfeita fornecida por um sistema externo de captura de movimento. Isto torna injusta a comparação com os pilotos humanos, uma vez que os humanos só têm acesso às observações a bordo do drone.