por Natália Meira

Uma das etapas mais caras para implementações em deep learning é rotulação de dados. É necessário tempo e, frequentemente, o acompanhamento de um especialista para executar esta tarefa. Se queremos rotular um grande volume de dados, este pode ser um gargalo. Rotular uma cena complexa com 50 objetos pode levar de 30 a 90 minutos.

Para superar este desafio, vamos mostrar a proposta do DatasetGAN. O DatasetGAN foi apresentado como um procedimento automático para gerar conjuntos de dados massivos de imagens semanticamente segmentadas de alta qualidade. Nessa proposta, o DatasetGAN gera imagens realistas semanticamente segmentadas a partir de poucos dados rotulados manualmente.

Os autores treinaram um decodificador para produzir os rótulos em nível de pixel. Para apenas algumas imagens rotuladas, é possível treinar um decodificador bem sucedido, e obter um gerador de conjunto de dados anotados infinito. Esses conjunto de dados podem ser usados para treinamento de qualquer arquitetura de visão computacional da mesma forma que os conjuntos de dados reais.

O DATASETGAN sintetiza pares de anotação de imagem e pode produzir grandes conjuntos de dados de alta qualidade com rótulos detalhados em pixels. A figura ilustra as 4 etapas. (1 e 2). Aproveite o StyleGAN e anote apenas uma quantidade de imagens sintetizadas. Treine um branch altamente eficaz para gerar rótulos. (3). Gere um enorme conjunto de dados sintéticos de imagens anotadas automaticamente. (4). Treine sua abordagem favorita com o conjunto de dados sintético e teste em imagens reais.
Figura 1: O DATASETGAN sintetiza pares de anotação de imagem e pode produzir grandes conjuntos de dados de alta qualidade com rótulos detalhados em pixels. A figura ilustra as 4 etapas. (1 e 2). Aproveite o StyleGAN e anote apenas uma quantidade de imagens sintetizadas. Treine um branch altamente eficaz para gerar rótulos. (3). Gere um enorme conjunto de dados sintéticos de imagens anotadas automaticamente. (4). Treine sua abordagem favorita com o conjunto de dados sintético e teste em imagens reais.

O DatasetGAN é um código open source, e você pode encontrá-lo aqui: <https://github.com/nv-tlabs/datasetGAN_release>.

Referência: ZHANG, Y.; LING, H.; GEO, J.; YIN, K.; LAFLECHE, J.F.; BARRIUSO, A.; TORRALBA, A.; FODLER, S.. Datasetgan: Efficient labeled data factory with minimal human effort. In: Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2021. p. 10145-10155.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

*
*
Website