por Natália Meira
Uma das etapas mais caras para implementações em deep learning é rotulação de dados. É necessário tempo e, frequentemente, o acompanhamento de um especialista para executar esta tarefa. Se queremos rotular um grande volume de dados, este pode ser um gargalo. Rotular uma cena complexa com 50 objetos pode levar de 30 a 90 minutos.
Para superar este desafio, vamos mostrar a proposta do DatasetGAN. O DatasetGAN foi apresentado como um procedimento automático para gerar conjuntos de dados massivos de imagens semanticamente segmentadas de alta qualidade. Nessa proposta, o DatasetGAN gera imagens realistas semanticamente segmentadas a partir de poucos dados rotulados manualmente.
Os autores treinaram um decodificador para produzir os rótulos em nível de pixel. Para apenas algumas imagens rotuladas, é possível treinar um decodificador bem sucedido, e obter um gerador de conjunto de dados anotados infinito. Esses conjunto de dados podem ser usados para treinamento de qualquer arquitetura de visão computacional da mesma forma que os conjuntos de dados reais.
O DatasetGAN é um código open source, e você pode encontrá-lo aqui: <https://github.com/nv-tlabs/datasetGAN_release>.
Referência: ZHANG, Y.; LING, H.; GEO, J.; YIN, K.; LAFLECHE, J.F.; BARRIUSO, A.; TORRALBA, A.; FODLER, S.. Datasetgan: Efficient labeled data factory with minimal human effort. In: Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2021. p. 10145-10155.