O Conjunto de Dados de Insetos BIOSCAN-1M tem como objetivo expandir o catálogo da biodiversidade de insetos por meio de um grande conjunto de dados de um milhão de imagens de insetos rotuladas manualmente. Este conjunto de dados de imagens curado é principalmente destinado ao treinamento de modelos de visão computacional para fornecer avaliações taxonômicas baseadas em imagens.
Cada registro é classificado taxonomicamente por um especialista e inclui informações genéticas associadas, como sequências brutas de códigos de barras nucleotídicos e números de índice de códigos de barras atribuídos. O objetivo final é criar um levantamento abrangente da biodiversidade global.