Le jeu de données d’insectes BIOSCAN-1M vise à élargir le catalogue de la biodiversité des insectes grâce à un vaste ensemble de données comprenant un million d’images d’insectes étiquetées manuellement. Cet ensemble de données d’images soigneusement sélectionnées est principalement destiné à la formation de modèles de vision par ordinateur afin de fournir des évaluations taxonomiques basées sur les images.
Chaque enregistrement est classé taxonomiquement par un expert et comprend des informations génétiques associées, telles que des séquences brutes de codes-barres nucléotidiques et des numéros d’index de codes-barres attribués. L’objectif final est de créer une enquête complète de la biodiversité mondiale.