Un code-barres ADN est une petite partie du génome, dont la séquence est stable au sein d’une espèce, mais variable entre les espèces. Il peut ainsi servir d'identifiant unique pour chaque espèce. En ce sens-là, il remplit une fonction semblable à celle des codes-barres numériques trouvés sur les produits dans un supermarché.
L’utilisation du code-barres ADN pour l’identification des espèces dépend d’une banque de données de référence qui contient des séquences d’ADN générées à partir de spécimens déjà identifiés. La séquence code-barres d’un spécimen inconnu peut alors être comparée aux séquences qui sont déjà dans la base de donnée pour déterminer son identité.
Un code-barres génétiques peut être révélé par des analyses de laboratoire. Ce travail consiste à extraire l'ADN d'un spécimen et à déterminer quelles sont les molécules qui composent la partie du code-barres. Celui-ci, comme le reste du génome, est formé d'une succession plus ou moins longue de quatre types d'éléments : les nucléotides. C'est ce qu'on appelle la séquence d'un code-barres ADN.
Le matériel génétique est invisible à l'oeil nu, mais on peut observer sa structure grâce à la diffraction de rayons X à travers des cristaux d'ADN purifié. On sait donc qu'il prend la forme d'une longue échelle torsadée dont on connait la nature chimique. L'information génétique est constituée par l'ordre des quatre types de nucléotides formant les "barreaux" de l'échelle. C'est pourquoi on représente les code-barres ADN à l'aide de quatre couleurs différentes.