O primeiro genoma de um organismo celular foi decifrado através do sequenciamento da bactéria H. influenzaeI, utilizando-se uma metodologia de shotgun, que se trata do sequenciamento totalmente ao acaso, para posterior montagem em uma sequência contígua.
O processo de anotação genômica envolve a atribuição de funções e identificação de padrões e de genes na sequência linear do DNA. Toda essa informação está disponível nas diferentes ordens e arranjos das sequências de DNA.
O Centro Nacional para Informação Biotecnológica do Canadá (National Center for Biotechnology Information – NCBI) é considerado o banco de dados central sobre informações genômicas, porém seu acesso é restrito a profissionais ligados a universidades e institutos de pesquisa.
A ferramenta mais popular de comparação de sequências de DNA com os bancos de dados genômicos é o BLAST. Através desse algoritmo, é possível comparar uma sequência de DNA qualquer com todas sequências genômicas de domínio público.