Paragonando le sequenze di DNA ottenute dal consorzio internazionale per il sequenziamento del genoma umano e tutte le altre sequenze disponibili nelle banche dati, si è constatato che, in media, tra due genomi aploidi si trova una differenza (in inglese single-nucleotide polymorphisms o SNPs) ogni 1250 coppie di basi. Tale differenza può essere dovuta alla semplice sostituzione di una coppia di basi, ma anche a delezione o inserzione di una o più coppie di basi. Le sostituzioni di singole basi sono il tipo di polimorfismo più frequente. Quindi, in media, due persone hanno in comune circa il 99,9% della loro sequenza di DNA e variano solo per lo 0,1%. Tuttavia, dato che il genoma umano è composto di circa 3 miliardi di coppie di basi, questo significa anche che la sequenza di DNA di due persone non parenti varia per milioni di basi.
Questi numeri riguardano una distribuzione media sull'intero genoma ma la reale distribuzione dei polimorfismi varia molto nelle varie regioni del genoma, tra i cromosomi, tra differenti regioni di cromosomi, tra i differenti geni, dentro i singoli geni e tra i geni e le regioni intergeniche. I numeri di polimorfismi potranno quindi essere molto diversi quando si parla di specifiche regioni o specifici geni. Inoltre alcuni polimorfismi sono molto comuni e hanno una frequenza alta nell'intera popolazione umana, altri polimorfismi sono meno comuni e possono essere presenti solo nell'1% della popolazione umana. Ci sono poi varianti rarissime, che possono essere presenti anche in pochissime persone.
Le conseguenze prodotte dai polimorfismi dipendono dal posto in cui si verificano. Se cadono nelle regioni di regolazione della espressione dei geni possono influenzare la attività trascrizionale dei geni e quindi la quantità dei prodotti genici. Sostituzioni nucleotidiche possono verificarsi nelle regioni codificanti dei geni (esoni), e possono causare la sostituzione di un aminoacido nella proteina codificata, influenzando quindi la funzionalità della proteina stessa o la sua stabilità. In altri casi i polimorfismi, pur verificandosi nella parte tradotta di un gene, non producono la sostituzione dell'aminoacido corrispondente e sono detti silenti. Questi ultimi polimorfismi sono molto più frequenti di quelli che inducono sostituzioni aminoacidiche, che possono venire eliminati per selezione naturale quando producono varianti deleterie. Altri polimorfismi possono verificarsi nelle parti non codificanti dei geni o introni e possono risultare in difetti nel processamento degli RNA messaggeri o nella loro stabilità.
Infine polimorfismi si trovano nelle regioni tra i geni. La maggior parte dei polimorfismi identificati cadono in zone non codificanti. Poiché dunque solo una piccola parte dei polimorfismi altera direttamente le sequenze delle proteine, le varianti genetiche che possono contribuire alle diversità strutturali delle proteine umane sono solo migliaia e non milioni. Quindi la relazione tra i milioni di polimorfismi di DNA e le differenze fenotipiche complesse osservate negli esseri umani, non è chiara.
I polimorfismi possono essere correlati a tratti umani complessi, quali un aumentato rischio di avere la pressione alta, o il colesterolo alto o altre malattie. Ad esempio, paragonando i polimorfismi presenti in popolazioni o gruppi di persone che hanno la pressione alta con i polimorfismi presenti in popolazioni che non soffrono di questo problema, se uno o più specifici polimorfismi sono più comuni nella popolazione con la pressione alta, questi polimorfismi possono essere usati per identificalre il/i gene/i coinvolti in tale tratto importante per la salute dell'uomo.
Attualmente grossi sforzi si stanno compiendo per catalogare e mappare tutte le varianti genetiche che si sono prodotte nel genere umano e stabilire come esse si distribuiscono tra le persone in una popolazione e tra le popolazioni nelle diverse parti del mondo. Questo potrà permettere di collegare specifici polimorfismi o gruppi di polimorfismi al rischio di contrarre specifiche malattie e quindi potrebbe fornire nuovi metodi per prevenire, diagnosticare o curare queste malattie.