Indice di fissazione: differenze tra le versioni

Da Wikipedia, l'enciclopedia libera.
Vai alla navigazione Vai alla ricerca
Contenuto cancellato Contenuto aggiunto
Ptroski (discussione | contributi)
Creata voce per l'indice di fissazione
 
Ptroski (discussione | contributi)
Aggiunti fonti e wikilink, sistemato errori.
Riga 4: Riga 4:
Due delle definizioni più comunemente usate per l'F<sub>ST</sub> in un determinato locus sono basate sulla [[varianza]] di frequenze [[Allele|alleliche]] tra le popolazioni, e sulla probabilità di identità per discendenza.
Due delle definizioni più comunemente usate per l'F<sub>ST</sub> in un determinato locus sono basate sulla [[varianza]] di frequenze [[Allele|alleliche]] tra le popolazioni, e sulla probabilità di identità per discendenza.


Se <math>\bar{p}</math> è la frequenza media di un allele nella popolazione totale, <math>\sigma^2_S</math> è la varianza nella frequenza dell'allele tra sottopopolazioni diverse, ponderata dalla dimensione delle sottopopolazioni, e <math>\sigma^2_T</math> è la varianza dello stato allelico nella popolazione totale, F<sub>ST</sub> è definito come [1]
Se <math>\bar{p}</math> è la frequenza media di un allele nella popolazione totale, <math>\sigma^2_S</math> è la varianza nella frequenza dell'allele tra sottopopolazioni diverse, ponderata dalla dimensione delle sottopopolazioni, e <math>\sigma^2_T</math> è la varianza dello stato allelico nella popolazione totale, F<sub>ST</sub> è definito come<ref>{{Cita pubblicazione|nome = Kent E.|cognome = Holsinger|nome2 = Bruce S.|cognome2 = Weir|data = 2009-09-01|titolo = Genetics in geographically structured populations: defining, estimating and interpreting FST|rivista = Nature Reviews Genetics|volume = 10|numero = 9|pp = 639-650|lingua = en|accesso = 2015-10-14|doi = 10.1038/nrg2611|url = http://www.nature.com/nrg/journal/v10/n9/full/nrg2611.html}}</ref>
: <math> F_{ST} = \frac{\sigma^2_S}{\sigma^2_T} = \frac{\sigma^2_S}{\bar{p}(1-\bar{p})}</math>
: <math> F_{ST} = \frac{\sigma^2_S}{\sigma^2_T} = \frac{\sigma^2_S}{\bar{p}(1-\bar{p})}</math>


Riga 12: Riga 12:
: <math> F_{ST} = \frac{\bar{p}(1-\bar{p})-\sum c_i p_i(1-p_i)}{\bar{p}(1-\bar{p})} = \frac{\bar{p}(1-\bar{p})- \overline{p(1-p)}}{\bar{p}(1-\bar{p})}</math>
: <math> F_{ST} = \frac{\bar{p}(1-\bar{p})-\sum c_i p_i(1-p_i)}{\bar{p}(1-\bar{p})} = \frac{\bar{p}(1-\bar{p})- \overline{p(1-p)}}{\bar{p}(1-\bar{p})}</math>


In alternativa<ref>{{Cita libro|nome = Richard|cognome = Durrett|titolo = Probability Models for DNA Sequence Evolution|url = https://books.google.com/books?id=o4_bMHy7jFoC|accesso = 2015-10-14|data = 2008-12-15|editore = Springer|lingua = en|ISBN = 9780387781693}}</ref>:
In alternativa:
: <math> F_{ST} = \frac{f_0-\bar{f}}{1-\bar{f}}</math>
: <math> F_{ST} = \frac{f_0-\bar{f}}{1-\bar{f}}</math>


dove <math>f_0</math> è la probabilità di identità per discendenza di due individui che sono nella stessa sottopopolazione, e <math>\bar{f}</math> è la probabilità che due individui presi dalla popolazione totale sono identici per discendenza. Usando questa definizione, F<sub>ST</sub> può essere interpretato come una misura per la vicinanza genetica tra due individui della stessa sottopopolazione, rispetto al totale della popolazione. Se il tasso di mutazione è basso, questa interpretazione può essere resa più esplicita collegando la probabilità dell'identità per discendenza ai tempi di coalescenza: T<sub>0</sub> e T denotano il tempo medio di coalescenza per gli individui della stessa sottopopolazione e della popolazione totale, rispettivamente. Quindi,
dove <math>f_0</math> è la probabilità di identità per discendenza di due individui che sono nella stessa sottopopolazione, e <math>\bar{f}</math> è la probabilità che due individui presi dalla popolazione totale sono identici per discendenza. Usando questa definizione, F<sub>ST</sub> può essere interpretato come una misura per la vicinanza genetica tra due individui della stessa sottopopolazione, rispetto al totale della popolazione. Se il tasso di mutazione è basso, questa interpretazione può essere resa più esplicita collegando la probabilità dell'identità per discendenza ai [[Teoria della coalescenza|tempi di coalescenza]]: sia T<sub>0</sub> che T denotano il tempo medio di coalescenza, il primo per gli individui della stessa sottopopolazione e il secondo della popolazione totale. Quindi,


: <math> F_{ST} \approx 1-\frac{T_0}{T}</math>
: <math> F_{ST} \approx 1-\frac{T_0}{T}</math>


Questa formula è maggiormente vantaggiosa in quanto il tempo previsto di coalescenza può facilmente essere stimato in base ai dati genetici, che hanno portato allo sviluppo di diversi stimatori per F<sub>ST</sub>.
Questa formula è maggiormente vantaggiosa in quanto il tempo previsto di coalescenza può facilmente essere stimato in base ai dati genetici, che hanno portato allo sviluppo di diversi stimatori per F<sub>ST</sub>.

== Note ==
[[Categoria:Genetica delle popolazioni]]

Versione delle 16:39, 14 ott 2015

L'indice di fissazione (FST) è una misura di differenziazione delle popolazioni dovuta alla struttura genetica. È spesso valutato in base ai dati dei polimorfismi genetici, come i polimorfismi a singolo nucleotide (SNPs) o i microsatelliti (STRs). Sviluppato come un caso speciale della statistica F di Sewall Wright, è una delle formule statistiche più comunemente usate in genetica delle popolazioni.

Definizione

Due delle definizioni più comunemente usate per l'FST in un determinato locus sono basate sulla varianza di frequenze alleliche tra le popolazioni, e sulla probabilità di identità per discendenza.

Se è la frequenza media di un allele nella popolazione totale, è la varianza nella frequenza dell'allele tra sottopopolazioni diverse, ponderata dalla dimensione delle sottopopolazioni, e è la varianza dello stato allelico nella popolazione totale, FST è definito come[1]

La definizione di Wright mostra che l'FST misura la quantità di varianza genetica che può essere spiegata dalla struttura della popolazione. Può anche essere inteso come la frazione della diversità totale che non è una conseguenza della diversità media all'interno delle sottopopolazioni, dove la diversità è misurata dalla probabilità che due alleli selezionati a caso siano diversi, cioè .

Se la frequenza dell'allele nella esima popolazione è e la dimensione relativa della popolazione esima è , allora

In alternativa[2]:

dove è la probabilità di identità per discendenza di due individui che sono nella stessa sottopopolazione, e è la probabilità che due individui presi dalla popolazione totale sono identici per discendenza. Usando questa definizione, FST può essere interpretato come una misura per la vicinanza genetica tra due individui della stessa sottopopolazione, rispetto al totale della popolazione. Se il tasso di mutazione è basso, questa interpretazione può essere resa più esplicita collegando la probabilità dell'identità per discendenza ai tempi di coalescenza: sia T0 che T denotano il tempo medio di coalescenza, il primo per gli individui della stessa sottopopolazione e il secondo della popolazione totale. Quindi,

Questa formula è maggiormente vantaggiosa in quanto il tempo previsto di coalescenza può facilmente essere stimato in base ai dati genetici, che hanno portato allo sviluppo di diversi stimatori per FST.

Note

  1. ^ (EN) Kent E. Holsinger e Bruce S. Weir, Genetics in geographically structured populations: defining, estimating and interpreting FST, in Nature Reviews Genetics, vol. 10, n. 9, 1º settembre 2009, pp. 639-650, DOI:10.1038/nrg2611. URL consultato il 14 ottobre 2015.
  2. ^ (EN) Richard Durrett, Probability Models for DNA Sequence Evolution, Springer, 15 dicembre 2008, ISBN 9780387781693. URL consultato il 14 ottobre 2015.