4.6 Covariantie en correlatie
Twee kenmerken kunnen een bepaalde relatie hebben. Bijvoorbeeld wanneer een waarde voor kenmerk één hoog is, zie je altijd dat kenmerk twee ook hoog is (zie figuur 2, de relatie tussen borstomvang en levend gewicht in koeien). Ook het omgekeerde kan gebeuren, dus wanneer kenmerk één hoog is, is kenmerk twee laag (zie figuur 2, de relatie tussen levend gewicht en voederconversie in varkens). De relatie kan ook zwak zijn (zie figuur 2, de zwakke relatie tussen levend gewicht en prijs bij vleeskoeien). Deze relaties kunnen veroorzaakt worden omdat deze eigenschappen (gedeeltelijk) zijn gebaseerd op het functioneren van dezelfde genen. In dierfokkerij gebruiken we vaak de covariantie, correlatie of regressie voor de statistische beschrijvingen om relaties tussen kenmerken vast te leggen.
In statistische termen is de covariantie gelijk aan: cov(x,y) = E(xy) – E(x)* E(y)
Waar E voor de verwachting staat, die berekend kan worden als de som van de waarneming gedeeld door het aantal observaties.
De relatie tussen twee eigenschappen wordt in dierfokkerij meestal beschreven als de correlatie tussen eigenschap x en y.
In statistische termen is de geschatte correlatie: r(x,y) = cov (x,y) / (st dev x * st dev y)
De correlatie wordt beschreven als r en heeft een waarde tussen -1 en +1. Een positieve waarde betekent dat twee eigenschappen positief zijn gecorreleerd: hoge waardes van eigenschap x gaan in de meeste gevallen samen met hoge waardes voor eigenschap y (als r = +1 dan is het altijd zo). Een negatieve r betekent dat hoge waardes van eigenschap x samengaan met lage waarden van eigenschap y.
Het onderstaande schema illustreert in grafiekjes de relaties (correlaties) tussen twee eigenschappen voor drie verschillende combinaties van kenmerken:
Het is erg belangrijk te begrijpen dat de correlatie niet de oorzaak en gevolg of het resultaat aangeeft. Levend gewicht in varkens is niet direct de oorzaak van een lage voederconversie in varkens (het derde voorbeeld uit bovenstaande figuur) of andersom. De correlatie geeft alleen aan dat er een relatie tussen twee eigenschappen bestaat. Wanneer deze relatie is gebaseerd op bijvoorbeeld het functioneren van dezelfde genen, kan deze relatie gebruikt worden in dierfokkerij.