Weitere Erläuterungen zum Gebrauch und Interpretation von kanonischen Distanzen
Zusammenfassung
Die kanonischen Distanz als Ergebnis unseres patentierten Auswerteverfahrens liefert eine Zahl als Größenordnung eines mengenmäßigen Vergleichs für die
verschiedensten Versuchssituationen. Sie stellt übersichtlich die Versuchsbedingungen
dar und definieren die Größe eines Versuchsfaktors auf einer
dimensionslosen Skala. Je größer dieser Wert, desto größer ist der Unterschied zur Kontrolle und damit der Behandlungseffekt.
Die kanonischen Distanzen sind bei unserem Verfahren der zentrale Punkt in der quantitativen
Auswertung hyperspektraler Signaturen.
Die kanonischen Distanzen sind das Ergebnis der statistischen Analyse bestehend aus den Modellanpassungen und den
anschließenden multivariaten Verfahren. Die kanonischen Distanzen beschreiben die mittleren Vektoren
in der Diskriminanzfläche, bzw. -raum, der sich aus den
Diskriminanzkoordinaten der Spektren ergibt.
Was macht diesen Wert so bedeutend?
Dieser dimensionslose Wert quantifiziert den Unterschied zwischen zwei
und mehr Merkmalen oder Merkmalsklassen. Er stellt den relativen Unterschied
zwischen den Merkmalen in Form einer über alle Versuchsglieder
vergleichbaren Zahl dar. In den Spektren stecken also Informationen, die den
Versuchsaufbau widerspiegeln und für die Versuchsfrage einen vergleichenden
Wert angibt.
Ähnlich einem multiplen Mittelwertvergleichs kann beurteilt
werden, wie über die Länge des
Pfeils gezeigt werden, wie groß, bzw. intensiv der Versuchseffekt ist. In der Regel deuten
Distanzen größer 2 auf einen signifikanten Unterschied hin (hängt natürlich
von der Streuung ab). Zusätzlich lassen sich visuell die Varianzen
darstellen und sind entsprechend in der Interpretation zu berücksichtigen.
Abb. 1: Kanonische Distanzen von Pathogenbefall im Wein
Beispiel für die Blattkrankheiten im Wein (Abb. 1),
Messungen fanden vor Ausbruch der Krankheiten statt: Die Distanz zwischen der Falschen Mehltau (P. viticola)
Variante und der Kontrolle liegt bei über 3, was ein hoher Wert ist. Im Vergleich eine andere Krankheit, die Schwarzfäule (G. bidiwellii), ebenfalls vor
Ausbruch der Symptome. Auch hier ist die Distanz schon recht hoch, aber etwas kleiner.
Die inokulierten Pflanzen waren schon gestresst und über die Distanzen wird der Grad des Stresses dargestellt.
Abb. 2: Analyse mehrfaktorieller Versuche
Interpretation eines multifaktoriellen Versuches (Abb. 2):
Der erste Faktor (blauer Bereich) ist deutlich unterscheidbar. Er
überlagert die anderen Faktoren. Sowohl innerhalb des 2. Faktors
(grüner Bereich) als auch der 3. Faktor (orangener Bereich) gibt es
keine Unterschiede, die entsprechenden Distanzen sind zu klein. Die
Faktoren 2 und 3 sind leicht tendenziell verschieden, Distanzen
liegen im Grenzbereich, die Faktoren sind visuell erkennbar, aber
die Distanzen sind unterhalb des Signifikanzniveaus.
Abb. 3: Interaktion von Nematoden und Sorteneffekten
Interpretation eines zweifaktoriellen Versuches: Der 1. Faktor
(Sorte) ist deutlich unterscheidbar, die Sorten sind klar abgegrenzt, der 2. Faktor (Nematodendichten)
unterscheiden sich nicht. Die Distanzen innerhalb
einer Gruppe marginal. Eine Unterscheidung in die Populationsklassen
(niedrig, mittel, hoch) ist nicht möglich.
Abb. 4: Einfluss von Nematoden- und Sorteneffekten bei vorgegbenen Interaktionsklassen
Gleiche Versuchsfrage, anderes Jahr,
Darstellung in 12 Merkmalsklassen. Die vorliegenden Nematodendichten
sind in 4 Größenklassen (gering, mittel, hoch, sehr hoch)eingeteilt
(1-4 für die anfällige Sorte 1, 5-8 für resistente Sorte 2 und
9-12 für die tolerante Sorte 3). In Abhängigkeit von der
Sorteneigenschaft können über die hyperspektralen Messungen am
Blattapparat der Zuckerrübe
Rückschlüsse auf die im Boden vorliegende Nematodenpopulation
gemacht werden. Bei der anfälligen Sorte zeigt sich der Einfluss der
Nematodenpopulation am deutlichsten, während der Nematodeneffekt bei
den toleranten/ resistenten Sorten weniger stark ausgeprägt ist.
Abb. 5: Zuchtmerkmalerkennung anhand kanonischer Distanz und Vektorrotation.Der besseren Übersicht halber können die
Vektoren innerhalb der Fläche gedreht werden. Wir setzen damit auf der Nulllinie einen
Kontrollstandard, an dem alle anderen Distanzen sowohl in der Länge als auch
in der Position auf der Diskriminanzfläche verglichen werden können.
Hierbei geht es vor allem um die Unterscheidung von Eigenschaften
einer neuen Sorte, bzw. Zuchtlinie anhand der hyperspektralen
Information. Die Vektoren neuer Zuchtlinien innerhalb des Vertrauenskreises
unterscheiden sich nicht von der Kontrolle, Linien weit außerhalb des
Kreises sind zwar von der Kontrolle entsprechend verschieden, entsprechen aber
nicht mehr der Zuchtzielrichtung, sind genetisch zu weit entfernt. Von Interesse für die Weiterzucht sind die Linien,
deren Vektoren den Vertrauensbereich (hellgrün) berühren.
Abb. 6:Zeitreihen von wiederholten hyperspektralen Messungen, Bsp. Salzstress im ReisDer Vorteil der zerstörungsfreien Methodik besteht
darin, dass viele Hyperspektralmessungen
am gleichen Objekt beliebig oft wiederholt werden können. Über die
Distanzen lässt sich der Versuchsverlauf klar und übersichtlich
darstellen, indem sie auf einer Zeitachse aufgetragen werden. Wie am
Beispiel eines Salzstresses zu sehen ist, ändern sich die Distanzen
über die Zeit entsprechend einer logistischen Funktion und bilden damit die
Dynamik des zunehmenden Stresses ab.
Abb. 7: Zeitreihen von wiederholten hyperspektralen Messungen, Bsp. Krankheitsverlauf von Pflanzenpathogenen
Nicht immer lassen sich die Distanzwerte
1:1 auf eine bekannte Situation übertragen. Infektionskrankheiten folgen
eher einem exponentiellen Verlauf. Auf der Skala der dimensionslosen
Distanzen ergibt sich teilweise ein logistischer Verlauf, das System
erkennt Stresssituationen zwar früher, erreicht aber auch eher eine
obere Sättigung.