Sie sind nicht angemeldet.

  • Anmelden

Lieber Besucher, herzlich willkommen bei: Pure-Reptiles. Falls dies Ihr erster Besuch auf dieser Seite ist, lesen Sie sich bitte die Hilfe durch. Dort wird Ihnen die Bedienung dieser Seite näher erläutert. Darüber hinaus sollten Sie sich registrieren, um alle Funktionen dieser Seite nutzen zu können. Benutzen Sie das Registrierungsformular, um sich zu registrieren oder informieren Sie sich ausführlich über den Registrierungsvorgang. Falls Sie sich bereits zu einem früheren Zeitpunkt registriert haben, können Sie sich hier anmelden.

1

Samstag, 24. Juli 2010, 16:45

Kleiner Workshop zu morphologischen Analysen in der Taxonomie...

Heute habe ich leider nicht so viel Zeit um es vollständig zu machen, aber hier erstmal ein Anfang!


Hallo,

aus aktuellem Anlass mache ich mal hier einen kleinen Workshop über die Analyse von morphologischen Daten (Schuppenzahlen) in der Taxonomie. Oft gibt es Arbeiten, wo solche Methoden verwendet werden und ich möchte mal zeigen, wie man sowas macht und welche Aussagen man daraus ziehen kann und vor allen Dingen warum. Das soll hier keine mathematisch Abhandlung werden, sondern mal ein kleiner Überblick über die Möglichkeiten mit statistischen Methoden eine taxonomische Analyse durchzuführen.

Ich werde bald auch mal ein paar Daten beisteuern und mal an einem einfachen Beispiel praktisch durchspielen wie man so eine Analyse macht. Die mathematischen Grundlagen dazu kommen dann später nach.

Wenn dann noch Interesse besteht, können wir ja auch mal phylogenetische Analysen mit morphologischen Merkmalen durchspielen oder sogar mal eine genetische Analyse (die DNA-Sequenzen liegen vor) durchspielen.

Es gibt verschieden mathematische Verfahren, die sich für eine solche Analyse eignen. Dabei handelt es sich um sogenannte multivariate Verfahren. Das sind mathematische Verfahren, bei denen gleichzeitig mehrere Variablen untersucht werden. Anders als z.B. die univariate Verfahren, bei denen es nur um eine einzelne Variable geht. Das ist notwendig, wenn man bedenkt, dass man von mehreren Tieren mehrere morphologische Merkmale gleichzeitig untersuchen möchte (z.B. von 20 Tieren je drei verschiedene Schuppenzahlen), so dass eine Matrix entsteht.


Darüber hinaus gibt es verschiedene multivariate Verfahren, die für unterschiedliche Fragestellungen in Frage kommen. Einige suchen in einer Matrix von Variablen nach Ähnlichkeiten, andere wiederum nach Unterschieden. Zudem sind aufgrund ihrer mathematischen Berechnungen einige Verfahren nicht geeignet binäre Daten (also 0=abwesend, 1=vorhanden, etwa bei Schuppen oder Zeichnungsmerkmalen) zu verarbeiten. Dummerweise hat man bei einer ausführlichen morphologischen Analyse häufig beide Arten, also nicht binäre – und binäre Daten vorliegen, was die möglichen Verfahren eingrenzt.
Wie geht man also nun generell vor?

1) Merkmale auswählen:
Um von einer Schlange morphologische Merkmale für eine taxonomische Analyse zu ermitteln, sollte man sich vorher mal angeschaut haben, worin sich einzelne Individuen einer Art unterscheiden. So wie der Mensch generell zwei Augen, eine Nase und einen Mund hat, so haben auch Schlangen gewisse Gemeinsamkeiten, die auch sämtliche Individuen einer Art mit sich bringen. Niemand würde wohl auf die Idee kommen eine morphologische Analyse von Menschen anhand des Vorhandenseins solcher Merkmale zu machen, denn diese wären statistisch irrelevant (nicht signifikant), da keine Variation vorhanden ist und somit diese Variable alle untersuchten Individuen gleichermaßen beeinflussen würde. Zehnmal eins ist bleibt auch eins, während neunmal eins und einmal Null schon einen Unterschied macht.

2) Merkmale erfassen:
Hat man sich mal für ein paar Merkmale entschieden, dann sollte man so viele Tiere wie möglich untersuchen und sämtliche Daten notieren. Oft verbringt man Tage und Wochen in Museen und zählt Schuppen an Tieren, die seit vielen Jahren in Alkohol liegen. Bei Schlangen besonders gut sind z.B. die Zahl der Dorsalschuppenreihen (dorsal mid-body rows), die Bauschuppen (Ventralia) und die Schwanzunterschuppen (Subcaudalia). Bei diesen Schuppen tritt innerhalb einer Art immer eine gewisse Variabilität auf, so dass man diese üblicherweise in Bereichen von Min.-Max. angibt (z.B. Morelia spilota: 46-59 Subcaudalia). Die Merkmale sollte immer gleich (an gleicher Stelle mit dem gleichen Gerät) gemessen bzw. gezählt werden. Dazu gibt es einige Regeln (etwa wo die Ventralia an der Halsunterseite anfangen).

3) Datensammlung:
Hat man nun von einer Reihe von Tieren die Daten gesammelt kann man eigentlich mit der Analyse beginnen. Dabei ist die Auswahl des Verfahrens abhängig von der Art der Daten. Wie bereits eingangs erwähnt, gibt es Methoden, die sich nicht für binäre Daten eignen, andere wiederum lassen nur binäre Daten zu. In letzerem Falle kann man dann einen weiteren Schritt einbauen, indem man z.B. sagt:
  • 0: 46-52 Ventralia
  • 1: 53-59 Ventralia
oder sowas wie
  • 0: eine Lorealschuppe vorhanden
  • 1: zwei oder mehr Lorealschuppen vorhanden.
Hat man dann seine Daten so aufbereitet, wie das ausgewählte Verfahren sie erfordert, kann es losgehen.


(Bald folgt dann Teil 2, wo es mit Daten losgeht)

2

Samstag, 24. Juli 2010, 17:06

@PNG,
wie Geil, jetzt "rockt" das Forum!!!
Bin gespannt auf Teil 2! Sehr interessant! :thumbsup:
Friede ist nur dort, wo der vorlaute Mensch sich noch nicht niedergelassen hat.
© Willy Meurer, (*1934)

3

Samstag, 24. Juli 2010, 17:24

Wirklich sehr interessant sowas mal aus erster Hand zu erfahren!!
Bin ebenfalls sehr gespannt auf Teil 2!!!
:thumbsup: :thumbsup: :thumbsup:

4

Samstag, 24. Juli 2010, 17:46

Wirklich sehr interessant sowas mal aus erster Hand zu erfahren!!
Bin ebenfalls sehr gespannt auf Teil 2!!!
Hi
Dem kann ich mich nur anschließen.
Einfach klasse und lesenswert.
So kann auch graue Theorie Spaß machen. :thumbsup:

5

Samstag, 24. Juli 2010, 19:52

absolut interessant!
vielen Dank schonmal für den ersten Teil, ich freu mich auf mehr davon! ;)
Viele Grüße,
Peer

pat-angkor

Moderator

Beiträge: 1 708

Wohnort: Köln/Bonn

Beruf: Student

  • Nachricht senden

6

Samstag, 24. Juli 2010, 20:00

Danke PNG! ;)
Ich kann mich den anderen nur anschließen; sowas ist sehr interessant und hilft auch bei dem Verständnis der Papers. Man hat ja so einige davon auf dem Rechner und bei manchen reicht das pure Lesen ja nicht aus.


Bin gespannt auf die Fortsetzung.


Viele Grüße
patrick

7

Sonntag, 25. Juli 2010, 00:26

Teil 2:

Nun, wo die Daten erfasst und für das ausgewählte Verfahren entsprechend aufbereitet wurden, kann es wie gesagt losgehen. Was man dazu braucht ist ein beliebiges Statistikprogramm (SPSS, SAS oder sonstige Programme, wobei eine Abwandlung bei SPSS Faktoranalyse heißt). Ein für unsere Zwecke recht gutes Programm ist das Freeware-Paket "PAST". Man kann es sich unter PAST herunterladen! Es kann übrigens eine ganze Reihe mehr und ist ein recht komfortables Programm und hat sogar eine eigene Skriptsprache.

Damit das hier nicht ganz so trocken und theoretisch ist, gebe ich mal ein paar Sachen vor, die man dann selber untersuchen kann. Im Dateianhang zu diesem Thread ist eine Pseudolandkarte (Verbreitungsgebiet.jpg) mit Gebieten, aus denen die Tiere stammen, deren Daten ich ebenfalls in einer Datei mit liefere. Die Daten sind in der Datei Beispiel.txt gespeichert, die sich direkt mit PAST öffnen lässt (auch Excel-Dateien lassen sich mit PAST öffnen).

Die Ausgangssituation (Datei: Verbreitungsgebiet.jpg):
Zwischen den rot und blau markierten Gebieten ist eine geographische Barriere, ein Gebirge (grau), welches seit rund 3 Mio. Jahren existiert. Die untersuchte Art muss also schon da gewesen sein, als das Gebirge durch tektonische Plattenverschiebung entstand, denn sonst hätten sie nicht beide Seiten des Gebirges erobern können. Auf dem Gebiet „Gegend_A“ findet sich eine Vielzahl von Nagetieren, die als potentielle Beutetiere fungieren können. „Gegend_A1“ ist zwar nicht durch eine geographische Barriere von „Gegend_A“ getrennt, aber klimatische – und ökologische Faktoren sind hier deutlich unterschiedlich. In dem einen Gebiet sind vorwiegend dichte Wälder, während in der anderen Umgebung eher offenes Grasland vorherrscht. Potentielle Feinde sind hingegen in beiden Gebieten gleich stark vertreten.

Die Fragestellung: Handelt es sich bei der Population „Gegend_B“ um eine morphologisch distinkte Population, also evtl. um eine neue Unterart oder sogar Art? (Über Artkonzepte und Artbildungsmechanismen können wir später noch reden).

Die Daten (Beispiel.dat):
Wenn die Datei geöffnet ist, erscheinen 5 Spalten und 20 Reihen. Die erste Spalte ist rot und blau markiert (jeweils 10) und repräsentiert die untersuchten Tiere entsprechend der Landkarte. Die Zahl gibt die Probenummer an. Da von Gegend_A und Gegend_A1 jeweils nicht so viele Tiere untersucht wurden und auch keine offensichtliche geographische Barriere (Fluß, Gebirge etc.) vorhanden ist, habe ich beide Populationen mal in eine Gruppe (rot) gepackt. Man würde diese als „operational taxonomic unit“ OTU bezeichnen. Solche Zusammenschlüsse von vermeintlich nahe verwandten Gruppen stellen ein Hilfsmittel dar, wenn man aus verschiedenen aber dennoch naheliegenden Gebieten nur wenige Proben untersuchen kann. Die zweite Spalte gibt die Herkunft der Probe (gem. Landkarte) an. Wichtig für uns sind die 3-5 Spalte mit den Überschriften Dorsal, Ventral und Subcaudal, da sie die zu analysierenden Daten enthalten. Um die Sache einfach zu halten, habe ich erstmal nur drei morphologische Merkmale eingebaut.

So, und damit lasse ich Euch für heute erstmal wieder alleine :D Aber es wird weitergehen. Der nächste Teil beschreibt dann, wie man mit PAST eine Analyse durchführt und was die ganzen Dinge zu bedeuten haben. Stay tuned!
»PNGPythonfan« hat folgende Dateien angehängt:
  • Verbreitungsgebiet.jpg (36,38 kB - 34 mal heruntergeladen - zuletzt: 28. April 2013, 22:42)
  • Beispiel.txt (576 Byte - 14 mal heruntergeladen - zuletzt: 28. April 2013, 18:00)

8

Sonntag, 25. Juli 2010, 11:20

Eines der besten/interressantesten Themen die ich in letzter gelesen habe :thumbup:
Bin sehr gespannt wie es weitergeht :popcorn:

9

Sonntag, 25. Juli 2010, 13:12

Eines der besten/interressantesten Themen die ich in letzter gelesen habe

Sehe ich genau so.
Und genau hier bei "Pure-Snakes" das Thema schlecht hin. :thumbsup:

10

Sonntag, 25. Juli 2010, 13:34

Sehr schönes Thema. :thumbup:
Gruß Harald www.Corallus.de

11

Sonntag, 25. Juli 2010, 13:38

Stay tuned![/quote]
Worauf du dich verlassen kannst!
Echt eine spannende Sache......
Habe mir die Daten schonmal abgeschrieben und grob verglichen....
Bin tierisch gespannt darauf, wie es weiter geht!

12

Sonntag, 25. Juli 2010, 14:18

Teil 3:

4) Die Analyse:
Zuerst sollte man sich mal die grundlegende Qualität der gesammelten Daten anschauen. Gibt es Ausreißer, sind die Daten notmalverteilt (Gaußsche Normalverteilung) und sind sie auch statistisch signifikant und wenn ja, wie stark signifikant sind sie (z.B. T-Test mit p<0,5, oder <0,05 oder sogar <0,005)?
Dazu können wir das PAST-Programm verwenden. Im Menü unter „Statistics“ wählt man erstmal den Punkt „Univariate“ aus. So erhält man ein Gefühl für die Daten jeder einzelnen Spalte (Jeweils den Spaltenkopf mit der Maus markieren und dann den Menüpunkt auswählen). Dort sehen wir dann den Min.- und Max.-Wert, den Mittelwert (Mean) sowie die Standardabweichung (Std. error) und die Varianz. Die Standardabweichung sollte möglichst sehr klein sein, dann sind die Daten in der Regel ok (vereinfacht ausgedrückt).
Zum Thema Ausreißer ist übrigens zu sagen, dass wenn man diese Daten von einem Tier ermittelt hat, welches tatsächlich existiert, dann ist es kein Ausreißer, sondern eher ein Produkt der innerartlichen Variabilität! Man sollte sich also hüten irgendwelche „unbequemen“ Daten als Ausreißer zu betrachten und aus der Analyse zu verbannen!

Die miltivariate Analyse:
Markieren der Spaltenköpfe (Dorsal, Ventral und Subcaudal) mit der Maus und gehaltener SHIFT-Taste. Wenn die drei markiert sind, wählt man im Menü des PAST-Programms "Multivar" (für Multivariate Analyseverfahren) aus und dann den zweiten Menüpunkt von oben "Principal coordinates" (Principal coordinate analysis, PCoA). Warum gerade diese Methode ausgewählt wurde, erkläre ich später noch. Es öffnet sich ein Dialogfenster (siehe PAST_Bild_01.jpg).
Der linke rot markierte Bereich gibt Auskunft über die sogenannten Eigenwerte (Eigenvalue) je Achse (1=X-, 2=Y- und 3=Z-Achse, alle weiteren sind eher unwichtig). Daneben stehen die Prozente zu denen jede Achse die Differenzen in den morphologischen Variablen erklärt. Eine genauere Erklärung würde an dieser Stelle zu weit führen, da sie sehr mathematisch ist. Man kann sich das so vorstellen, dass alle Variablen zu allen Proben (also die gesamte Matrix) durch die Methode analysiert wurden und die erste Achse die Unterschiede in der Matrix am besten beschreibt, also in unserem Beispiel erklärt die X-Ache rund 66,6% der Variabilität der Daten. Die Y-Achse erklärt noch 18,7%. In einem zweidimensionalen Koordinatensystem würden somit rund 85% der Variabilität in den Daten. Das ist ein guter Wert, somit kann man auf eine 3-Dimensionale Darstellung der Analyse verzichten. Ein direkte Zuordnung einer Achse zu einer einzelnen Variable, also die X-Achse erklärt die Variabilität in den Dorsalschuppen ist nicht möglich. Das wäre dann wieder eine univariate Analyse, die für unsere Bedürfnisse unpassend wäre.
Der rechte rot markierte Bereich „Similarity Index“ gibt an welcher Algorithmus verwendet wurde. Wir können das bei den Daten, die wir verwenden auf „Euclidean“ stehen lassen. Die mathematischen Hintergründe erkläre ich später noch.
Wenn man nun auf den Button „View scatter“ klickt (unten rechts), erscheint das in PAST_Bild_02.jpg angegebene Fenster. Das ist die graphische Auswertung der Analyse und zeigt eine Punktwolke. Dabei sind die roten Symbole die Proben aus der „Gegend_A“ und der „Gegend_A1“, die blauen aus der „Gegend_B“. Mit dem Häkchen „Row labels“ kann man sich die einzelnen Probenummern anschauen. Nun versucht mal das Häkchen „95% ellipses“ anzuklicken. Er bilden sich zwei Kreise um die Symbole, die den Vertrauensbereich der Daten mit 95% ansetzen. Je weniger Vertrauensbereich (in Prozent), desto größer würden die Kreise werden. Hier gibt es aber nur die 95%, da das ein Standard ist! Wir sehen nun, dass viele Proben in dem blauen Kreis liegen, einige jedoch im roten. Schaut Euch nun mal an, welche Proben da rausgefallen sind, und schaut Euch in den Daten mal an, aus welcher Gegend diese Proben stammen. Ihr werdet feststellen, dass sie aus der „Gegend_A1“ stammen. Somit haben wir schon eine erste Aussage: Die Population der „Gegend_A“ ist distinkt von der „Gegend_A1“, allerdings ist die „Gegend_B“ morphologisch identisch mit der „Gegend_A“.

Was stellt ihr fest?

Und wieder Stay tuned!
Im folgenden werde ich noch ein einige echte Arbeiten eingehen, die mit eben solchen multivariaten Methoden gemacht wurden. Dann können wir auch die Unterschiede der Methoden diskutieren...
»PNGPythonfan« hat folgende Dateien angehängt:
  • PAST_Bild_01.jpg (211,14 kB - 30 mal heruntergeladen - zuletzt: 29. April 2013, 20:35)
  • PAST_Bild_02.jpg (90,69 kB - 31 mal heruntergeladen - zuletzt: 29. April 2013, 20:35)

13

Sonntag, 25. Juli 2010, 14:46

Aber es stammen doch nicht alle aus A1.
Nummer 7 kommt doch aus dem Gebiet A.

Was ich sonst noch feststelle?
Langsam wird es komplizierter :muhahaha:

Aber im Ernst.
Ich muss zugeben, dass mir jetzt nix Weiteres aufgefallen ist,
abgesehen davon das, wie du schon erwänht hast,
alle Proben, die rausgefallen sind, aus dem Gebiet A1 kommen.
(Abgesehen von Probe Nr. 7)
Was ja auch Sinn machen würde, wenn das Gebiet A1 andere klimatische und geographische Verhältnisse hat, als das Gebiet A.
Demnach könnten die Tiere aus Gebiet A1 ja auch andere Anpassungen an ihren Lebensraum genommen haben als die Tiere aus Gebiet A
und sich so mit der Zeit anders entwickelt haben.

Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von »ReNe81« (25. Juli 2010, 15:02)


14

Sonntag, 25. Juli 2010, 17:10

Was stellt ihr fest?

Das dass Gebiet B an sich zu klein und homogen ist um eine genetische Divergenz herzuführen

-> Population B identisch mit der "Ursprungspopulation" vor Entstehung der Gebirgskette sein muss !?

Im Gegenzug das Gebiet A und A1 anhand der Größe der zu besiedelneden Fläche und der eigentlichen Habitats-Unterschiede bessere Grundgegebenheiten zur Bildung einer möglichen "Unterart" bieten.

Aber müssten bei so einer Analyse nicht exakt dieselbe Anzahl von Tieren aus allen 3 Gebieten untersucht werden ?

15

Sonntag, 25. Juli 2010, 19:18

Was für ein geiles Thema !!!! mir ziehts die Schuh grad aus 8) RESPECT :good-posting:

16

Sonntag, 25. Juli 2010, 22:17

Hi,

Zitat

Aber es stammen doch nicht alle aus A1.
Nummer 7 kommt doch aus dem Gebiet A.


Hmm, da hast Du natürlich Recht :D Nennen wir es innerartliche Variabilität oder das Auftreten einer Gradationszone, als einer Zone wo sich beide Populationen treffen. Da das die "GEGEND_A" ja recht groß ist, könnte die Probe Nr. 7 doch aus der Nähe der "GEGEND_A1" stammen, oder?

Zitat

Was ja auch Sinn machen würde, wenn das Gebiet A1 andere klimatische und geographische Verhältnisse hat, als das Gebiet A.Demnach könnten die Tiere aus Gebiet A1 ja auch andere Anpassungen an ihren Lebensraum genommen haben als die Tiere aus Gebiet A

und sich so mit der Zeit anders entwickelt haben.


Jepp, oder sowas ist auch möglich!

Zitat

Das dass Gebiet B an sich zu klein und homogen ist um eine genetische Divergenz herzuführen


Wir reden ja gerade eben nicht von einer genetischen Divergenz, sondern von äußerlichen, also morphologischen Merkmalen. Das sich zwei genetisch sehr ähnliche Populationen, die sich jedoch morphologisch voneinander unterscheiden auftreten kann verschiedene Ursachen haben:
- Es besteht kaum ein Selektionsdruck, so dass eine genetische Veränderung oder adaptive Prozesse nicht unbedingt vermuten muß.
- Da wir in diesem sehr kleinen Beispiel ja nur Dorsal, Ventral und Subcaudalschuppen enthalten haben, können auch andere Faktoren eine Rolle für die morphologische Veränderung ausschlaggebend gewesen sein: Die Ventralschuppen sind, abgesehen von gewissen Anomalien, ja direkt mit den Wirbeln verbunden, also ist die Anzahl der Ventralschuppen gleich der Anzahl an Wirbeln. Mehr Ventralschuppen heißt mehr Wirbel, und damit eine bessere Fortbewegung, was letztendlich zu einer höheren Fittness führt und nach Darwin somit solche Individuen begünstigt. Größere Individuen haben auch häufiger mehr Wirbel und damit mehr Ventralia. Größere Individuen können in z.B. kühleren Gegenden oder in Höhenlagen vor, da größere Körper weniger Probleme damit haben zu thermoregulieren.

Was die Größe der Gebiete angeht, so wissen wir ja nicht, wie groß das Gebiet ist. Es ist fiktiv und es ist kein Maßstab angegeben. "GEGEND_A" könnte z.B. China sein und "GEGEND_A1" Vietnam, während "GEGEND_2" evtl. Nepal sein könnte.

Zitat



-> Population B identisch mit der "Ursprungspopulation" vor Entstehung der Gebirgskette sein muss !?

Im Gegenzug das Gebiet A und A1 anhand der Größe der zu besiedelneden Fläche und der eigentlichen Habitats-Unterschiede bessere Grundgegebenheiten zur Bildung einer möglichen "Unterart" bieten.


Eben, deshalb hatte ich das Beispiel auch so gewählt. Es zeigt nämlich, dass nicht immer eine geographische Barriere, also ein breiter Fluss oder ein Gebirge zwingend zu einer divergenten Population führen muss. Ökologische Faktoren spielen ebenfalls eine wichtige Rolle. Dicht bewaldete Gebiete etwa lassen kaum Sonnenstrahlen zur Thermoregulation durch, während offene Graslandschaft dieses tut. Höhere bevorzugte Körpertemperaturen bedeuten in der Regel schnellere Verdauung, optimale Funktion des Organismus (Enyzmaktivität, Hormonausschüttung, etc.), so dass das Tier schneller wieder fressen kann, also in einer Zeiteinheit gegenüber anderen Populationen mehr Nahrung zu sich nehmen und damit größer werden kann. Nach Darwin erhöht das wiederum die Fitness und bietet damit einen evolutionären Vorteil. Wie bereits erwähnt, oft gibt es kaum Veranlassungen sich anzupassen (kein oder nur sehr geringer Selektionsdruck), da z.B. die Prädatoren in der GEGEND_B fehlen (vielleicht weil diese es nicht über die Gebirgskette geschafft haben). Zwar ist die GEGEND_B-Population allopatrisch, also eine isolierte Population, was sie nach gewissen Artkonzepten durchaus dazu berechtigen würde als eigene Art aufgestellt zu werden (da keinerlei Genfluss mit anderen Populationen sowie faktisch eine reproduktive Isolation herrscht),
aber wenn sie sich weder genetisch noch morphologisch deutlich von anderen Popualtionen unterscheidet, macht sich der Wissenschaftler eher lächerlich. Wäre diese GEGEND_B-Population allerdings morphologisch sehr ähnlich der von GEGEND_A, aber dafür genetisch distinkt, hätten wir den Fall einer kryptischen Art. Das ist das gleiche wie bei Morelia viridis und Morelia azurea. Morphologisch sind beide kaum zu unterscheiden, genetisch aber deutlich!



Zitat

Aber müssten bei so einer Analyse nicht exakt dieselbe Anzahl von Tieren aus allen 3 Gebieten untersucht werden ?


Das ist sicherlich kein Muß, sondern eher ein Idealfall. Oftmals hat man aber nicht die Möglichkeit von überall gleichviele Tiere zu untersuchen. Der verwendeten multivariaten Methode ist das auch herzlich egal, denn sie schaut nach Gemeinsamkeiten bzw. Unterschiede zwischen allen Proben, ohne zu wissen woher sie stammen. Aber ja, je mehr Proben man von jedem Gebiet hat, desto genauer kann die Analyse letztendlich ausgewertet werden.




Interessant jedoch, dass hier einige offenbar schon mit Wissen aufwarten oder einfach den gesunden Menschenverstand einsetzen. Das erleichtert die Arbeit ungemein!
Vielleicht sollten wir uns mal mit realen Papers auseinander setzen. Hier mal ein paar Beispiele. Diese Arbeiten basieren auf multivariate Methoden. Man nennt solche Analysen morphometrische Analysen:


WÜSTER, W., YRAUSQUIN, J.L., AND MIJARES-URRUTIA, A. 2001. A NEW SPECIES OF INDIGO SNAKE FROM NORTH-WESTERN VENEZUELA (SERPENTES: COLUBRIDAE: DRYMARCHON). HERPETOLOGICAL JOURNAL, Vol. 11, pp. 157-165

Henderson, R.W., Passos, P., and Feitosa, D. 2009. Geographic Variation in the Emerald Treeboa,Corallus caninus (Squamata: Boidae). Copeia 2009, No. 3, 572–582

Schleip, W.D. 2008. Revision of the Genus Leiopython Hubrecht 1879 (Serpentes: Pythonidae) with the Redescription of Taxa Recently Described by Hoser (2000) and the Description of New Species. Journal of Herpetology 42(4):645–667.

In einem weiteren Teil, werde ich dann mal auf die Verfahren und die Methoden jeder der Arbeiten etwas detailierter eingehen, damit klar wird, was da gemacht wurde und wie. Aber nicht mehr heute :D

17

Montag, 26. Juli 2010, 08:13

Jetzt gehts ans Eingemachte:
WÜSTER, W., YRAUSQUIN, J.L., AND MIJARES-URRUTIA, A. 2001. A NEW SPECIES OF INDIGO SNAKE FROM NORTH-WESTERN VENEZUELA (SERPENTES: COLUBRIDAE: DRYMARCHON). HERPETOLOGICAL JOURNAL, Vol. 11, pp. 157-165


Wüster et al. verwenden 17 morphologische Merkmale in ihrer Analyse. Diese umfassen die Anzahl der Ventralia, Subcaudalia, die vorderen und hinteren Temporalschuppen usw. (siehe Table 1), sowie einige binär kodierte (0: abwesend, 1: anwesend) Parameter wie etwa das Vorhandensein von schwarzen Markierungen am Hals, helleren Schuppen etc. sowie Relationen von Schuppenreihen (%VS position), um eine Vergleichbarkeit dieser Parameter herzustellen.



Als multivariates Verfahren verwenden sie die häufig verwendete Principal Component Analysis (PCA), oder auf Deutsch Hauptkomponentenanalyse.


Streng genommen sind bei dieser Methode einige mathematische Bedingungen an die Datenmatrix zu stellen, die jedoch oft vernachlässigt werden, ohne das die primäre Aussage dabei verletzt wird. So setzt die PCA z.B. eine multivariate Normalverteilung (Gaußsche Verteilung) aller Daten voraus, was natürlich bei binär kodierten Daten (0 und 1) nicht möglich ist. Beim Vorhandensein solcher Daten wäre also dieses Verfahren streng genommen nicht verwendbar! Allerdings ist der Fehler, der sich daraus ergibt gering, so dass man das Risiko eingeht.


Übrigens kann das PAST-Programm dieses Verfahren ebenfalls. Ihr könnt auch gerne mal unsere Beispieldaten in PAST laden und das mal probieren (Menü Multivar => Prinicpal components, der erste Eintrag oben) und das mal mit der von mir vorgeschlagenen Principal coordiante Analys vergleichen. Da wir keine binär kodierten Daten verwenden, sollte das Ergebnis recht ähnlich aussehen.


Bei Wüster et al. kann man in Tabelle 3 sehr schön die Eigenwerte (Eigenvalues) sehen, die anders als die PCoA hier direkt auf die Variablen wirken und diese daher angegeben sind.


Die Aussage in Tabelle 3 ist die folgende:
PC1 stellt die X-Achse dar, PC2 die Y-Achse (siehe Abbildung 3). Die Werte zu jeder Variablen für jede Achse zeigt, wie gut jede Achse die Variabilität der Variable im gesamten Datensatz (Maxtrix) erklärt. Je höher (positiv oder negativ) der Eigenwert, desto besser ist die Erklärung. Dabei heißt Erklärung wie groß der Einfluss dieser Variable auf die Verschiebungen der Proben entlang der jeweiligen Achse ist.
Bevor ihr nun weiter lest, schaut Euch mal die Tabelle 3 an und da welche Zahlen (positiv oder negativ) am höchsten sind!


Auflösung:
Bei Wüster et al. beeinflussen z.B. die Parameter 14 („Ventral color change“), Parameter 12 („Oblique bars on the neck“) und Parameter 15 („Underside of tail“) am stärksten die Position der Symbole entlang der X-Achse (PC1), während auf die Parameter 13, 16, 6,8,9, und 1 die Positionen der Symbole entlang der Y-Achse (PC2) am stärksten beeinflussen. Die drei unterschiedlichen Symbole (Raute, Karo und Kreise) in Abbildung 3 stellen die drei Arten dar, wobei man nicht von Anfang an von diesen Arten ausgeht, sondern einfach erst mal nach Verbreitungsgebiet einteilt. Dass die Analyse die drei verschiedenen Verbreitungsgebiete in dem Punktwolkendiagramm gut trennt, kann man ja nicht wissen. Das genau gilt es ja zu untersuchen und zu beweisen. Die beiden Kreise, die Wüster et al.s neue Art symbolisieren sollen sind sehr weit von den anderen Symbolen entfernt. Damit hat man einen visuellen Beweis, dass die morphologischen Daten die gesammelt wurden von denen der anderen Arten differieren!


Wüster et al. schreiben, was wir ja schon ermittelt hatten:


„Separation along this axis [PC1] is primarily related to variation in the patterns of colour change along the dorsum, the presence or absence of oblique black bars on the neck, and colour change along the ventral surface… Separation of specimens along the second axis [PC2] is mostly related to the presence of individual pale scales, and also the number of ventrals, the position of caudal scale reductions, and the presence or absence of dark edges along the supralabials…“.

Genau die Parameter, die hier am ehesten die Differenz ausmachen, werden dann als diagnostische Merkmale zur Unterscheidung der Arten verwendet. Entweder einzeln oder in Kombination!


So, das war der erste Teil der Analyse von realen Papers... Die anderen beiden dürften jetzt schon etwas klarer werden, aber ich bespreche diese auch noch.


Viel Spaß beim Lesen...

18

Montag, 26. Juli 2010, 10:02

Vielleicht ist noch nicht so ganz klar geworden, wieso man multivariate Verfahren einsetzt:

Hat man nur einen Parameter (z.B. die Anzahl an Ventralschuppen) bei einer Reihe von Tieren ermittelt, kann man anhand dieser Daten lediglich einen Min.-Wert und einen Max.-Wert ermittelt so wie einen Mittelwert.

Für unsere Beispieldaten ließe sich also eine Aussage für alle Proben machen wie: Die Ventralia liegen in einem Bereich von 219-231 Schuppen mit einem Mittelwert von rund 227 Schuppen (N=20 Proben). Man könnte die Daten auch aufteilen nach dem Verbreitungsgebiet, dann würde da folgendes herauskommen:


  1. GEGEND_A: (N= 4 Proben): Ventralia 224-227, Mittelwert 226
  2. GEGEND_A1: (N=6 Proben): Ventralia: 219-226, Mittelwert 224
  3. GEGEND_B: (N=10 Proben): Ventralia 226-231, Mittelwert 229

Das wäre dann eine univariate Analyse der Daten, da wir ja nur eine Variable haben. Eine mutlivariate Analyse setzt aber mehrere Variablen miteinander in Relation. Das Ziel ist es, eine komplexe Datenmatrix zu vereinfachen. Das geschieht über die Eigenwerte, die im Grunde genommen ja ein Index für die Relation meherer Variablen zueinander ist, allerdings haben wir nur eine Zahl anstatt 100 Proben x 5 Variablen. Man kann sich das etwa wie eine Ableitung vorstellen. Aus einer x^3-Funktion macht die erste Ableitung eine x^2-Funktion und die Ableitung dieser eine x-Funktion. Damit läßt sich leichter rechnen ;-) Hin zur Linearität, aus man macht aus einer Hyperbel eine Parabel und dann eine Gerade. Ein Gerade ist einfach, da sie keine Extrema oder Wendepunkte hat sondern sich über zwei Punkte definieren läßt (Grüße an die, die Kurvendiskussion in der Oberstufe gehasst haben!).

Zwar kann man das, was wir mit den Ventralia gemacht haben natürlich für jede morphologische Variable machen, aber dabei betrachtet man ja nur jede Variable für sich, nicht aber die Relationen zueinander.

Bis später....

19

Montag, 26. Juli 2010, 11:42

Erstmal nochmal ein dickes Dankeschön, dass Du dir die Mühe machst!!!
Echt super interessant! :thumbsup: :thumbsup: :thumbsup:

20

Montag, 26. Juli 2010, 16:28

Das ist schon starke, wenn auch spitzenmäßige Kost.
Ich brauche da eher zwei Tage länger für.
Mag aber auch am Alter liegen. Sieht aber gut aus. :thumbup: