Gültigkeit

Paula Grünenfelder April 7, 2016 G 0 0
FONT SIZE:
fontsize_dec
fontsize_inc

In Wissenschaft und Statistik ist Gültigkeit der Umfang, in dem ein Konzept, Abschluss oder Messung ist fundiert und entspricht genau in die reale Welt. Das Wort "gültig" ist von dem lateinischen validus abgeleitet und bedeutet stark. Die Gültigkeit eines Messwerkzeug wird als der Grad sein, die das Werkzeug misst, was es vorgibt zu messen.

In Psychometrie, Gültigkeit hat eine bestimmte Anwendung als Test Gültigkeit bekannt: "das Ausmaß, in dem Beweise und Theorien unterstützen die Interpretation der Testergebnisse".

Im Bereich der wissenschaftlichen Forschung und Experimente Design bezieht Gültigkeit, ob eine Untersuchung in der Lage ist, um die Fragen es beabsichtigt ist, zu beantworten wissenschaftlich beantworten.

In klinischen Bereichen, die Beurteilung der Gültigkeit einer Diagnose und verschiedene Diagnosetests sind extrem wichtig. Als Diagnose erweitert Behandlungen, Medikamente und das Leben des Patienten, ist es äußerst wichtig zu wissen, dass beim Ausführen von Diagnosetests, die Ärzte sind wirklich zu testen, was sie wollen, um zu testen.

Es ist allgemein anerkannt, dass das Konzept der wissenschaftlichen Gültigkeit befasst sich mit der Natur der Wirklichkeit und als solche ist eine erkenntnistheoretische und philosophische Frage sowie eine Frage der Messung. Die Verwendung des Begriffs in der Logik ist schmaler, in Bezug auf die Wahrheit der Folgerungen aus eigener Herstellung.

Gültigkeit ist wichtig, weil sie helfen kann bestimmen, welche Arten von Tests zu verwenden, und helfen, um sicherzustellen, dass Forscher mit Methoden, die nicht nur ethische und kosteneffizient sind, sondern auch ein Verfahren, das wirklich misst die Idee oder das Konstrukt in Frage.

Gültigkeit der Prüfung

Zuverlässigkeit und Gültigkeit

Gültigkeit einer Prüfung ist der Grad, in dem sie misst, was es messen soll. Dies ist nicht dasselbe wie Zuverlässigkeit, die das Ausmaß, in dem eine Messung liefert Ergebnisse, die konsistent sind. Innerhalb des Gültigkeits, wird die Messung nicht immer gleich groß sind, wie es in der Zuverlässigkeit funktioniert. Als ein Maß sowohl gültig als auch zuverlässig, werden die Ergebnisse, wie in der Grafik auf der rechten Seite angezeigt. Allerdings nur, weil ein Maß zuverlässig ist, ist es nicht notwendigerweise gültig ist. Gültigkeit ist auch abhängig von der Messung Messung, was es war etwas, das Messen, und nicht anders statt. Gültigkeit ist auf Fragen der Grad der Basis; Gültigkeit ist nicht alles oder nichts Idee. Es gibt viele verschiedene Arten von Gültigkeit.

Eine frühe Definition von Test Gültigkeit identifiziert sie mit dem Grad der Korrelation zwischen dem Test und Kriterium. Nach dieser Definition kann man diese Zuverlässigkeit des Tests zeigen, und das Kriterium legt eine Obergrenze für die mögliche Korrelation zwischen ihnen. Intuitiv dies spiegelt die Tatsache wider, dass die Zuverlässigkeit beinhaltet Freiheit von Zufallsfehler und zufällige Fehler nicht miteinander korrelieren. Somit wird die weniger zufällige Fehler in den Variablen, desto höher die mögliche Korrelation zwischen ihnen. Unter diesen Definitionen kann ein Test keine Gültigkeit, es sei denn Hoch es hat auch eine hohe Zuverlässigkeit. Allerdings hat der Begriff der Gültigkeit wesentlich über diese frühe Definition und die klassische Beziehung zwischen Zuverlässigkeit und Gültigkeit erweitert braucht nicht für alternative Vorstellungen der Zuverlässigkeit und Gültigkeit zu halten.

Innerhalb der klassischen Testtheorie, können vorausschauende oder gleichzeitige Gültigkeit der Quadratwurzel aus der Korrelation zwischen zwei Versionen des gleichen Maß, das ist, Zuverlässigkeit Grenzen Gültigkeit nicht überschreiten.

Konstruktvalidität

Konstruktvalidität bezieht sich auf das Ausmaß, in dem Operationalisierungen eines Konstrukts haben tatsächlich zu messen, was die Theorie sagt, was sie tun. Zum Beispiel, in welchem ​​Umfang ist ein Fragebogen tatsächlich gemessen "Intelligenz"?

Konstruktvalidität Nachweis beinhaltet die empirische und theoretische Unterstützung für die Auslegung des Konstrukts. Eine solche Beweislinien umfassen statistische Analysen der internen Struktur des Tests einschließlich der Beziehungen zwischen den Reaktionen auf verschiedene Prüflinge. Sie umfassen auch die Beziehungen zwischen dem Test und Maßnahmen der anderen Konstrukten. Wie sie derzeit verstanden, Konstruktvalidität ist nicht verschieden von der Unterstützung für die inhaltliche Theorie der Konstrukt, das der Test wurde entwickelt, um zu messen. Als solche Experimente entwickelt, um Aspekte der kausale Rolle des Konstrukts offenbaren auch zur Gültigkeits Beweise zu konstruieren.

Konvergente Validität

Konvergente Validität bezieht sich auf das Ausmaß, in dem eine Maßnahme mit anderen Maßnahmen, die es theoretisch vorhergesagt, um zu korrelieren korreliert.

Diskriminanzvalidität

Diskriminanzvalidität testet, ob Konzepte oder Messungen, die angeblich nichts zu tun sein werden, sind in der Tat in keinem Zusammenhang.

Inhaltsvalidität

Inhaltsvalidität ist eine nicht-statistische Art von Gültigkeit, das beinhaltet "die systematische Untersuchung der Testinhalte zu bestimmen, ob es deckt eine repräsentative Probe des Verhaltens Domäne zu messen". Zum Beispiel kostet ein IQ-Fragebogen haben Produkte, die alle Bereiche der Intelligenz in der wissenschaftlichen Literatur diskutiert?

Inhaltsvalidität Beweise beinhaltet das Ausmaß, in dem der Inhalt des Tests ein Content-Domäne mit dem Konstrukt verbunden sind einstimmt. Zum Beispiel sollte ein Test für die Fähigkeit, zwei Zahlen zu addieren beinhalten eine Reihe von Kombinationen von Ziffern. Ein Test mit nur einem stellige Zahlen, oder nur gerade Zahlen, hätte nicht eine gute Abdeckung des Inhalts Domäne. Inhaltliche Beweise umfasst in der Regel Fachexperten Auswertung Prüflinge gegen die Testspezifikationen.

Ein Test hat inhaltliche Gültigkeit durch sorgfältige Auswahl hinein gebaut, deren Einzelteile zu umfassen. Einzelteile werden so gewählt, dass sie mit dem Test-Spezifikation, die sich durch eine gründliche Auseinandersetzung mit dem Thema Domain gezogen wird einhalten. Foxcroft, Paterson, le Roux & amp; Herbst beachten Sie, dass durch die Verwendung eines Expertenrunde, um die Testspezifikationen und die große Auswahl der Inhalt Gültigkeit eines Tests verbessert werden kann überprüfen. Die Experten in der Lage, die Einzelteile zu überprüfen und zu kommentieren, ob die Elemente umfassen eine repräsentative Probe des Verhaltens Domäne.

Darstellung Gültigkeit

Darstellung Gültigkeit, auch als Übersetzung Gültigkeit bekannt ist, ist über das Ausmaß, in dem ein abstraktes theoretisches Konstrukt kann in eine spezifische praktische Prüfung eingeschaltet werden

Augenscheinvalidität

Augenscheinvalidität ist eine Schätzung, ob eine Test scheint einem bestimmten Kriterium zu messen; es garantiert nicht, dass der Test tatsächlich misst Phänomene in dieser Domäne. Die Maßnahmen können Hoch Gültigkeit haben, aber, wenn der Test nicht scheinen zu messen, was es ist, niedrige Gesicht Gültigkeit hat. In der Tat, wenn ein Test unterliegt Fälschung könnte niedriger Augenscheinvalidität machen Sie den Test mehr gültig. Angesichts einer möglicherweise mehr ehrliche Antworten mit Unterseite Gültigkeit zu bekommen, ist es manchmal wichtig, den Anschein zu erwecken, als gäbe es niedrige Gesicht Gültigkeit, während die Verwaltung der Maßnahmen.

Augenscheinvalidität ist sehr eng mit Inhaltsvalidität verwandt. Während Inhaltsvalidität hängt davon ab, eine theoretische Grundlage für die Annahme, ob ein Test prüft alle Domains eines bestimmten Kriteriums Gesicht Gültigkeit betrifft, ob eine Test scheint eine gute Maßnahme sein oder nicht. Diese Beurteilung wird auf dem "Gesicht" des Tests vorgenommen, so kann es auch durch das Amateur beurteilt werden.

Augenscheinvalidität ist ein Ausgangspunkt, aber sollte nie davon ausgegangen, wahrscheinlich zu einem bestimmten Zweck gültig sein werden, wie die "Experten" waren falsch, bevor der Malleus Malificarum hatte keine Unterstützung für andere als die Selbst vorgestellt Zuständigkeit von zwei "Experten seinen Schlussfolgerungen "in" Hexenerkennung, Test "noch es als verwendet wurde," "zu verurteilen und auf dem Scheiterhaufen Zehntausende Frauen verbrennen als" Hexen. "

Kriteriumsvalidität

Kriterienvalidität Nachweis setzt die Korrelation zwischen dem Test und eine Kriteriumsvariable als repräsentativ für das Konstrukt aufgenommen. Mit anderen Worten, den Test mit anderen Maßnahmen oder Ergebnisse bereits entschieden, um gültig zu sein vergleicht sie. So werden beispielsweise Mitarbeiter von Auswahltests häufig gegen Maßnahmen der Arbeitsleistung validiert und IQ-Tests werden häufig gegen Maßnahmen der schulischen Leistungen validiert.

Wenn die Testdaten und Kriterium Daten werden zur gleichen Zeit erhoben, wird dies als gleichzeitige Gültigkeit Beweise bezeichnet. Wenn die Testdaten werden zunächst um Kriterium Daten zu einem späteren Zeitpunkt gesammelt vorherzusagen gesammelt, dann wird dies als prognostische Validität Beweise bezeichnet.

Concurrent Gültigkeit

Concurrent Gültigkeit bezieht sich auf das Ausmaß, in dem die Operationalisierung korreliert mit anderen Maßnahmen aus dem gleichen Konstrukt, das zur gleichen Zeit gemessen werden. Wenn die Maßnahme auf eine andere Maßnahme des gleichen Typs verglichen werden, werden sie in Verbindung stehen. Rückkehr in den Auswahltest Beispiel würde dies bedeuten, dass die Tests zu aktuellen Mitarbeitern verabreicht und dann mit ihren Partituren auf Leistungsbeurteilungen korreliert.

Prognostische Validität

Prognostische Validität bezieht sich auf das Ausmaß, in dem die Operationalisierung können andere Maßnahmen aus dem gleichen Konstrukt, das zu einem bestimmten Zeitpunkt in der Zukunft gemessen werden, vorherzusagen. Auch bei der Auswahl Test Beispiel würde dies bedeuten, dass die Tests für Bewerber verabreicht, alle Bewerber angestellt sind, ist ihre Leistung zu einem späteren Zeitpunkt überprüft, und dann ihre Ergebnisse auf die beiden Maßnahmen miteinander korrelieren.

Dies gilt auch, wenn die Messung prognostiziert eine Beziehung zwischen dem, was gemessen wird, und etwas anderes; Vorhersage, ob die andere Sache, die in der Zukunft passieren wird. Diese Art von Gültigkeit ist wichtig, von einer öffentlichen Ansicht Standpunkt; das wird für die Öffentlichkeit sucht akzeptabel ist oder nicht?

Experimentelle Gültigkeit

Die Gültigkeit der Gestaltung der experimentellen Studien ist ein grundlegender Bestandteil der wissenschaftlichen Methode, und ein Anliegen der Forschungsethik. Ohne gültige Design, können gültige wissenschaftliche Schlüsse gezogen werden.

Statistische Schlussfolgerung Gültigkeit

Statistische Schlussfolgerung Gültigkeit ist das Ausmaß, die Rückschlüsse über die Beziehung zwischen Variablen basierend auf den Daten zu korrigieren oder "angemessen" sind. Dies begann als nur darüber, ob die statistische Aussage über die Beziehung der Variablen korrekt war, aber jetzt gibt es eine Bewegung hin zu bewegen, um "angemessen" Schlussfolgerungen, zu verwenden: quantitative, statistische und qualitative Daten.

Statistische Schlussfolgerung Gültigkeit beinhaltet die Gewährleistung der Anwendung geeigneter Stichprobenverfahren, geeignete statistische Tests und zuverlässige Messverfahren. Da diese Art von Gültigkeit ist ausschließlich mit der Beziehung, die zwischen den Variablen gefunden betroffen ist, kann die Beziehung nur eine Korrelation sein.

Interne Validität

Interne Validität eine induktive Schätzung der Grad, in dem Aussagen über kausale Zusammenhänge kann gemacht werden, bezogen auf die eingesetzten Maßnahmen, Forschungseinstellung und die gesamte Forschungsdesign. Gute experimentelle Techniken, bei denen die Wirkung einer unabhängigen Variablen auf eine abhängige Variable wird unter streng kontrollierten Bedingungen untersucht, in der Regel erlauben höhere Grade der internen Validität als beispielsweise Einzelfall Designs.

Acht Arten von verwirrende Variable kann mit internen Validität beeinträchtigen:

  • Geschichte, die bestimmte Ereignisse zwischen der ersten und der zweiten Messung auftretenden neben den experimentellen Variablen
  • Reifung, Prozesse innerhalb der Teilnehmer in Abhängigkeit von der Zeit, beispielsweise immer älter, hungriger, mehr müde, und so weiter.
  • Tests, die Auswirkungen der einen Test auf die Noten von einem zweiten Test.
  • Besetzung, Änderungen in der Kalibrierung eines Messwerkzeug oder Änderungen an den Beobachter oder Torschützen können Veränderungen in den erhaltenen Messungen zu erzeugen.
  • Statistische Regression, Betriebs wo Gruppen wurden auf der Grundlage ihrer Extremwerte ausgewählt worden ist.
  • Selection, spannt aus Differenz Auswahl der Befragten für die Vergleichsgruppen resultieren.
  • Experimentelle Mortalität oder differentiellen Verlust der Befragten aus den Vergleichsgruppen.
  • Selection-Reifung Interaktion usw. beispielsweise in Mehrfachgruppe quasi-experimentelle Designs

Externe Validität

Externe Validität betrifft das Ausmaß, in dem die Ergebnisse einer Studie kann als wahr für andere Fälle angesehen werden, beispielsweise an verschiedene Personen, Orte oder Zeiten. Mit anderen Worten, ist es darüber, ob Erkenntnisse wirksam verallgemeinert werden. Wenn die gleiche Forschungsstudie wurde in diesen anderen Fällen durchgeführt, wäre es die gleichen Ergebnisse?

Ein wesentlicher Faktor dabei ist, ob die Studie Probe repräsentativ für die allgemeine Bevölkerung entlang relevanten Abmessungen sind. Andere Faktoren gefährden externe Validität sind:

  • Reaktiv oder Interaktionseffekt der Prüfung kann ein Vortest die Noten auf einem Posttest zu erhöhen
  • Interaktionseffekte von Selektionsverzerrungen und die experimentelle Variable.
  • Rückwirkungen der Versuchsanordnungen, die Verallgemeinerung über die Wirkung der experimentelle Variable auf Personen vorsehen würde, dass sie in nicht-experimentellen Bedingungen ausgesetzt
  • Multiple-Behandlung Störungen, in denen Auswirkungen der früheren Behandlungen sind nicht löschbar.

Ökologische Validität

Ökologische Validität ist das Ausmaß, in dem Forschungsergebnisse zu realen Situationen außerhalb der Forschung Einstellungen angewendet werden. Dieses Problem ist eng mit externen Validität, sondern deckt die Frage, bis zu welchem ​​Grad experimentellen Befunde spiegeln, was in der realen Welt beobachtet werden. Ökologisch gültig zu sein, müssen die Methoden, Materialien und Einstellung einer Untersuchung der realen Situation, die Gegenstand der Untersuchung ist anzunähern.

Ökologische Validität ist zum Teil auf die Frage der Versuch gegen Beobachtung. In der Regel in der Wissenschaft, gibt es zwei Bereiche der Forschung: Beobachtungs und experimentell. Der Zweck des experimentellen Designs ist die Kausalität zu testen, damit Sie eine Ursache B entnehmen kann, bzw. B verursacht A. Aber manchmal, zu verhindern, ethische und / oder methodischen Einschränkungen Sie ein Experiment. Dann können Sie immer noch Forschung zu tun, aber es ist nicht kausal ist, ist es correlational. Sie können nur feststellen, dass A tritt zusammen mit B. Beide Techniken haben ihre Stärken und Schwächen.

Beziehung die interne Validität

Auf den ersten Blick, interne und externe Validität scheinen sich zu widersprechen - um ein experimentelles Design, müssen Sie für alle Störgrößen Kontrolle zu bekommen. Das ist, warum Sie häufig durchführen Ihr Experiment im Labor. Zwar gewinnt die interne Validität Sie ökologischen oder externe Validität verlieren, weil Sie eine künstliche Laborsituation herzustellen. Auf der anderen Seite mit beobachtende Forschung nicht für Störgrößen kontrollieren können, aber Sie können in der natürlichen Umwelt zu messen, an der Stelle, wo das Verhalten normalerweise auftritt. Doch dabei interne Validität opfern Sie.

Der scheinbare Widerspruch der internen Validität und externe Validität ist jedoch nur oberflächlich. Die Frage, ob die Ergebnisse einer bestimmten Studie zu verallgemeinern, um andere Menschen, Orte oder Zeiten ergibt sich nur, wenn man einen induktivistische Forschungsstrategie folgt. Wenn das Ziel der Studie ist es, eine Theorie deduktiv zu testen, ist eine nur mit Faktoren, die die Strenge der Studie, also Gefahren für die interne Validität untergraben könnten betroffen.

Diagnostische Aussage

In klinischen Bereichen wie Medizin, die Gültigkeit einer Diagnose und die damit verbundenen diagnostischen Tests oder Screening-Tests, kann beurteilt werden.

Im Hinblick auf Versuche, die Gültigkeit Probleme in der gleichen Weise wie für psychometrischen Tests wie oben beschrieben untersucht werden, aber es gibt oft bestimmte Anwendungen und Prioritäten. Nämlich die Frage zu beantworten, die der Arzt fragt - in der Laborarbeit hat sich die medizinische Wirksamkeit einer wissenschaftlichen Erkenntnis als "Grad der Erreichung des Ziels 'definiert. Eine wichtige Anforderung bei der klinischen Diagnose und Prüfung ist die Empfindlichkeit und Spezifität - ein Test muss empfindlich genug, um das betreffende Problem nicht erkennen, wenn es vorhanden ist, sondern spezifisch genug, um nicht auf andere Dinge zu reagieren.

In der Psychiatrie gibt es ein besonderes Problem mit der Beurteilung der Gültigkeit der diagnostischen Kategorien selbst. In diesem Kontext:

  • Inhaltsvalidität kann, um die Symptome und diagnostischen Kriterien beziehen;
  • gleichzeitige Gültigkeit kann durch verschiedene Korrelate oder Marker, und vielleicht auch die Behandlung angesprochen definiert werden;
  • prognostische Validität kann im Wesentlichen auf diagnostischen Stabilität über die Zeit beziehen;
  • Diskriminanzvalidität kann es sich um die Abgrenzung von anderen Erkrankungen.

Robins und Guze vorgeschlagen, im Jahr 1970, was waren einfluss formalen Kriterien zur Feststellung der Gültigkeit der psychiatrischen Diagnosen zu werden. Sie aufgeführt fünf Kriterien:

  • deutliche klinische Beschreibung
  • Laboruntersuchungen
  • Abgrenzung zu anderen Erkrankungen
  • Follow-up-Studien, die einen charakteristischen Verlauf
  • Familie Studien, die zeigen familiärer Häufung

Diese wurden in den Feighner Kriterien und Forschung Diagnostische Kriterien, die seit der Grundlage der DSM und ICD Klassifikationssysteme gebildet haben, einbezogen.

Kendler 1980 unterschieden zwischen:

  • Vorgeschichte Validatoren
  • gleichzeitige Validatoren
  • Vorhersage Validatoren

Nancy Andreasen aufgeführt mehrere zusätzliche Validatoren - Molekulargenetik und Molekularbiologie, Neurochemie, Neuroanatomie, Neurophysiologie und der kognitiven Neurowissenschaft -, dass alle potenziell in der Lage, die Verknüpfung Symptome und Diagnosen zu ihren neuronalen Substrate sind.

Kendell und Jablinsky betonte die Wichtigkeit der Unterscheidung zwischen Gültigkeit und Nutzen, und argumentiert, dass Diagnosekategorien durch ihre Syndrome definiert sind als nur gültig, wenn sie gezeigt haben, um diskrete Einheiten mit natürlichen Grenzen, die sie von anderen Erkrankungen zu trennen angesehen werden.

Kendler betonte, dass, nützlich zu sein, muss ein Validierungskriterium empfindlich genug, um die meisten Syndrome, die wahre Störungen sind zu validieren, während auch spezifisch genug, um die meisten Krankheitsbilder, die nicht wahr sind Störungen zu entkräften. Auf dieser Basis, so argumentiert er, dass ein Rotkehlchen und Guze Kriterium "liegt in der Familie" ist nicht ausreichend spezifisch, da die meisten menschlichen psychischen und physischen Merkmale in Frage kämen - beispielsweise eine beliebige Syndrom, das eine Mischung von "Höhe über 6 ft, rote Haare und eine große Nase "gefunden werden, um" laufen in den Familien "und sein" erblich ", aber dies sollte nicht als Beweis dafür, dass es sich um eine Erkrankung werden. Kendler hat ferner vorgeschlagen, dass "essentialistischen" Gen-Modelle von psychiatrischen Störungen, und die Hoffnung, dass wir in der Lage, kategorische psychiatrischen Diagnosen von "Carving Natur in ihrer Gelenke" ausschließlich als Folge der Entdeckung von Genen, sind unglaubwürdig zu validieren.

. Siehe Daubert v Merrell Dow Pharmaceuticals: In den Vereinigten Staaten Federal Court-System Gültigkeit und Zuverlässigkeit der Nachweise über die Daubert Standard bewertet. Perri und Lichtenwald bieten einen Ausgangspunkt für eine Diskussion über eine breite Palette von Zuverlässigkeit und Gültigkeit Themen in ihrer Analyse einer widerrechtlichen Verurteilung wegen Mordes.

  Like 0   Dislike 0
Vorherige Artikel Rank Xerox
Nächster Artikel Die Shetland Zeiten
Bemerkungen (0)
Keine Kommentare

Fügen Sie einen Kommentar

smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile
Zeichen übrig: 3000
captcha