Walidacja to... Definicja, rodzaje, typy i kryteria

Zadowolony

Rodzaje
Kryteria zewnętrzne
Ważność empiryczna. O co chodzi?
Konstruktywne
Ważność treści
Przewidywanie
Retrospektywnie
Dyskryminacyjne i konwergencyjne
Zestaw narzędzi
Budowa narzędzi
Rodzaje
Niuanse

Jakie są rodzaje walidacji? Co to jest? Odpowiedzi na te i inne pytania znajdziesz w tym artykule. Ważność jest z natury rzeczy pojedynczą cechą, która obejmuje, z z jednej strony, Dane o tym, czy technologia nadaje się do mierzenia tego, do czego została zaprojektowana, a z drugiej strony jaka jest jej skuteczność, praktyczność, efektywność. Walidacja technologii nazywana jest walidacją. Poniżej rozważymy to bardziej szczegółowo.

Rodzaje

Wiele osób pyta: "Co to jest walidacja?. Mówi się, że dla wyrafinowanego umysłu nie ma granic. To tak, jakby metodolodzy rywalizowali o to, kto odkryje lub wymyśli więcej typów i rodzajów ważności. Jakie rodzaje nazw pojawiły się w ostatnim czasie?! Okazuje się, że są:

ważność Zewnętrzne i wewnętrzne;
zbieżny;
wyróżnik;
oczywiste;
silnia;
prognostyczne;
Konstruktywne;
oparte na kryterium;
znaczące i tak dalej.

Nie ma sposobu, aby wiedzieć, a tym bardziej inteligentnie odróżnić jedną odmianę od drugiej. Zamieszanie w definicjach i klasyfikacjach prowadzi do tego, że różni autorzy przypisują zupełnie inne sposoby poprawy tej samej formy ważności.

Kryteria zewnętrzne

W celu przeprowadzenia pragmatycznej walidacji metody, czyli oceny jej praktycznej przydatności, skuteczności, efektywności, stosuje się zwykle zewnętrzne, niezależne kryterium - wskaźnik badanej jakości przejawiający się w życiu codziennym. Takim kryterium mogą być zarówno osiągnięcia produkcyjne (w przypadku techniki zawodowej), osiągnięcia w nauce (w przypadku testów inteligencji, osiągnięć lub zdolności uczenia się), jak i wykonywanie czynności faktycznych - modelowanie, rysowanie i tym podobne (w przypadku testów umiejętności specjalnych), oceny osobiste (do testu osobowość).

Rodzaje kryteriów walidacji zewnętrznej są następujące:

Mierniki wydajności (mogą one obejmować ilość wykonanej pracy, czas poświęcony na naukę, wskaźnik sukcesu, wskaźnik wzrostu umiejętności i tym podobne);
cechy fizjologiczne (stosowane w badaniach narażenia na środowisko i innych zmiennych sytuacyjnych na psychikę i organizm człowieka);
ciśnienie krwi, puls, objawy zmęczenia, opór elektryczny skóry i tak dalej;
miary subiektywne (obejmują różnego rodzaju odpowiedzi odzwierciedlające stosunek danej osoby do kogoś lub czegoś, jej poglądy, opinie, preferencje; zazwyczaj miary takie uzyskuje się za pomocą kwestionariuszy, ankiet, wywiadów);
środki przypadkowe (stosowane, gdy cel badania dotyczy np. problemu hodowlanego); - środki przypadkowe (stosowane, gdy cel badania dotyczy problemu hodowlanego) do pracy osoby mniej podatne na wypadki).

Ważność empiryczna. O co chodzi?

Niewiele osób wie, czym jest walidacja empiryczna. W przypadku zasadności merytorycznej test jest oceniany przez ekspertów (którzy ustalają, czy pozycje testowe są adekwatne do treści przedmiotu pomiaru). A empiria jest zawsze mierzona za pomocą korelacji statystycznej: obliczana jest korelacja dwóch rodzajów wartości - wyników testu i wskaźników dotyczących zewnętrznego parametru wybranego jako kryterium ważności.

Konstruktywne

Nie każdy zna rodzaje metod walidacji. Co to jest ważność konstrukcyjna? Ma ona związek z samym konstruktem teoretycznym i polega na poszukiwaniu czynników, które wyjaśniają zachowania związane z wykonywaniem testów.

Jako specyficzny typ, ważność konstrukcyjna jest udokumentowana w Miele i Cronbachu (1955).). Przy tej formie ważności autorzy oceniali wszystkie badania testowe, które nie były bezpośrednio ukierunkowane na przewidywanie jakiegoś istotnego kryterium. Ankieta zawierała informacje o konstruktach psychologicznych.

Ważność treści

Wciąż pytasz "Czym jest walidacja?. Rozważenie ważności treści. Wymaga, aby każde zadanie, pytanie lub pozycja należąca do zdefiniowanej domeny miała identyczną szansę na przekształcenie w pozycję testową.

Trafność merytoryczna ocenia adekwatność istoty testu do mierzonego obszaru zachowań. Walidacje stworzone przez dwie grupy deweloperów są przeprowadzane na próbie uczestników testu. Wiarygodność test-retest jest obliczana poprzez podzielenie pytań na dwie strefy, dzięki czemu uzyskuje się istotny wskaźnik ważności.

Przewidywanie

Kontynuacja analizy metod walidacji. Ważność predykcyjna jest również ustalana przy użyciu zewnętrznego, wystarczająco wiarygodnego kryterium. Ale jest on zbierany jakiś czas po badaniu.

Kryterium zewnętrzne to najczęściej zdolność jednostki do oceny zawodu, do którego została wytypowana w teście diagnostycznym.

Chociaż metoda ta jest najbardziej adekwatna do zadania narzędzi diagnostycznych - przewidywania zbliżającego się sukcesu - jest bardzo trudna do zastosowania. Dokładność predykcji jest odwrotnie proporcjonalna do czasu przeznaczonego na predykcję. Im więcej czasu upływa od pomiaru, tym więcej czynników należy wziąć pod uwagę przy ocenie ważności predykcyjnej technologii. Jednak uwzględnienie wszystkich czynników wpływających na prognozę jest prawie niemożliwe.

Retrospektywnie

Zgadza się, że walidacja jest skomplikowanym procesem. Wiadomo, że ważność retrospektywna ujawnia się na podstawie kryterium odzwierciedlającego stan jakości lub zdarzenia w przeszłości. Może być zastosowany do natychmiastowego uzyskania danych o źródłach predykcyjnych technologii. Na przykład, aby sprawdzić, w jakim stopniu dobre wyniki testów umiejętności odpowiadają szybkiemu uczeniu się, można porównać wcześniejsze oceny ekspertów, wyniki osiągnięć itp. osób o niskich i obecnie wysokich wskaźnikach diagnostycznych.

Dyskryminacyjne i konwergencyjne

Rodzaje walidacji są przedmiotem zainteresowania wielu. Dowiedz się, co to jest trafność dyskryminacyjna i konwergencyjna. To, jak psycholog odkrywa konstrukt diagnostyczny, decyduje o strategii wprowadzania zdefiniowanych pozycji do testu. Jeśli Eysenck definiuje cechę "neurotyczność" jako niezależną od introwersji-ekstrawersji, oznacza to, że jego kwestionariusz powinien mieć równą reprezentację pozycji, które poprą neurotyczni ekstrawertycy i introwertycy.

Jeśli jednak w praktyce okaże się, że dominują pozycje z kwadrantu introwersja-neurotyzm, to z punktu widzenia teorii Eysencka oznacza to, że wskaźnik "neurotyczności" jest obciążony nieistotnym wskaźnikiem, wskaźnikiem "introwersji". Identyczny efekt występuje, gdy występuje tendencyjność próby, tzn. gdy więcej jest neurotycznych introwertyków niż ekstrawertyków.

Aby uniknąć takich zawiłości, psychologowie chcą mieć do czynienia z pozycjami empirycznymi, które informują tylko o jednym czynniku. W rzeczywistości jednak wymóg ten nigdy nie jest spełniony: każdy wskaźnik empiryczny okazuje się być zdeterminowany nie tylko przez potrzebny nam czynnik, ale także przez inne, nieistotne, problemy pomiarowe.

Zatem w odniesieniu do czynników definiowanych pojęciowo jako ortogonalne do mierzalnego (występujące z nim we wszystkich kombinacjach), twórca testu, dobierając pozycje, musi zastosować strategię nieautentycznego równoważenia.

Dopasowanie pozycji do mierzonego wskaźnika zapewnia zbieżność testu. Spójność pozycji w odniesieniu do nieistotnych źródeł zapewnia trafność dyskryminacyjną. Empirycznie przejawia się to w braku znaczącej korelacji z testem mierzącym pojęciowo pojedynczą jakość.

Zestaw narzędzi

Do wspólnego zestawu technik walidacji autorzy zaliczają zwykle:

nieformalne (od nieskomplikowanych technik przeglądania listy alternatyw w kwestionariuszu do bardziej rozbudowanych procedur teoretycznej analizy krok po kroku);
formalistyczne - obejmujące procedury i techniki statystyki matematycznej: testowanie hipotez statystycznych, obliczanie oszacowań, analizę korelacji, konstruowanie przedziałów ufności, ocenę związków między zmiennymi, analizy wariancji, czynnikowe, regresyjne i strukturalne itp.

Budowa narzędzi

A jednak, walidacja jest tym, co? Wyrafinowane narzędzia walidacji jako pierwsi stworzyli psychologowie. Już w 1959 roku opracowano specjalną metodykę D. Fiske i D. Campbell (USA). Otrzymała ona nazwę dość naturalną dla języka angielskiego, ale nieprzetłumaczalną na nasz język: multi-method multi-drawing matrix (MTMM). Ta matryca była tabelą korelacji. Składał się on z dwóch bardzo atrakcyjny wynalazków, jeden dla ważności konwergentnej, a drugi dla ważności dyskryminacyjnej.

Jej autorzy przekonywali, że każdy będzie mógł udowodnić wewnętrzną akceptowalność, jeśli:

wartości, między którymi zakłada się wysoki poziom powiązań teoretycznych, ujawnią identyczny poziom w relacjach empirycznych (konwergencja);
wartości, które są teoretycznie niepowiązane, okażą się również niepowiązane empirycznie po przeprowadzeniu testu (dyskryminacja).

Z grubsza rzecz biorąc, convergent validity musi pokazać, że dwa zespoły pracowników, na przykład robotnicy budowlani i pracownicy linii montażowej, są znacznie bardziej podobne w swoich szansach na rynku pracy niż właściciele i pracownicy. Jeśli teoretycznie zamierzony związek jest stwierdzony empirycznie, twoja próba jest ważna.

Ważność dyskryminacyjna pokazuje stopień identyfikacji różnych zjawisk. Gdybyśmy wzięli ten sam przykład z rynkiem pracy, to można by się spodziewać, że dobrze skonstruowana teoria może dostarczyć środków do rozróżnienia szans właścicieli i pracowników na rynku pracy. Tych dwóch rzeczy nie należy mylić, a Twoja teoria jest w stanie je rozróżnić.

Jeśli stworzyłeś skalę do pomiaru zdolności matematycznych, to w przypadku konwergentnej ważności wskaźniki zdolności matematycznych powinny dobrze korelować z ogólnymi zdolnościami osoby, jeśli na poziomie teoretycznym istnieje taki związek, a słabo - ze zdolnościami estetycznymi, które wymagają innych talentów niż umiejętność liczenia, o ile oczywiście niska korelacja nie jest głoszona przez Twoją teorię.

Rodzaje

Walidacja to proces korygowania lub ulepszania stworzonej techniki psychodiagnostycznej. Jego podstawowym celem jest zapewnienie, że technologia diagnozuje dokładnie to, czego potrzebuje deweloper. Rozróżnia się walidację teoretyczną i pragmatyczną.

Dla pierwszego typu kardynalnym problemem jest relacja między zjawiskami psychicznymi a wskaźnikami, za pomocą których zjawiska te próbuje się poznać. Pokazuje, że wyniki metodologii i abstrakcyjne zamierzenia autora są zbieżne.

W celu ustalenia abstrakcyjnej ważności bardzo trudno jest znaleźć jakiekolwiek niezależne kryterium poza metodologią. W historii psychodiagnostyki wczesne oparcie polegało więc na instynktownej koncepcji, że test mierzy:

Metodę uważa się za ważną, jeśli jest ona po prostu "oczywista.
Dowód ważności opierał się na pewności badacza, że jego technologia może "zrozumieć osobę badaną".
Program został oceniony jako ważny tylko dlatego, że teoria stojąca za technologią jest "bardzo dobra".

Następnie poszukaj dowodów uzasadnionych przez naukę. Tu należy zaznaczyć, że niepozorne nagromadzenie arsenału technik o już ugruntowanej i znanej ważności ma w tym procesie ogromne znaczenie. Jeśli psychodiagnostyk konstruuje schemat oceny jakiejś jakości, a znane są inne ważne technologie zmierzające do tej samej oceny, można zbadać korelację i porównać wyniki metody obcej i własnej.

Jeśli współczynnik korelacji okaże się zbyt wysoki, wówczas dany schemat ma imponującą ważność abstrakcyjną. W przypadku wątpliwości, co dokładnie jest oceniane przez daną technologię, należy porównać wyniki tej technologii z wynikami innych ważnych systemów, które rozpoznają powiązane (podejrzane) właściwości. Jeśli wartości korelacji okażą się niespodziewanie wysokie, można stwierdzić, że metoda nie ocenia tego, czego oczekiwano.

Jeśli więc istnieją już inne schematy mające na celu zmierzenie dokładnie tego samego normy lub można zdefiniować poprawność dyskryminacyjną i konwergencyjną.

Niuanse

A więc walidacja - co to jest? W prostych słowach, jest to audyt produktu, aby sprawdzić, czy odpowiada on reklamowanym specyfikacjom. To znaczy, że niektóre smartfony nie przejdą walidacji, dopóki. Dopóki klienci nie będą zadowoleni, że ma on dokładnie taki aparat i taką pojemność pamięci, za jaką są skłonni zapłacić.

Kryterium walidacji to niezależna i bezpośrednia od walidowanego testu miara jakości psychicznej, której zbadanie jest celem programu psychodiagnostycznego.

Aktualność to cecha testu, która odzwierciedla jego zdolność do dyskryminacji osób na podstawie atrybutu diagnostycznego, który jest przedmiotem badania w danej metodzie.

Ważność konkurencyjną ocenia się na podstawie korelacji stworzonego testu z innymi testami, których ważność względem mierzonego parametru została ustalona. Ważność różnicową można zinterpretować na przykładzie testów odsetkowych.