Telli ja loe
kõige huvitavam
artiklid kõigepealt!

Usaldusväärsus on mõõtmismeetodi korduval rakendamisel saadud tulemuste järjepidevuse aste. b) korrelatsioonianalüüs

KATSE OMADUSTE ARVUTAMISE MEETOD

Bovtrukevitš Maria Viktorovna,

3. kursuse üliõpilaneG.Minsk

Kirenko Anna Vladimirovna

3. kursuse üliõpilane, BSU infotehnoloogia osakond,G.Minsk

Sirotina Irina Kazimirovna

teaduslik juhendaja, vanem õpetaja, BSU,G.Minsk

Tänapäeval on katsekontrolli küsimus väga aktuaalne. Seda kasutatakse laialdaselt ülikoolidesse sisseastumiskampaaniate läbiviimisel, õpilaste teadmiste kontrollimisel koolides, lütseumides, keskeri- ja kõrgkoolides ning kuna testid aitavad määrata inimese võimeid, kalduvusi, kalduvusi, aga ka taset teadmisi, oskusi ja võimeid , siis võtsid nad hariduse valdkonnas olulise positsiooni.

Test on tööriist, mis koosneb kvalitatiivselt kontrollitud testiülesannete süsteemist, standardiseeritud läbiviimise protseduurist ning eelnevalt välja töötatud tehnoloogiast ja tulemuste analüüsist inimese omaduste ja omaduste, haridussaavutuste mõõtmiseks, mille muutmine on protsessi käigus võimalik. süstemaatilisest koolitusest.

Pedagoogiline test on kindla vormi, konkreetse sisu ja ühtlaselt kasvava raskusastmega ülesannete süsteem - süsteem, mis on loodud eesmärgiga objektiivselt hinnata ülesehitust ja mõõta õpilaste valmisoleku taset. .

Teadmiste kontrolli testimise põhiprobleemiks on testide loomise protsess, nende ühendamine ja analüüs Testi täielikuks kasutusvalmidusse viimiseks on vaja koguda mitme aasta jooksul statistilisi andmeid testide endi sisust, testiküsimuste valikul ja sõnastamisel. Palju oleneb ka konkreetsest testisüsteemist, sellest, kui palju aega teadmiste kontrollimiseks eraldatakse, testiülesandes sisalduvate küsimuste ülesehitusest jne. Teadmiste taseme objektiivseks hindamiseks on vaja test kompetentselt kujundada: see ei piisa küsimuste ja vastusevariantide väljamõtlemiseks, sest sel juhul võib tekkida palju vastuolusid, vigu ja ebakindlust, ülesanded võivad osutuda liiga lihtsaks või vastupidi liiga keeruliseks. Sel põhjusel läbivad testülesanded spetsiaalse hindamisprotsessi, mida me oma töös arvestame.

Eesmärk Meie töö on süstematiseerida meetodid, mis võimaldavad meil arvutada testi karakteristikuid. Pärast uurimisteemat käsitleva teaduskirjanduse analüüsimist valisime välja levinumad testikarakteristikud, kogusime need kokku, kirjeldasime üksikasjalikult nende rakendamist, koostasime kvaliteetse testi koostamise üldreeglid ja tõime näiteid. Loodame, et see töö parandab sellist teadmiste kontrollimise vormi nagu testikontroll, mis omakorda tõstab hariduse kvaliteeti.

Testimõõtmiste teoorias ja praktikas tuvastavad järgijad mitmesuguseid testi tunnuseid: usaldusväärsus, kehtivus, diskrimineeritus, sotsiaalkultuuriline kohanemisvõime, usaldusväärsus, ühemõttelisus, standardimine, täpsus, keerukus, normeerimine jne. uuringus käsitlesime neist järgmisi: usaldusväärsus, kehtivus, diskriminatiivsus.

Diskrimineerimine ülesandeid defineeritakse kui võimet eristada kõrge üldise testiskooriga testijaid madala skoori saanud testi sooritajatest või kõrge haridusliku produktiivsusega testijaid madala tootlikkusega testijatest. .

Diskriminatiivsuse arvutamiseks kasutame äärmusrühmade meetodit: testiülesande eristatavuse arvutamisel võetakse arvesse enim ja kõige vähem edukate õpilaste tulemusi. Äärmusrühmade liikmete osakaal võib sõltuvalt valimi suurusest olla väga erinev. Mida suurem on valim, seda väiksema katsealuste osakaaluga saate kõrgete ja madalate tulemustega rühmade tuvastamisel piirduda. “Grupi piiri” alumine piir on 10% valimisse kuuluvate uuritavate koguarvust, ülempiir on 33%. Oma töös kasutame 27% rühma, kuna selle protsendiga saavutatakse maksimaalne täpsus diskrimineerimise määramisel.

Diskrimineerimise indeks D on määratletud kui erinevus nende inimeste osakaalu vahel, kes probleemi õigesti lahendasid rühmadest "kõrge tootlikkus" ja "madala tootlikkus" ning leitakse järgmise valemi abil:

Kus: Nn max - ülesande õigesti täitnud õpilaste arv parimate rühmas; Nn min - halvima rühma õpilaste arv, kes täitsid ülesande õigesti; N max - ainete koguarv parimas rühmas; N min - kõige halvemas rühmas olevate katsealuste koguarv.

V. K. Gaida ja V. P. Zakharov teevad ettepaneku arvutada diskrimineerimiskoefitsient, arvutades ühe probleemi lahendamise edukuse ja kogu testi. See näitaja on diskrimineerimiskoefitsient, mida kasutatakse selle arvutamiseks:

, (2)

Kus: x- kõigi individuaalsete testitulemuste aritmeetiline keskmine;

x n- ülesande õigesti lahendanud katsealuste tulemuste aritmeetiline keskmine;

δx- valimi üksikute testitulemuste standardhälve;

n- ülesande õigesti lahendanud katsealuste arv;

Nd- ainete koguarv.

Diskrimineerimiskoefitsient võib olla vahemikus -1 kuni +1. Testiülesande eristatavuse kõrge positiivne väärtus näitab katsealuste jaotuse tulemuslikkust, kõrge negatiivne väärtus näitab selle ülesande sobimatust testiks, selle mittevastavust kogutulemusele. Tulemus D≥0,3 loetakse rahuldavaks. Kui koefitsiendi väärtus on nullilähedane, tuleb ülesandeid lugeda valesti formuleerituks.

Kehtivus tähendab katsetulemuste sobivust eesmärgile, milleks katse tehti. Kehtivus on tunnus, mis näitab testi võimet täita ettenähtud mõõtmise eesmärki. Kehtivus määrab, kui hästi test peegeldab seda, mida see peaks mõõtma.

Eristatakse järgmisi tüüpe: Koosobsessiivne valiidsus - testi sisu esinduslikkuse tunnus seoses testimiseks kavandatud teadmiste ja oskustega; Tokonstruktiivne(kontseptuaalne) valiidsus on teoreetilise konstruktsiooni adekvaatse mõõtmise tunnus, s.t. e. kas intelligentsuse test mõõdab ka tegelikult IQ-d; Torituaalne kehtivus - määrab testi võime olla rangelt määratletud omaduste ja käitumisvormide näitaja; Tpraegune valiidsus - testi omadus, mis peegeldab selle võimet teha vahet subjektide vahel selle tunnuse alusel, mis on selles tehnikas tuvastamise objektiks; Prognostiline Kehtivus annab teavet selle kohta, kui täpselt saab testis tuvastatud kvaliteeti hinnata teatud aja jooksul pärast mõõtmist.

Testi valiidsuse hindamiseks kasutatakse tavaliselt korrelatsiooni testi skooride ja mõne välise kriteeriumi vahel. Pedagoogiliste testide puhul on tavaliselt kriteeriumiks ekspertide hinnangud, mille nad annavad õpilaste teadmiste traditsioonilisel kontrollimisel ilma teste kasutamata. Valideerimisprotsessi teeb keeruliseks vajadus kehtestada ekspertide hinnangutes järjepidevuse mõõt, keda on tavaliselt vähemalt kolm inimest.

Kvantitatiivsete määramismeetodite kehtivus määratakse valdavalt kvalitatiivsete hinnangute abil, tavaliselt ekspertide kaasamisel: o faktoriaalne analüüsi kasutatakse siis, kui valiidsuse määramiseks kasutatakse faktoranalüüsi, et määrata testi faktorikoormused ja tegurikoostis; To onsensus kehtivus - teise seeria hinnangute saamiseks kasutatakse välisekspertide andmeid; uh empiiriline valiidsus - teise hinnangute seeria saamiseks kasutatakse varem tuntud meetodeid rakendades või muudest allikatest saadud tulemusi.

Selles artiklis vaatleme näidet kehtivuse arvutamisest, võttes arvesse testi tulemusi ja eksperthinnanguid:

, (3)

kus: - eksperthinnangute aritmeetiline keskmine,

Nende hinnangute standardhälve on:

(3.2)

Samamoodi õpilaste testitulemuste aritmeetiline keskmine ja
- nende skooride standardhälve arvutatakse samuti valemite (3.1), (3.2) abil.

Töökindlus on testi tunnus, mis peegeldab testmõõtmiste täpsust, samuti katsetulemuste stabiilsust juhuslike tegurite mõju suhtes.

Usaldusväärsust on kahte tüüpi: töökindlus kui stabiilsus; usaldusväärsus kui sisemine järjepidevus.

Usaldusväärsus kui stabiilsus. Testitulemuste stabiilsus on võimalus saada erinevatel juhtudel katsealustelt samu tulemusi. Usaldusväärsust kui stabiilsust mõõdetakse testi kordamisega sama katsealuste valimiga, tavaliselt kaks nädalat pärast esimest testi. Testi usaldusväärsus on seda suurem, mida järjepidevamad on sama isiku tulemused teadmiste uuesti kontrollimisel sama testi või sellega samaväärse vormiga (paralleeltest). Selle tunnuse leidmiseks tehakse ettepanek kasutada Pearsoni valemit:

, (4)

Kus Xi- i-nda katsealuse testi tulemus esimesel mõõtmisel;

Y i- sama katsealuse testi tulemus korduval mõõtmisel;

N-ainete arv.

Sisemise järjepidevuse määrab iga konkreetse testielemendi seos üldtulemusega, kuivõrd iga element on teistega vastuolus ja kuivõrd iga üksikküsimus mõõdab omadust, millele kogu test on suunatud. Sisemise järjepidevuse kontrollimiseks võetakse arvesse järgmisi meetodeid: poolitusmeetod või autonoomsete osade meetod; samaväärsete vormide meetod; Cronbachi alfa meetod. Poolitusmeetodil kasutatakse järgmisi valemeid: Spearman-Brown; Rull; Kuder-Richardson; Stanley. Kui koefitsiendi väärtused r langevad vahemikku 0,80–0,89, siis öeldakse, et testil on hea usaldusväärsus ja kui see koefitsient ei ole väiksem kui 0,90, võib usaldusväärsust nimetada väga kõrgeks. Jagamismeetodi kasutamisel jagatakse testmaatriks kaheks pooleks, mis koosnevad paaris ja paaritu arvuga ülesannetest.

Spearmani-Browni valem näeb välja selline:

Enne selle valemi rakendamist on vaja rakendada valemit (3). Pange tähele, et antud juhul Xi- testi tulemus i-th aine paarisarvuga ülesannetele; Y i

Ruloni valem näeb välja selline:

Iga katsealuse tulemuste erinevuste hajumine testi mõlemas pooles S 2 d leitakse valemiga:

Kus: X i- paarisarvuga ülesannete i-nda aine testiskoor;

Y i- sama aine testi tulemus paaritu arvuga ülesannete puhul.

Tulemuste koondhinnete hajumine S 2 z leitakse valemiga:

, (6.2)

Kus: Z i- testi koguskoor iõpilane.

Kuder-Richardsoni valem näeb välja selline:

, (7)

Kus: p j- õigete vastuste osakaal j-th ülesanne, st. õigete vastuste arv jagatud õpilaste arvuga;

q j- valede vastuste osakaal j-th ülesanne, st valede vastuste arv jagatud õpilaste arvuga ( q j= 1 -p j);

S 2 z- tulemuse summaarsete punktide hajutamine, mis arvutatakse valemi (5.2) järgi.

Stanley valemi abil usaldusväärsuse arvutamisel tuleb õpilased jagada kahte rühma. Esimesse rühma kuuluvad 27% "tugevad" õpilased (need, kes kogusid kõige rohkem punkte) ja nõrgad 27% "nõrgad" õpilased (need, kes kogusid kõige vähem punkte).

Stanley valem:

, (8)

Kus W L- sellele küsimusele antud ebaõigete vastuste arv nõrgas rühmas;

W H- sellele küsimusele antud valede vastuste arv tugevas rühmas;

n- küsimuste arv testis;

k- tugeva (nõrga) rühma uuritavate arv, s.o 27% uuritavate koguarvust.

Cronbachi alfa koefitsient näitab ühte objekti kirjeldavate tunnuste sisemist järjepidevust ja leitakse valemiga:

, (9)

Kus: S 2 Y- tulemuse summaarsete punktide hajutamine, mis arvutatakse valemi (3.2) järgi;

S 2 Yi- elementide dispersioon i.

Näitame konkreetsel katsekarakteristikute arvutamise meetodit näiteks. Saime tabelis 1 esitatud õpilaste testimise tulemused.

Tabel 1

Esimesed testi tulemused

Stõpilane

i

Ekspertide ülevaade

Töö number

1 0

Kaks nädalat hiljem korrati testi ja saadi tabelis 2 esitatud tulemus.

tabel 2

Teise testi tulemused

i

Ekspertide ülevaade

Töö number

1 0

Kasutades tabelite andmeid, jätkame kõigi ülaltoodud karakteristikute arvutamisega.

Diskrimineerimine

1. Arvutame õpilaste arvu välimistes rühmades, ümardades kohe täisarvudeks:

2. Arvestage parimate ja halvimate rühmadega, millest igaühes on 3 inimest. Saame tabeli 3.

Tabel 3

Testimise koondtabel koos eksperthinnangutega

i

Ekspertarvamus, Ei

Töö number

Testi koguskoor

1 0

Seega on parimas rühmas õpilased numbritega 1, 10, 4; halvimas grupis: 3, 5, 2 (kui on ühesuguse testitulemusega õpilasi, võtame arvesse eksperthinnanguid).

3. Koostame tabeli4, mis koosneb ainult parima rühma õpilastest ja halvima rühma õpilastest, arvutades koheselt iga rühma õpilaste arvu, kes täitsid ülesande õigesti.

Tabel 4

Testimise koondtabel koos eksperthinnangutega
äärmuslikele gruppidele

i

Eksperthinnang, Ei

Töö number

1 0

Parimate rühm

Halvim grupp

4. Arvutame valemi (1) abil iga ülesande diskrimineerimisindeksi:

, , , , , , , , , .

Me järeldame, et ülesanded 6 ja 7 on mittediskrimineerivad.

Kehtivus

Tabel 6 leitud E i (eksperthinnang), Z i(testi koguskoor), n- see on teada, meie puhul võrdub see 10-ga.

1. Samuti leiame valemist (3.1):

2. Samuti leiame valemi (3.2) abil:

,.

3. Kehtivus arvutatakse valemi (3) abil. Mugavuse huvides arvutame eraldi:

Saame: .

Usaldusväärsus kui jätkusuutlikkus

1. Esmalt koostame tabeli 5.

Tabel 5

Usaldusväärsuse leidmine Pearsoni valemi abil

Õpilase number i

Esimene testi tulemus X i

Testi tulemus uuestiY i

X i Y i

(X i) 2

(Y i) 2

2. Rakendame valemit (4):

Usaldusväärsus kui sisemine järjepidevus. Peame seda tunnust Ruloni valemi (6) järgi jagamismeetodiks.

1. Esmalt leiame iga katsealuse tulemuste erinevuste erinevused testi mõlemas pooles. Täidame tabeli 6.

Tabel 6

Tulemuste erinevuste dispersiooni arvutamine

i

Punkte paarisarvuga ülesannete eestX i

Hinne paaritu arvu ülesannete eestY i

X i -Ja ma

2. Rakendage valem (6.1): .

3. Leiame tulemuse koondhinnete hajumise, koostades esmalt tabeli 7.

Tabel 7

Koguhinnete dispersiooni arvutamine

I

Kõigi ülesannete hind Zi

4. Rakendades valemit (6.2) ja seejärel valemit (6), saame:

, .

Tulemuste tõlgendamine

1. Usaldusväärsus kui stabiilsus: kuna koefitsiendi väärtus on ligikaudu 0,923, on testil kõrge usaldusväärsus. See tähendab, et sellest vaatenurgast on see väga hästi koostatud.

2. Usaldusväärsus kui sisemine järjepidevus: korrelatsioonikordaja väärtus on ligikaudu 0,198. See viitab madalale töökindlusele, seega on parem testida uuesti, et teha kindlaks, millised katseelemendid tuleb asendada.

3. Diskriminatiivsus: ülesanded 6 ja 7 ei ole diskrimineerivad, kuna diskrimineerimiskoefitsienti alla 0,3 peetakse mitterahuldavaks. See tähendab, et need esemed ei sobi testiks ja need tuleb välja vahetada.

4. Valiidsus: testitulemuste ja välise kriteeriumi (eksperthinnangud) korrelatsiooniaste on üsna kõrge ja ulatub 0,962823-ni. See tulemus näitab vaadeldava testi kõrget kehtivust.

Juhime teie tähelepanu erijuhtudel.

  • Mõnikord toimub ohutusteguri leidmisel jagamine nulliga. See võib juhtuda, kui kõigil õpilastel on sama arv õigeid ja valesid vastuseid. Praktikas juhtub seda harva, vastused lekitati. Sel juhul tuleks testi korrata.
  • Usaldusväärsuse kui stabiilsuse leidmisel on võimalik ka see, et vastus annab ebakindlust, st null jagatakse nulliga. See võib juhtuda, kui õpilane annab esimesel ja kordustestil sama arvu õigeid ja valesid vastuseid. See tähendab, et test koostati väga edukalt või, vastupidi, väga ebaõnnestunult. Soovitame teil kontrollida teisi testi omadusi ja teha nende põhjal järeldus.
  • Valiidsuse arvutamisel on võimalik ka jagamine 0-ga. See võib juhtuda siis, kui kõigil õpilastel on sama arv õigeid ja valesid vastuseid või kui kõik eksperdihinnangud on samad. Seda juhtumit juhtub praktikas harva, kõige tõenäolisemalt on vastused lekkinud ja antud tulemus on viltu.

Kui tahame luua rahuldava eristatavusega testelemente, siis tuleb vältida: 1) liigset keerukust ja segaseid sõnastusi; 2) tingimuste ebaselgus; 3) lahenduse ilmsus; 4) tulemuse sõltuvus mälust või muudest uuritava individuaalsetest omadustest, mitte aga nende oskuste ja võimete arengutasemest, mille hindamiseks testi arendatakse; 5) vastusevariantide absurdsus, ebareaalsus; 6) kahe või enama tingimuses nimetamata õige vastuse ilmumine.

Testi valiidsuse suurendamiseks on järgmised võimalused: 1) ülesannete optimaalse raskusastme valimine, et tagada testitulemuste normaalne jaotus; 2) testi sisu kvaliteedi kontrollimine;
3) optimaalse testi sooritamise aja arvutamine; 4) suure diskrimineerimisvõimega ülesannete valik.

Ebausaldusväärsuse allikate eeluuring võimaldab võimalusel nende mõju testi koostamisel välistada. Selliste allikate hulka kuuluvad tavaliselt: 1. Subjektiivsus testiülesannete tulemuste hindamisel. Kõige tõhusam meetod selle puuduse ületamiseks on suletud ülesannete kasutamine, mis tänu tulemuste objektiivse hindamise võimalusele ceteris paribus suurendab testi usaldusväärsust. 2. Arvamine. Nagu näitavad spetsiaalsed uuringud, vähendab arvamine oluliselt testi usaldusväärsust, eriti juhtudel, kui testitakse nõrkade õpilaste rühma, kes tavaliselt kasutavad äraarvamist kõige raskemate testiülesannete täitmisel. 3. Loogilise korrektsuse puudumine katseobjektide sõnastamisel. Valed ülesanded jäävad reeglina tegemata tugevatel õpilastel, mis üldiselt mõjutab negatiivselt testi usaldusväärsust. 4. Kaalukoefitsientide põhjendamatu valik. Asjade õiges seisukorras peaks individuaalsete õpilaste hinnete arvutamise protsessis kaalumiskoefitsientide valik põhinema sobival teoorial. 5. Taigna pikkus. Usaldusväärsus suureneb testi pikkuse pikenedes. Rahuldava, kuid mitte hea töökindluse saavutamiseks piisab tavaliselt 30 testüksusest. 6. Testi standardjuhiste puudumine. Katsejuhised peavad olema äärmiselt standardsed ja täpsed. Kõik ebaselgused, ebaselgused ja kõrvalekalded standardimisnõuetest juhistes toovad kaasa testi usaldusväärsuse vähenemise. 7. Muud ebausaldusväärsuse allikad on pigem seotud testi sooritajatega kui testitavate üksustega. Näiteks võib testi sooritaja end testi kallal töötades halvasti tunda või juhendis eksida. Testi tulemusi võivad mõjutada väsimus ja tüdimus, toatemperatuur, müra aknast väljas jne.

Kokkuvõtteks märgime, et meie projekti raames viisid arvutiteaduse eriala üliõpilased Faley Alexander ja Berezyuk Sergey testikarakteristikute empiirilise töötlemise protsessi optimeerimiseks ellu arendusi. võrguteenus.Kasutajaandmete töötlemine jaguneb kolmeks etapiks: kliendilt info vastuvõtmine ja lähteandmete massiivide genereerimine, väärtuste töötlemine arvutusvalemite ja algoritmide abil, tulemuste paigutus ja kuvamine kasutajale. Selle teenuse sihtrühmaks võivad olla peamiselt kooliõpetajad ja ülikoolide õppejõud. Projekti aadress: www.qualitester.com.

Bibliograafia:

1. Avanesov V. S. Testiülesannete koosseis / V. S. Avanesov. - M.: Adept, 1998. - 217 lk.

2. Avanesov V.S. Testivormis ülesannete rakendamine uutes haridustehnoloogiates / V.S. Avanesov // Koolitehnoloogiad. - 2007. - nr 3. - Lk 146-163.

3. Avanesov V. S. Testiülesannete vorm: õpik. toetus / V. S. Avanesov. M.: Testimiskeskus, 2005. - 120 lk.

4. Gutsanovich S. A., Radkov A. M. Testimine matemaatika õpetamisel: diagnostilised ja didaktilised alused / S. A. Gutsanovich, A. M. Radkov. - Mozyr: Kirjastus "Valge tuul", 2001. - 168 lk.

5. Mayorov A. N. Haridussüsteemi testide loomise teooria ja praktika. - Moskva: "Intellektikeskus", 2002. - 296 lk.

6. Tšelškova, M.B. Pedagoogiliste testide konstrueerimise teooria ja praktika. - Moskva: "Logod", 2002. - 432 lk.

Testimine on uurimismeetod, mis võimaldab tuvastada teadmiste, oskuste, võimete ja muude isiksuseomaduste taset ning nende vastavust teatud standarditele, analüüsides seda, kuidas katsealune täidab mitmeid eriülesandeid. Selliseid ülesandeid nimetatakse tavaliselt testideks. Test on standardiseeritud ülesanne või erilisel viisil seotud ülesanded, mis võimaldavad uurijal diagnoosida uuritava omaduse väljendusastet, tema psühholoogilisi omadusi, aga ka suhtumist teatud objektidesse. Testimise tulemusena saadakse tavaliselt teatud kvantitatiivne tunnus, mis näitab uuritava tunnuse raskusastet indiviidil. See peab olema korrelatsioonis selle kategooria õppeainete jaoks kehtestatud standarditega. See tähendab, et testimise abil on võimalik määrata uuritava objekti teatud omaduse praegune arengutase ja võrrelda seda standardiga või selle kvaliteedi arenguga õppeaines varasemal perioodil.

Testid sisaldavad tavaliselt küsimusi ja ülesandeid, mis nõuavad väga lühikest, mõnikord alternatiivset vastust ("jah" või "ei", "rohkem" või "vähem" jne), ühe antud vastuste valikut või vastuseid punkti abil. süsteem. Testülesanded on tavaliselt diagnostilised, nende täitmine ja töötlemine ei võta palju aega. Samas, nagu maailmapraktika on näidanud, on väga oluline näha, mida testid tegelikult paljastavad, et mitte diagnoosimise teemat asendada. Seega näitavad paljud testid, mis väidetavalt tuvastavad arengutaseme, tegelikult ainult testi sooritajate valmisoleku, teadlikkuse või oskuste taset.

Testiülesannete koostamisel tuleb järgida mitmeid tingimusi. Esiteks peate määratlema ja keskenduma teatud normile, mis võimaldab teil objektiivselt võrrelda erinevate õppeainete tulemusi ja saavutusi. See tähendab ka seda, et uurija peab aktsepteerima uuritava nähtuse teatud teaduslikku kontseptsiooni, keskenduma sellele ning sellelt positsioonilt põhjendama ülesannete täitmise tulemuste loomist ja tõlgendamist. Näiteks koostatakse ja rakendatakse teatud õppeainetes teadmiste, võimete ja oskuste arengutaseme väljaselgitamiseks mõeldud testülesandeid õpilaste teadmiste, võimete ja oskuste hindamiskriteeriumide ja vastavate standardite alusel. hinded või saab kujundada ainult ainete võrdlemiseks üksteisega edukuse järgi. oma ülesandeid täitma. Teiseks peavad uuritavad olema ülesande täitmiseks samades tingimustes (sõltumata ajast ja kohast), mis võimaldab uurijal saadud tulemusi objektiivselt hinnata ja võrrelda.

Iga testi normi määrab koostaja-arendaja, leides kindlasse kultuuri kuuluvate inimeste suure populatsiooni tulemustele vastava keskmise näitaja (standardiseerimisvalim). Seda näitajat võetakse testiga selgunud vara arengu keskmiseks näitajaks, mis on keskmisele inimesele statistiliselt iseloomulik. See võib olla näiteks intellektuaalse arengu vanusenorm või mõni isikuomadus. See näitaja määratakse empiiriliselt ja võetakse lähtepunktiks. Iga katsealuse tulemusi võrreldakse normiga ja hinnatakse vastavalt: iga testiga kaasneb andmete töötlemise ja tulemuste tõlgendamise meetod. Näiteks märgirõhu määramise testis (K. Leonhardt) saab testi tegija iga rõhuasetuse tüübi eest saada maksimaalselt 24 punkti; tugeva väljenduse (aktsentuatsiooni) märgiks loetakse näitajat, mis ületab 12 punkti (uurija ise saab kogunenud kogemustele tuginedes täiendavalt täpsustada kuni 24-punktiliste näitajatega omaduse väljenduse mõõdu tunnuseid).

Keskmiste statistiliste normide määramisele keskendunud testid ning nende aktsepteerimine hindamis- ja integreerimiskriteeriumitena võimaldavad normatiivselt orienteeritud testimist (NORT). Selliseid normatiivseid hindamistoiminguid kasutatakse pedagoogilises praktikas sageli. Näiteks teatud õppeainetes on olemas teadmiste, võimete ja oskuste hindamise kriteeriumid ning hinnete määramise standardid on erinevates õppeainetes kehtestatud hinnete määramise standarditega. NORT-i saab läbi viia paljude testide abil (Raveni test, Cattelli test, subjektiivse kontrolli taseme diagnoosimise meetodid jne).

On palju juhtumeid, mil on oluline arvestada sama aine soorituse muutustega teatud aja jooksul, näiteks enne koolituse algust ja pärast koolituse läbimist mõnes õppematerjalis. See võimaldab fikseerida uuritava võimed ning perioodiline diagnostika ja tema näitajate võrdlemine varasematega võimaldab tuvastada uuritava vara arengutempo ja -suuna. Sellistel juhtudel viiakse testitulemuste tõlgendamine läbi valitud kriteeriumide vaatenurgast, mis näitab katsealuse edusamme õppematerjali sisu valdamisel ja teatud vaimsete omaduste arendamisel. Paljud intellektuaalsed testid, saavutustestid jne võimaldavad neid ülaltoodud tähenduses kasutada. Katsenorm on sellistel juhtudel individuaalne.

Samuti on võimalik, et testi norm määratakse sisupõhiselt, tuginedes ülesande materjali loogilise ja psühholoogilise ülesehituse analüüsile, kui testi edukust tõlgendatakse uuritava omaduse kvalitatiivsete omaduste kaudu. . Sellised kvalitatiivsed omadused toimivad testi sooritaja saavutuste hindamise kriteeriumidena ja testimine ise muutub kriteeriumipõhiseks. Kriteeriumipõhine testimine (KORT) võimaldab üsna edukalt ühendada testimise, tulemuse tõlgendamise ja õppimise käigu (moodustamise) korrigeerimise. Tuletame veel kord meelde, et ülesannete täitmise tulemused CORT-is on korrelatsioonis ülesande (testi) sisu kvalitatiivsete omadustega, mitte aga mingi keskmise statistilise edukuse tasemega selle täitmisel, nagu NORT-is.

Näitena võib tuua “ARP metoodika” ja vastava tehnikaploki, mille on välja pakkunud üks käesoleva käsiraamatu autoritest. Selle ploki täitmine võimaldab määrata õppeaine – kooliõpilase – mõtlemise arengutaseme, mis võib olla empiiriline, analüütiline, planeeriv ja reflekteeriv. Kuna ühe või teise mõtlemise arengutaseme kujunemine on eelduseks tulevase järgmise arengutaseme võimalikule kujunemisele, siis on seega võimalus: 1) aktsepteerida neid tasemeid uuritava omaduse hindamise kriteeriumidena; 2) järgmise, kehtestatud tasemest kõrgema taseme aktsepteerimine mõtlemise edasise arengu suunana ja õpilase mõtlemise vahetu arengutsooni määramine; 3) ühe või mitme õppeaine jaoks adekvaatse harjutuste komplekti koostamine, mille elluviimine peaks viima õpilase mõtlemise sobiva arengutaseme saavutamiseni1.

Testide läbiviimiseks ja saadud tulemuste tõlgendamiseks kehtivad teatud reeglid. Need reeglid on üsna selgelt välja töötatud ja peamistel on järgmine tähendus: 1)

katsealuse teavitamine testimise eesmärkidest; 2)

uuritava testimisülesannete täitmise juhistega tutvumine ja uurija kindlustunde saavutamine, et juhised on õigesti arusaadavad; 3)

olukorra tagamine, kus uuritavad saavad rahulikult ja iseseisvalt ülesandeid täita; testi tegijatesse neutraalse suhtumise säilitamine, vihjete ja abistamise vältimine; 4)

iga testi või vastava ülesandega kaasnevate saadud andmete töötlemise ja tulemuste tõlgendamise metoodiliste juhiste järgimine uurija poolt; 5)

testimise tulemusena saadud psühhodiagnostilise teabe leviku takistamine, selle konfidentsiaalsuse tagamine; 6)

katsealuse tutvustamine testi tulemustega, talle või vastutavale isikule vastava teabe edastamine, arvestades põhimõtet „Ära kahjusta!”; sel juhul on vaja lahendada rida eetilisi ja moraalseid probleeme; 7)

teiste uurimismeetodite ja -võtetega saadud teabe kogumine uurija poolt, nende omavaheline korrelatsioon ja nendevahelise kooskõla kindlaksmääramine; rikastades oma kogemusi testiga ja teadmistega selle rakenduse funktsioonide kohta.

Nagu juba märgitud, on iga testiga kaasas konkreetsed juhised ja juhised saadud andmete töötlemiseks ja tõlgendamiseks.

Samuti on mitut tüüpi teste, millest igaühega kaasnevad vastavad testimisprotseduurid.

Võimete testid võimaldavad tuvastada ja mõõta teatud vaimsete funktsioonide ja kognitiivsete protsesside arengutaset.

Selliseid teste seostatakse kõige sagedamini indiviidi kognitiivse sfääri diagnoosiga, mõtlemise omadustega ja neid nimetatakse tavaliselt ka intellektuaalseteks. Nende hulka kuuluvad näiteks Raveni test, Amthaueri test, Wechsleri testi vastavad alamtestid jne, aga ka üldistus-, klassifitseerimis- ja mitmed muud uurimistöö laadi testid.

Saavutustestid on suunatud konkreetsete teadmiste, oskuste ja vilumuste kujunemise taseme väljaselgitamiseks ja mõõdupuuks.

1 Vaata: Atakhanov R.A. Matemaatiline mõtlemine ja selle arengutaseme määramise meetodid // Teaduslik. toim. V. V. Davidova. - Riia, 2000.

rakendamise edukust ja mõne tegevuse elluviimise valmisoleku mõõdupuuna. Näitena võib kasutada kõiki katseeksamite juhtumeid. Praktikas kasutatakse tavaliselt saavutustesti "patareisid".

Isiksusetestid on mõeldud katsealuste isiksuseomaduste tuvastamiseks. Neid on palju ja erinevaid: on olemas indiviidi seisundite ja emotsionaalse ülesehituse küsimustikud (näiteks ärevustestid), tegevuse motivatsiooni ja eelistuste küsimustikud, isiksuseomaduste ja suhete määramine.

On olemas rühm teste, mida nimetatakse projektiivseteks, mis võimaldavad meil tuvastada hoiakuid, teadvustamata vajadusi ja impulsse, ärevust ja hirmuseisundit. Uuritavale pakutakse erinevaid stiimuleid, näiteks süžeeliselt määratlemata pilte, lõpetamata lauseid, konfliktsituatsioonidega süžeejooniseid jms koos palvega neid tõlgendada. Selliste ülesannete täitmise mehhanism avaldub selles, et subjekt korraldab mingil moel stiimulimaterjali elemente ja annab neile subjektiivse tähenduse, peegeldades tema isiklikku kogemust ja kogemusi. Teisisõnu, projektiivsed testid põhinevad tuvastamisel, et inimene suudab oma sisemaailma välismaailmale "projitseerida" mehhanismi olemasolu, kui ta omistab tahtmatult teistele inimestele need ajed, vajadused ja soovid, mida tavaliselt alla surutakse. See tähendab, et projektiivsed testid võimaldavad meil diagnoosida inimese teadvuseta kogemusi piisava objektiivsusega. Sellised testid on temaatiline appertseptsiooni test, Rorschachi “tindilaikude” test, laialdaselt kasutatav Rosenzweigi frustratsioonitest jne. Kasutatakse ka graafilisi projektiivseid võtteid, kus uurija asetab uuritava olukorda, mis projitseerib oma seisundit, isiksuseomadusi ja suhteid. reaalsusele, kujutades maja, puud, perekonda, inimest, olematut looma ja selle tõlgendust. Näiteks test “Inimese konstruktiivne joonistamine geomeetrilistest kujunditest” paljastab individuaalsed tüpoloogilised erinevused, analüüsides kümnest kujundist (kolmnurgad, ruudud ja ringid ning nende kombinatsioon võib olla mis tahes) koostatud inimese joonist: katsealune võib osutuda kuuluvaks “juhi” tüüpi, “ärevil ja kahtlustavad isikud” jne.

Testide kasutamine on alati seotud ühe või teise psühholoogilise omaduse avaldumise mõõtmisega ja selle arengu või kujunemise taseme hindamisega. Seetõttu on testi kvaliteet oluline. Testi kvaliteeti iseloomustavad selle täpsuse kriteeriumid ehk usaldusväärsus ja valiidsus.

Testi usaldusväärsuse määrab see, kui stabiilsed on saadud tulemused ja kui sõltumatud nad on juhuslikest teguritest. Loomulikult räägime samade subjektide tunnistuste võrdlemisest. See tähendab, et usaldusväärsel testil peab olema ühtlane testitulemus mitmes testis ja see võib olla kindel, et test tuvastab sama omaduse. Testide usaldusväärsuse kontrollimiseks kasutatakse erinevaid meetodeid. Üks võimalus on äsja mainitud kordustestimine: kui esimese ja järgneva kordustestimise tulemused näitavad piisavat korrelatsioonitaset, näitab see testi usaldusväärsust. Teine meetod on seotud teise samaväärse testivormi kasutamisega ja nendevahelise kõrge korrelatsiooni olemasoluga (mõned testid pakutakse kasutajatele kahes vormis; näiteks Eysencki EPI küsimustik - temperamendi määratluse järgi - on samaväärne vormid A ja B). Usaldusväärsuse hindamisel on võimalik kasutada ka kolmandat meetodit, kui test võimaldab selle jagada kaheks osaks ning sama katsealuste rühma uuritakse testi mõlema osa abil. Testi usaldusväärsus näitab, kui stabiilsed võivad testi tulemused olla, kui täpselt mõõdetakse psühholoogilisi parameetreid ja kui kõrge võib olla uurija kindlustunne saadud tulemuste suhtes.

Testi kehtivus annab vastuse küsimusele, mida test täpselt paljastab ja kui sobiv see on selleks, et teha kindlaks, mida sellega tahetakse teha. Näiteks võimete testid näitavad sageli midagi muud: koolitust, vastava kogemuse olemasolu või vastupidi selle puudumist. Sellisel juhul ei vasta test kehtivusnõuetele.

Psühhodiagnostikas on erinevat tüüpi kehtivust. Lihtsamal juhul määratakse testi kehtivus tavaliselt testimise tulemusel saadud näitajate võrdlemisel eksperthinnangutega selle omaduse olemasolu kohta katseisikutes (praegune kehtivus või "samaaegne" valiidsus), samuti analüüsides. uuritavate erinevates elu- ja tööolukordades vaatlemise tulemusena saadud andmed ning nende saavutused vastavas valdkonnas. Testi kehtivuse küsimuse saab lahendada ka selle andmete võrdlemisel näitajatega, mis on saadud antud tehnikaga seotud tehnikat kasutades, mille kehtivus loetakse kindlaks tehtud.

Enne kui psühhodiagnostilisi meetodeid saab praktilistel eesmärkidel kasutada, tuleb neid testida mitme formaalse kriteeriumi alusel, mis tõestavad nende kõrget kvaliteeti ja tõhusust. Psühhodiagnostika tehnikate hindamise peamised kriteeriumid on usaldusväärsus ja kehtivus. Nende mõistete väljatöötamisel andsid suure panuse välismaised psühholoogid (A. Anastasi, E. Ghiselli, J. Guilford, L. Cronbach, R. Thorndike, E. Hagen jt). Nad töötasid välja formaalse loogilise ja matemaatilis-statistilise aparaadi (peamiselt korrelatsioonimeetodi ja faktianalüüsi), et põhjendada meetodite vastavust märgitud kriteeriumidele.

Traditsioonilises testimises on termin "usaldusväärsus" tähendab katsetulemuste suhtelist püsivust, stabiilsust, järjepidevust esmasel ja korduval kasutamisel samadel isikutel.

Tehnika töökindlus- see on kriteerium, mis näitab psühholoogiliste mõõtmiste täpsust, see tähendab, et see võimaldab hinnata, kui usaldusväärsed on saadud tulemused.

See on katsealuste testimise tulemuste järjepidevus erinevatel ajahetkedel, esmasel ja sekundaarsel testimisel ning samaväärsuse ja sisu poolest erinevate ülesannete kasutamisel. Usaldusväärsus iseloomustab omaduste, kuid mitte olekute teste. Omadused:

    1. Uurimistulemuste reprodutseeritavus.
    2. Mõõtmise täpsus.
    3. Tulemuste jätkusuutlikkus.

Meetodite usaldusväärsuse aste sõltub paljudest põhjustest. hulgas negatiivsed tegurid kõige sagedamini mainitud on järgmised:

    1. diagnoositud vara ebastabiilsus;
    2. diagnostikameetodite ebatäiuslikkus (juhised on koostatud hooletult, ülesanded on olemuselt heterogeensed, juhised meetodi uuritavatele esitamiseks pole selgelt sõnastatud jne);
    3. muutuv uurimissituatsioon (erinevad kellaajad katsete läbiviimisel, erinev ruumi valgustus, kõrvalise müra olemasolu või puudumine jne);
    4. erinevused katse läbiviija käitumises (katsest katsesse esitab ta juhiseid erinevalt, stimuleerib erinevalt ülesannete täitmist jne);
    5. katsealuse funktsionaalse seisundi kõikumised (ühes katses on tervis hea, teises - väsimus jne);
    6. subjektiivsuse elemendid tulemuste hindamise ja tõlgendamise meetodites (katsealuste vastuste fikseerimisel hinnatakse vastuseid terviklikkuse, originaalsuse jms järgi).

Metoodika usaldusväärsuse tõstmise üheks olulisemaks vahendiks on eksamiprotseduuri ühtsus, selle range regulatsioon: sama keskkond, sama tüüpi juhised, kõigile samad ajapiirangud, katseisikutega kokkupuute meetodid ja tunnused, eksamite läbiviimise kord ja reeglid. ja nii edasi.

Meetodite usaldusväärsuse tunnuseid mõjutab suuresti uuritav valim. See võib seda näitajat kas vähendada või üle hinnata, näiteks usaldusväärsust, võib seda kunstlikult paisutada, kui valimis on väike tulemuste hajuvus, s.t. kui tulemused on üksteisele lähedased. Seetõttu kirjeldatakse juhendis tavaliselt valimit, mille põhjal määrati tehnika usaldusväärsus.

Praegu määratakse usaldusväärsus üha enam kõige homogeensematel proovidel, s.t. soo, vanuse, haridustaseme, erialase ettevalmistuse jms osas sarnastel proovidel.

Meetodi usaldusväärsust on sama palju, kui on tingimusi, mis mõjutavad diagnostiliste testide tulemusi. Kuna kõik usaldusväärsuse tüübid peegeldavad kahe sõltumatult saadud näitajate seeria järjepidevuse astet, on matemaatiline ja statistiline tehnika, mille abil metoodika usaldusväärsust tuvastatakse, korrelatsioonid (Pearsoni või Spearmani järgi). Mida rohkem saadud korrelatsioonikoefitsient läheneb ühtsusele, seda suurem on usaldusväärsus ja vastupidi.

K.M. Gurevitš soovitati tõlgendada usaldusväärsust järgmiselt:

    1. mõõtevahendi enda töökindlus (usaldusväärsuse koefitsient);
    2. uuritava tunnuse stabiilsus (stabiilsuse koefitsient);
    3. püsivus, s.t. tulemuste suhteline sõltumatus eksperimenteerija isiksusest (konstantsuse koefitsient).

Mõõtevahendit iseloomustavat indikaatorit soovitatakse nimetada usaldusväärsuse koefitsiendiks; mõõdetava omaduse stabiilsust iseloomustav näitaja - stabiilsuskoefitsient; ja katsetaja isiksuse mõju hindamise näitaja on püsivuse koefitsient. Just selles järjekorras on soovitatav kontrollida metoodikat: kõigepealt on soovitatav kontrollida mõõtevahendit. Kui saadud andmed on rahuldavad, siis saame asuda mõõdetava omaduse stabiilsuse mõõdiku määramisse ja seejärel vajadusel töötada püsivuse kriteeriumiga. (Usaldusväärsus: test-retest, paralleelvormid, kehaosad, sisemine konsistents, faktoriaalne dispersioon).

Mõõtevahendi töökindluse määramine. Mõõtmise täpsus ja objektiivsus sõltub sellest, kuidas metoodika on koostatud, kui õigesti on valitud ülesanded ja kui ühtlane see on.

Mõõteriista töökindluse kontrollimiseks, näidates selle homogeensust (homogeensust), kasutatakse poolitusmeetodit. Ülesanded jagatakse paaris- ja paarituteks (kõik ülesanded tuleb täita) ning seejärel korreleeritakse tulemused omavahel. Kui metoodika on homogeenne, siis nende poolte vahel suurt eduvahet ei ole, koefitsient on kõrge. Saate võrrelda osi, kuid parem on võrrelda paaris ja paaritu, sest see meetod ei sõltu treeningust, väsimusest jne.

Tehnika on usaldusväärne, kui koefitsient pole madalam 0,75 - 0,85, parem 0,90 ja üle selle.

Uuritava tunnuse stabiilsuse määramine. Samuti on vaja kindlaks teha, kui stabiilne on tunnus, mida uurija kavatseb mõõta. Märk võib aja jooksul muutuda, kuid selle kõikumine ei tohiks olla ettearvamatu.

Kontrollimiseks kasutatakse tehnikat, mida nimetatakse test-retest. See seisneb ainete uuesti läbivaatamises, kasutades sama tehnikat. Stabiilsust hinnatakse esimese ja teise uuringu tulemuste vahelise korrelatsioonikoefitsiendi järgi. See näitab, kas iga katseisik säilitab valimis oma järjekorranumbri või mitte.

Stabiilsuse taset mõjutavad mitmesugused tegurid. Järgida tuleb kontrollimenetluse ühtsust.

Tunnuse stabiilsuse määramisel on suur tähtsus ajavahemikul 1 kuni 2 uuringu vahel. Mida lühem on see intervall, seda suurem on võimalus, et see märk säilitab esimese testi taseme. Soovitav on testida uuesti mõne aja pärast pärast testimist. Eksperimenteerija määrab selle perioodi ise, kuid sagedamini näitavad nad psühholoogilises kirjanduses mitmekuulist (kuid mitte rohkem kui kuuekuulist) intervalli. Mõõdetava vara stabiilsuse küsimust ei lahendata alati ühtlaselt. Otsus sõltub diagnoositava sümptomi olemusest.

Kui mõõdetav omadus on juba moodustatud, ei tohiks koefitsient olla väiksem kui 0,80.

Püsivuse definitsioon, st. tulemuste suhteline sõltumatus eksperimenteerija isiksusest. Kuna tehnikat arendatakse edasiseks kasutamiseks teistele psühhodiagnostikutele, on vaja kindlaks teha, mil määral mõjutab selle tulemusi eksperimenteerija isiksus. Konstantsuse koefitsient määratakse kahe sama prooviga, kuid erinevate katsetajate poolt tehtud katse tulemuste korrelatsiooni teel. Korrelatsioonikoefitsient ei tohiks olla väiksem kui 0,80.

Kehtivuse küsimus otsustatakse pärast usaldusväärsuse kindlakstegemist, kuna ebausaldusväärne tehnika ei saa kehtida.

Kehtivus test – kontseptsioon, mis ütleb meile, mida test mõõdab ja kui hästi see seda teeb (A. Anastasi). Kehtivus oma olemuselt on see kompleksne tunnus, mis sisaldab ühelt poolt teavet selle kohta, kas tehnika sobib selle mõõtmiseks, milleks see loodi, ja teiselt poolt, milline on selle tõhusus, tõhusus ja praktiline kasulikkus.

Sel põhjusel ei ole kehtivuse määramiseks ühtset universaalset lähenemisviisi. Olenevalt sellest, millist valiidsuse aspekti uurija kaaluda soovib, kasutatakse erinevaid tõendusmeetodeid. Teisisõnu hõlmab kehtivuse mõiste selle erinevaid tüüpe, millel on oma eriline tähendus. Metoodika kehtivuse kontrollimist nimetatakse valideerimiseks.

Valiidsus on konkreetse uuringu vastavus aktsepteeritud standarditele (veatu katse).

Valiidsus selle esimeses arusaamas on seotud metoodika endaga, st. see on mõõteriista kehtivus. Seda tüüpi kontrolli nimetatakse teoreetiliseks kinnitamiseks. Valiidsus oma teises arusaamas ei viita niivõrd metoodikale, kuivõrd selle kasutamise eesmärgile. See on pragmaatiline valideerimine.

Teoreetilise valideerimise käigus huvitab teadlast tehnikaga mõõdetud omadus ise.

Kuna teoreetilise valideerimise määramiseks on raske leida ühtegi sõltumatut kriteeriumi, mis jääks metoodikast väljapoole, ja seetõttu peeti alusetuid väiteid selle metoodika kehtivuse kohta varem iseenesestmõistetavaks. Kuna teoreetilise valideerimise eesmärk on tõestada, et tehnika mõõdab täpselt seda omadust, mida ta peaks mõõtma. Teoreetilise valideerimise jaoks on põhiprobleemiks psühholoogiliste nähtuste ja nende näitajate vaheline seos, mille abil nad püüavad neid psühholoogilisi nähtusi mõista. See näitab, et autori kavatsus ja metoodika tulemused langevad kokku.

Uue tehnika teoreetilist valideerimist pole nii keeruline läbi viia, kui antud omaduse mõõtmiseks on juba olemas tehnika, mille kehtivus on teada ja tõestatud. Korrelatsiooni olemasolu uue ja sarnase vana tehnika vahel näitab, et väljatöötatud tehnika mõõdab sama psühholoogilist kvaliteeti kui referentstehnika.

Teoreetilise valiidsuse kontrollimiseks on ühelt poolt oluline kindlaks teha seose aste seotud tehnikaga (konvergentne valiidsus) ja teiselt poolt selle seose puudumine tehnikatega, millel on erinev teoreetiline alus (diskriminantvaliditeet). ).

Metoodika mõõdikute mõistmisel mängib olulist rolli selle näitajate võrdlemine praktiliste tegevusvormidega. Oluline on, et metoodika oleks teoreetiliselt läbi töötatud.

Pragmaatiline valideerimine

Kontrollitakse metoodika praktilist tõhusust, olulisust ja kasulikkust, kuna metoodikat saab kasutada ainult siis, kui on tõestatud, et mõõdetav omadus avaldub teatud tüüpi tegevustes.

Pragmaatilise kehtivuse testimiseks kasutatakse sõltumatut väliskriteeriumi - uuritava omaduse igapäevaelus avaldumise näitajat. Selliseks kriteeriumiks võib olla akadeemiline sooritus (õpivõimetestide, saavutusteste, intelligentsuse testide jaoks), tootmissaavutused (professionaalse orientatsiooni meetodite jaoks), reaalse tegevuse tõhusus - joonistamine, modelleerimine jne (erivõimete testid). ), subjektiivsed hinnangud ( isiksusetestide jaoks).

Ameerika teadlased Tiffin ja McCormick tuvastasid 4 tüüpi väliseid kriteeriume:

    1. Tulemuslikkuse kriteerium (tehtud töö maht, õppeedukus, aeg, kvalifikatsiooni kasvutempo).
    2. Subjektiivsed kriteeriumid (sisaldavad erinevat tüüpi vastuseid, mis kajastavad inimese suhtumist millessegi, tema arvamusi, vaateid).
    3. Füsioloogiline kriteerium (kasutatakse kehale ja psüühikale mõjuva väliskeskkonna mõju uurimisel).
    4. Juhuslikkuse kriteerium (näiteks kui eesmärk on valida tööle need isikud, kes on vähem altid õnnetustele).

Väliskriteeriumil peab olema kolm peamist nõuet:

    1. See peab olema asjakohane, st peab olema kindlustunne, et kriteerium hõlmab täpselt neid individuaalse psüühika tunnuseid, mida diagnostikatehnika mõõdab. Väline kriteerium ja diagnostiline mudel peavad olema sisemises semantilises vastavuses.
    2. Peab olema häireteta (saaste). Uurimiseks tuleks valida inimeste rühmad, kes on enam-vähem identsetes tingimustes.
    3. Peab olema usaldusväärne. Uuritava funktsiooni püsivus ja stabiilsus.

Metoodika kehtivuse hindamine võib olla kvantitatiivne ja kvalitatiivne.

Kvantitatiivse näitaja (validsuse koefitsiendi) arvutamiseks võrreldakse diagnostikatehnikate rakendamisel saadud tulemusi samade isikute andmetega, mis on saadud välise kriteeriumi abil. Kasutatakse erinevat tüüpi lineaarset korrelatsiooni (Spearmani järgi, Pierseni järgi).

Mõõdetava vara olemuse kvalitatiivne kirjeldus. Siin ei kasutata statistilist töötlust.

Neid on mitu kehtivuse tüübid Diagnostikatehnika iseärasuste ja välise kriteeriumi ajutise oleku tõttu:

    1. Sisu kehtivus (kasutatakse saavutustestides): 3 - 4 küsimust suurest teemast võivad näidata õpilase tõelisi teadmisi. Selleks võrreldakse diagnostilisi tulemusi õpetaja eksperthinnangutega.
    2. Kaasaegne kehtivus või praegune kehtivus – kogutakse praeguse aja kohta olulisi andmeid: õppeedukus, produktiivsus jne. Testi edu tulemused korreleeruvad nendega.
    3. "Ennustav" kehtivus ("ennustuslik"). See määratakse usaldusväärse välise kriteeriumi alusel, kuid teavet selle kohta kogutakse mõni aeg pärast testi. Prognoosi täpsus on pöördvõrdeline selliseks prognoosimiseks määratud ajaga.
    4. "Tagasiulatuv" kehtivus. Määratakse minevikusündmusi või kvaliteediseisundit kajastava kriteeriumi alusel. Seda saab kasutada kiireks teabe saamiseks tehnika prognoosimisvõimaluste kohta.

Gennadii_M 17. märts 2016, kell 14:52

Testimine. Fundamentaalne teooria

  • IT-süsteemide testimine
  • Õpetus

Mul oli hiljuti Middle QA-s intervjuu projekti jaoks, mis ületab selgelt minu võimalused. Kulutasin palju aega millelegi, mida ma üldse ei teadnud, ja vähe aega lihtsa teooria kordamisele, kuid asjata.

Allpool on põhitõed, mida tuleb enne praktikandi ja juuniori vestlust läbi vaadata: testimise määratlus, kvaliteet, kontrollimine/valideerimine, eesmärgid, etapid, katseplaan, katseplaani punktid, testi ülesehitus, testi kavandamise tehnikad, jälgitavusmaatriks, testjuhtum, kontrollnimekiri, defekt, viga/defekt/tõrge, veaaruanne, tõsidus vs prioriteet, testimise tasemed, tüübid/tüübid, integratsiooni testimise lähenemisviisid, testimise põhimõtted, staatiline ja dünaamiline testimine, uurimuslik/ad-hoc testimine, nõuded, vea elutsükkel, tarkvara arendamise etapid, otsustustabel, qa/qc/testinsener, ühendusskeem.

Kõik kommentaarid, parandused ja täiendused on väga teretulnud.

Tarkvara testimine- programmi tegeliku ja eeldatava käitumise vahelise vastavuse kontrollimine, mis viiakse läbi teatud viisil valitud piiratud testide komplekti alusel. Laiemas mõttes on testimine üks kvaliteedikontrolli võtteid, mis hõlmab töö planeerimise (Test Management), testi kavandamise (Test Design), testimise läbiviimise (Test Execution) ja tulemuste analüüsi (Test Analysis) tegevusi.

Tarkvara kvaliteet on tarkvara omaduste kogum, mis on seotud selle võimega rahuldada väljakuulutatud ja eeldatavaid vajadusi.

Kontrollimine on süsteemi või selle komponentide hindamise protsess, et teha kindlaks, kas praeguse arenguetapi tulemused vastavad selle etapi alguses kujunenud tingimustele. Need. kas meie praeguse etapi alguses määratletud eesmärgid, tähtajad ja projekti arendusülesanded on täidetud.
Kinnitamine- see on kindlaksmääramine, kas arendatav tarkvara vastab kasutaja ootustele ja vajadustele ning süsteeminõuetele.
Võite leida ka teise tõlgenduse:
Toote sõnaselgetele nõuetele (spetsifikatsioonidele) vastavuse hindamise protsess on kontrollimine, samas kui toote kasutaja ootustele ja nõuetele vastavuse hindamine on valideerimine. Sageli võite leida ka nende mõistete järgmise definitsiooni:
Valideerimine – "kas see on õige spetsifikatsioon?".
Kontrollimine – "kas süsteem vastab spetsifikatsioonidele?".

Testi eesmärgid
Suurendage tõenäosust, et testimiseks mõeldud rakendus töötab igal juhul õigesti.
Suurendage tõenäosust, et testitav rakendus vastab kõigile kirjeldatud nõuetele.
Ajakohase teabe pakkumine toote hetkeseisu kohta.

Testimise etapid:
1. Tooteanalüüs
2. Nõuetega töötamine
3. Testimisstrateegia väljatöötamine
ja kvaliteedikontrolli protseduuride kavandamine
4. Testi dokumentatsiooni koostamine
5. Prototüübi testimine
6. Põhitestimine
7. Stabiliseerimine
8. Operatsioon

Katseplaan- see on dokument, mis kirjeldab kogu testimistöö ulatust, alustades objekti kirjeldusest, strateegiast, ajakavast, testimise alustamise ja lõpetamise kriteeriumidest kuni protsessis vajalike seadmete, eriteadmiste, aga ka riskide hindamiseni. nende lahendamise võimalused.
Vastab küsimustele:
Mida tuleks testida?
Mida sa testid?
Kuidas testida?
Millal sa testid?
Testimise alustamise kriteeriumid.
Testi sooritamise kriteeriumid.

Katseplaani põhipunktid
IEEE 829 standard loetleb punktid, millest testiplaan peaks (võib) koosneda:
a) katseplaani identifikaator;
b) Sissejuhatus;
c) katseesemed;
d) testitavad omadused;
e) funktsioonid, mida ei katseta;
f) lähenemine;
g) kauba läbimise/mittearvestuse kriteeriumid;
h) peatamise kriteeriumid ja jätkamise nõuded;
i) testi tulemused;
j) testimisülesanded;
k) keskkonnavajadused;
l) kohustused;
m) personali- ja koolitusvajadused;
n) ajakava;
o) riskid ja ettenägematud asjaolud;
p) Heakskiidud.

Testi disain– see on tarkvara testimisprotsessi etapp, kus vastavalt eelnevalt määratletud kvaliteedikriteeriumidele ja testimiseesmärkidele kavandatakse ja luuakse teststsenaariumid (testjuhtumid).
Testi kavandamise eest vastutavad rollid:
Testianalüütik – teeb kindlaks „MIDA testida?”
Testi kujundaja – määrab „KUIDAS testida?”

Testide kujundamise tehnikad

Ekvivalentsuse jagamine (EP). Näiteks kui teil on kehtivate väärtuste vahemik vahemikus 1 kuni 10, peate valima intervalli sees ühe õige väärtuse, näiteks 5, ja ühe vale väärtuse väljaspool intervalli, 0.

Piirväärtuse analüüs (BVA). Kui võtame ülaltoodud näite, valime positiivse testimise väärtusteks miinimum- ja maksimumpiirid (1 ja 10) ning piirväärtustest suuremad ja väiksemad väärtused (0 ja 11). Piirväärtuste analüüsi saab rakendada väljadele, kirjetele, failidele või mis tahes tüüpi piiratud olemitele.

Põhjus/tagajärg – CE. See on reeglina tingimuste (põhjuste) kombinatsioonide sisestamine, et saada süsteemilt vastus (efekt). Näiteks testite võimalust lisada klient konkreetse kuva abil. Selleks peate sisestama mitu välja, näiteks "Nimi", "Aadress", "Telefoninumber" ja seejärel klõpsama nuppu "Lisa" - see on "Põhjus". Pärast nupu "Lisa" klõpsamist lisab süsteem kliendi andmebaasi ja näitab ekraanil tema numbrit - see on "Uurimine".

Arvamisviga (EG). See on siis, kui testija kasutab oma teadmisi süsteemist ja spetsifikatsiooni tõlgendamise võimet, et "ennustada", millistel sisendtingimustel süsteem võib vea tekitada. Näiteks spetsifikatsioon ütleb "kasutaja peab sisestama koodi". Testija mõtleb: "Mis saab siis, kui ma ei sisesta koodi?", "Mis siis, kui ma sisestan vale koodi? ", ja nii edasi. See on vea ennustus.

Ammendav testimine (ET)- see on äärmuslik juhtum. Selle tehnika raames peaksite testima kõiki võimalikke sisendväärtuste kombinatsioone ja põhimõtteliselt peaks see kõik probleemid leidma. Praktikas ei ole selle meetodi kasutamine sisendväärtuste tohutu hulga tõttu võimalik.

Paaripõhine testimine on testide andmekogumite genereerimise tehnika. Olemuse saab sõnastada näiteks järgmiselt: andmekogumite moodustamine, milles iga testitud parameetri iga testitud väärtus kombineeritakse vähemalt korra kõigi teiste testitud parameetrite iga testitud väärtusega.

Oletame, et inimese jaoks arvutatakse mingi väärtus (maks) tema soo, vanuse ja laste olemasolu põhjal - saame kolm sisendparameetrit, millest igaühe jaoks valime testide jaoks mingil moel väärtused. Näiteks: sugu – mees või naine; vanus - kuni 25, 25 kuni 60, üle 60 aasta; laste olemasolu - jah või ei. Arvutuste õigsuse kontrollimiseks võite loomulikult läbida kõigi parameetrite kõik väärtuste kombinatsioonid:

korrus vanus lapsed
1 mees kuni 25 pole lapsi
2 naine kuni 25 pole lapsi
3 mees 25-60 pole lapsi
4 naine 25-60 pole lapsi
5 mees üle 60 pole lapsi
6 naine üle 60 pole lapsi
7 mees kuni 25 Kas teil on lapsi
8 naine kuni 25 Kas teil on lapsi
9 mees 25-60 Kas teil on lapsi
10 naine 25-60 Kas teil on lapsi
11 mees üle 60 Kas teil on lapsi
12 naine üle 60 Kas teil on lapsi

Või võite otsustada, et me ei soovi kõigi parameetriväärtuste kombinatsioone kõigiga, vaid tahame lihtsalt veenduda, et kontrollime kõiki unikaalseid parameetriväärtuste paare. See tähendab, et näiteks soo ja vanuse parameetrite osas tahame olla kindlad, et kontrollime täpselt alla 25-aastast meest, 25-60-aastast meest, 60-aastast meest, samuti alla 25-aastast naist, naist 25 ja 60 vahel ja nii edasi naine pärast 60. Ja täpselt sama ka kõigi teiste parameetripaaride puhul. Ja nii saame palju väiksemaid väärtuste komplekte (neil on kõik väärtuspaarid, kuigi mõned kaks korda):

korrus vanus lapsed
1 mees kuni 25 pole lapsi
2 naine kuni 25 Kas teil on lapsi
3 mees 25-60 Kas teil on lapsi
4 naine 25-60 pole lapsi
5 mees üle 60 pole lapsi
6 naine üle 60 Kas teil on lapsi

Selline lähenemine on umbkaudu paaripõhise testimise tehnika olemus – me ei testi kõikide väärtuste kõiki kombinatsioone, vaid testime kõiki väärtuspaare.

Jälgitavuse maatriks – nõuete täitmise maatriks on kahemõõtmeline tabel, mis sisaldab vastavust toote funktsionaalsete nõuete ja ettevalmistatud testjuhtumite vahel. Tabeli veergude pealkirjad sisaldavad nõudeid ja reapealkirjad testistsenaariume. Ristmikul on märk, mis näitab, et praeguse veeru nõue on kaetud jooksva rea ​​testjuhtumiga.
Kvaliteedikontrolli insenerid kasutavad tootetestide katvuse kinnitamiseks nõuetele vastavuse maatriksit. MCT on testiplaani lahutamatu osa.

Testjuhtum on artefakt, mis kirjeldab samme, konkreetseid tingimusi ja parameetreid, mis on vajalikud testitava funktsiooni või selle osa rakendamise kontrollimiseks.
Näide:
Toiming Oodatav tulemus Testi tulemus
(läbitud/ebaõnnestunud/blokeeritud)
Ava leht “sisselogimine” Sisselogimisleht on avatud Läbitud

Igal katsejuhtumil peab olema 3 osa:
Eeltingimused Toimingute loend, mis viivad süsteemi põhitestimiseks sobivasse seisundisse. Või tingimuste loetelu, mille täitmine näitab, et süsteem on põhitesti läbiviimiseks sobivas olekus.
Testjuhtumi kirjeldus Loetelu toimingutest, mis viivad süsteemi ühest olekust teise, et saada tulemus, mille põhjal võib järeldada, et juurutus vastab nõuetele
Järeltingimused Toimingute loend, mis viivad süsteemi algolekusse (olek enne testi – algseisund)
Testskriptide tüübid:
Testjuhtumid jagunevad vastavalt oodatavale tulemusele positiivseteks ja negatiivseteks:
Positiivne testjuhtum kasutab ainult õigeid andmeid ja kontrollib, kas rakendus täitis kutsutud funktsiooni õigesti.
Negatiivne testjuhtum töötab nii õigete kui ka ebaõigete andmetega (vähemalt 1 vale parameeter) ja selle eesmärk on kontrollida erandolukordi (validaatorid käivituvad) ja kontrollida ka seda, et validaatori käivitamisel ei käivitataks rakenduse poolt välja kutsutud funktsiooni.

Kontrolli nimekiri on dokument, mis kirjeldab, mida tuleks testida. Samas võib kontrollnimekiri olla täiesti erineva detailsusega. Kui üksikasjalik kontrollnimekiri on, sõltub aruandlusnõuetest, töötajate tooteteadmiste tasemest ja toote keerukusest.
Reeglina sisaldab kontrollnimekiri ainult toiminguid (samme), ilma oodatud tulemuseta. Kontrollnimekiri on vähem vormistatud kui testskript. Seda on asjakohane kasutada, kui testskriptid on üleliigsed. Kontrollnimekirjad on seotud ka paindlike lähenemisviisidega testimisele.

Defekt (teise nimega viga) on lahknevus programmi täitmise tegeliku tulemuse ja oodatava tulemuse vahel. Defektid avastatakse tarkvara testimise etapis, kui testija võrdleb programmi (komponendi või disaini) tulemusi nõuete spetsifikatsioonis kirjeldatud oodatava tulemusega.

Viga- kasutaja viga, see tähendab, et ta proovib programmi teistmoodi kasutada.
Näide – sisestab tähed väljadele, kuhu tuleb sisestada numbreid (vanus, kauba kogus jne).
Kvaliteetne programm näeb selliseid olukordi ette ja kuvab punase ristiga veateate.
Viga (defekt)- programmeerija (või disaineri või kellegi teise arenduses osaleva) viga, st kui miski programmis ei lähe plaanipäraselt ja programm väljub kontrolli alt. Näiteks kui kasutaja sisestust mingil viisil ei kontrollita, põhjustavad valed andmed programmi töös krahhe või muid "rõõme". Või on programm seesmiselt üles ehitatud nii, et see ei vasta esialgu sellele, mida temalt oodatakse.
Ebaõnnestumine- rike (ja mitte tingimata riistvaraline) komponendi, terve programmi või süsteemi töös. See tähendab, et on defekte, mis põhjustavad tõrkeid (Defekt põhjustas rikke) ja on neid, mis mitte. Näiteks kasutajaliidese defektid. Kuid riistvaratõrge, millel pole tarkvaraga mingit pistmist, on samuti rike.

Veateade on dokument, mis kirjeldab olukorda või toimingute jada, mis viisid katseobjekti ebaõige tööni, märkides ära põhjused ja eeldatava tulemuse.
Kork
Lühikirjeldus (Kokkuvõte) Probleemi lühikirjeldus, mis näitab selgelt vea põhjuse ja tüübi.
Projekt Testitava projekti nimi
Rakenduse komponent (Component) Testitava toote osa või funktsiooni nimi
Versiooni number Versioon, millel viga leiti
Raskusaste Kõige tavalisem viieastmeline süsteem defekti raskusastme hindamiseks on:
S1 blokeerija
S2 Kriitiline
S3 märkimisväärne (suur)
S4 Minor
S5 Triviaalne
Prioriteet Defekti prioriteet:
P1 Kõrge
P2 Keskmine
P3 madal
Olek Vea olek. Sõltub kasutatavast protseduurist ja vea elutsüklist (vea töövoog ja elutsükkel)

Autor (Autor) Veaaruande looja
Määratud Probleemile määratud inimese nimi.
Keskkond
OS / hoolduspakett jne. / Brauser + versioon /… Teave keskkonna kohta, kus viga leiti: operatsioonisüsteem, hoolduspakett, veebi testimiseks - brauseri nimi ja versioon jne.

Kirjeldus
Taasesitamise sammud Toimingud, mille abil saate hõlpsalt reprodutseerida tõrkeni viinud olukorra.
Tegelik tulemus Tulemus, mis saadakse pärast reprodutseerimise etappide läbimist
Eeldatav tulemus Oodatav õige tulemus
Lisandmoodulid
Manus Logifail, ekraanipilt või muu dokument, mis aitab selgitada vea põhjust või näidata probleemi lahendamise viisi

Raskus vs prioriteet
Raskusaste on atribuut, mis iseloomustab defekti mõju rakenduse toimimisele.
Prioriteet on atribuut, mis näitab ülesande täitmise või defekti kõrvaldamise prioriteetsust. Võime öelda, et see on töö planeerimise juhi tööriist. Mida kõrgem on prioriteet, seda kiiremini tuleb defekt parandada.
Raskusaste paljastab tester
Prioriteet – juht, meeskonna juht või klient

Defekti raskusastme aste (raskusaste)

S1 blokeerija
Blokeerimisviga, mis muudab rakenduse mittetöötavaks, muutes edasise töö testitava süsteemi või selle põhifunktsioonidega võimatuks. Probleemi lahendamine on vajalik süsteemi edasiseks toimimiseks.

S2 Kriitiline
Kriitiline viga, valesti töötav äriloogika, auk turvasüsteemis, probleem, mis viis serveri ajutise krahhini või muutis mõne süsteemi osa töövõimetuks, ilma et oleks võimalik probleemi teiste sisestuspunktide abil lahendada. Probleemi lahendamine on vajalik testitava süsteemi põhifunktsioonidega edasiseks tööks.

S3 major
Märkimisväärne viga, osa peamisest äriloogikast ei tööta õigesti. Viga ei ole kriitiline või on võimalik testitava funktsiooniga töötada, kasutades muid sisendpunkte.

S4 Minor
Väike viga, mis ei riku testitava rakenduse osa äriloogikat, ilmne kasutajaliidese probleem.

S5 Triviaalne
Triviaalne viga, mis ei mõjuta rakenduse äriloogikat, halvasti reprodutseeritav probleem, mis on kasutajaliidese kaudu vaevumärgatav, probleem kolmandate osapoolte teekide või teenustega, probleem, mis ei avalda mingit mõju rakenduse üldisele kvaliteedile. toode.

Defektide prioriteedi aste (prioriteet)
P1 Kõrge
Viga tuleb võimalikult kiiresti parandada, sest... selle olemasolu on projekti jaoks kriitiline.
P2 Keskmine
Viga tuleb parandada, selle olemasolu ei ole kriitiline, kuid nõuab kohustuslikku lahendust.
P3 madal
Viga tuleb parandada, selle olemasolu ei ole kriitiline ega vaja kiiret lahendust.

Testimise tasemed

1. Ühiku testimine
Komponentide (ühikute) testimine kontrollib funktsionaalsust ja otsib defekte rakenduse osades, mis on juurdepääsetavad ja mida saab eraldi testida (programmi moodulid, objektid, klassid, funktsioonid jne).

2. Integratsiooni testimine
Süsteemi komponentide vahelist koostoimet kontrollitakse pärast komponentide testimist.

3. Süsteemi testimine
Süsteemi testimise põhieesmärk on kontrollida nii funktsionaalseid kui ka mittefunktsionaalseid nõudeid süsteemis tervikuna. See tuvastab sellised defektid nagu süsteemiressursside ebaõige kasutamine, kasutajataseme andmete tahtmatud kombinatsioonid, keskkonnaga mitteühildumine, soovimatud kasutusjuhtumid, puudulikud või ebaõiged funktsionaalsused, kasutamise ebamugavused jne.

4. Operatiivtestimine (Release Testing).
Isegi kui süsteem vastab kõigile nõuetele, on oluline tagada, et see vastaks kasutaja vajadustele ja täidaks oma rolli oma töökeskkonnas, nagu on määratletud süsteemi ärimudelis. Tuleb arvestada, et ärimudel võib sisaldada vigu. Seetõttu on viimase valideerimisetapina nii oluline läbi viia töötestimine. Lisaks võimaldab testimine tegevuskeskkonnas tuvastada mittefunktsionaalseid probleeme, nagu: konfliktid teiste ärivaldkonnaga seotud süsteemidega või tarkvaras ja elektroonilistes keskkondades; süsteemi ebapiisav jõudlus töökeskkonnas jne. Ilmselgelt on selliste asjade leidmine juurutamisetapis kriitiline ja kulukas probleem. Sellepärast on nii oluline läbi viia mitte ainult kontrollimine, vaid ka valideerimine alates tarkvaraarenduse esimestest etappidest.

5. Vastuvõtu testimine
Ametlik testimisprotsess, mis kontrollib, kas süsteem vastab nõuetele ja viiakse läbi, et:
määramine, kas süsteem vastab aktsepteerimiskriteeriumidele;
kliendi või muu volitatud isiku poolt otsuse tegemine, kas taotlus võetakse vastu või mitte.

Testimise tüübid/tüübid

Funktsionaalsed testimise tüübid

Funktsionaalne testimine
GUI testimine
Turvalisuse ja juurdepääsukontrolli testimine
Koostalitlusvõime testimine

Mittefunktsionaalsed testimise tüübid

Igat tüüpi jõudlustestid:
o koormuse testimine (jõudluse ja koormuse testimine)
o stressitestid
o Stabiilsuse/Usaldusväärsuse testimine
o helitugevuse testimine
Paigalduse testimine
Kasutatavuse testimine
Ebaõnnestumise ja taastamise testimine
Konfiguratsiooni testimine

Muutustega seotud testimise tüübid

Suitsu testimine
Regressioonitest
Uuesti testimine
Ehitamise kinnitustest
Terve mõistuse testimine

Funktsionaalne testimine arvestab etteantud käitumist ja põhineb komponendi või süsteemi kui terviku funktsionaalsuse spetsifikatsioonide analüüsil.

GUI testimine- liidese funktsionaalne kontroll nõuetele vastavuse osas - suurus, font, värv, ühtlane käitumine.

Turvalisuse testimine on testimisstrateegia, mida kasutatakse nii süsteemi turvalisuse kontrollimiseks kui ka rakenduste kaitsmisel tervikliku lähenemisviisi pakkumisega seotud riskide analüüsimiseks, häkkerite rünnakute, viiruste ja volitamata juurdepääsuga konfidentsiaalsetele andmetele.

Koostalitlusvõime testimine on funktsionaalne testimine, mis testib rakenduse võimet suhelda ühe või mitme komponendi või süsteemiga ning sisaldab ühilduvuse testimist ja integratsioonitesti

Stressi testimine- see on automatiseeritud testimine, mis simuleerib teatud arvu ärikasutajate tööd mõne ühise (jagatud) ressursi kallal.

Stressi testimine võimaldab kontrollida, kui tõhus on rakendus ja süsteem tervikuna pinge all ning hinnata ka süsteemi taastumisvõimet, s.t. pärast stressi lõppemist normaliseeruma. Stress võib selles kontekstis olla toimingute intensiivsuse suurenemine väga kõrgete väärtusteni või serveri konfiguratsiooni hädaolukorra muutmine. Samuti võib stressitestimise üheks ülesandeks olla jõudluse halvenemise hindamine, mistõttu võivad stressitesti eesmärgid kattuda jõudlustestimise eesmärkidega.

Helitugevuse testimine. Mahutestimise eesmärk on saada hinnang jõudlusele rakenduste andmebaasi andmemahu kasvades

Stabiilsuse / töökindluse testimine. Stabiilsuse (usaldusväärsuse) testimise ülesanne on kontrollida rakenduse funktsionaalsust pikaajalise (palju tundide) testimise käigus keskmise koormustasemega.

Paigalduse testimine mille eesmärk on kontrollida edukat installimist ja konfigureerimist, samuti tarkvara värskendamist või desinstallimist.

Kasutatavuse testimine on testimismeetod, mille eesmärk on kindlaks teha arendatava toote kasutatavuse, õpitavuse, arusaadavuse ja kasutajate jaoks atraktiivsuse aste antud tingimuste kontekstis. See hõlmab ka:
User eXperience (UX) on tunne, mida kasutaja kogeb digitaalse toote kasutamise ajal, samas kui kasutajaliides on tööriist, mis võimaldab kasutaja ja veebiressurssi suhelda.

Ebaõnnestumise ja taastamise testimine testib testitavat toodet, pidades silmas selle võimet taluda ja edukalt taastuda võimalikest tõrgetest, mis tulenevad tarkvaravigadest, riistvaratõrgetest või sideprobleemidest (nt võrgutõrge). Seda tüüpi testimise eesmärk on testida taastamissüsteeme (või põhifunktsioone dubleerivaid süsteeme), mis rikete korral tagavad testitava toote andmete ohutuse ja terviklikkuse.

Konfiguratsiooni testimine- spetsiaalset tüüpi testimine, mille eesmärk on kontrollida tarkvara toimimist erinevates süsteemikonfiguratsioonides (deklareeritud platvormid, toetatud draiverid, erinevad arvutikonfiguratsioonid jne)

Suits testimist käsitletakse kui lühikest testide tsüklit, mis tehakse kontrollimaks, et pärast koodi (uue või parandatud) koostamist käivitub installitud rakendus ja täidab põhifunktsioone.

Regressioonitest on testimise tüüp, mille eesmärk on kontrollida rakenduses või keskkonnas tehtud muudatusi (defekti parandamine, koodi ühendamine, migreerumine teise operatsioonisüsteemi, andmebaasi, veebiserverisse või rakendusserverisse), et kinnitada, et olemasolev funktsionaalsus töötab ettenähtud viisil. enne. Regressioonitestid võivad olla nii funktsionaalsed kui ka mittefunktsionaalsed testid.

Uuesti testimine- testimine, mille käigus käivitatakse testimise skriptid, mis tuvastasid viimase töö käigus vigu, et kinnitada nende vigade parandamise edukust.
Mis vahe on regressioonitestimisel ja kordustestimisel?
Kordustestimine – veaparandusi kontrollitakse
Regressioonitest – kontrollib, et veaparandused, samuti kõik muudatused rakenduse koodis ei mõjutaks teisi tarkvaramooduleid ega tekitaks uusi vigu.

Kooste testimine või ehituse kontrollimise test- testimine, mille eesmärk on teha kindlaks välja antud versiooni vastavus kvaliteedikriteeriumidele, et alustada testimist. Oma eesmärkide poolest on see analoogne suitsutestimisega, mille eesmärk on uue versiooni vastuvõtmine edasiseks testimiseks või kasutamiseks. See võib tungida sügavamale, sõltuvalt välja antud versiooni kvaliteedinõuetest.

Sanitaarkatsed- see on kitsalt suunatud testimine, mis on piisav tõestamaks, et konkreetne funktsioon töötab vastavalt spetsifikatsioonis esitatud nõuetele. See on regressioonitesti alamhulk. Kasutatakse rakenduse teatud osa toimivuse määramiseks pärast selles või keskkonnas tehtud muudatusi. Tavaliselt tehakse käsitsi.

Integratsiooni testimise lähenemisviisid:
Alt üles integreerimine
Kõik madala taseme moodulid, protseduurid või funktsioonid kogutakse kokku ja seejärel testitakse. Pärast seda pannakse integratsiooni testimiseks kokku järgmise taseme moodulid. Seda lähenemist peetakse kasulikuks, kui kõik või peaaegu kõik arendatava taseme moodulid on valmis. See lähenemine aitab testimistulemuste põhjal määrata ka rakenduse valmisoleku taseme.
Ülalt alla integreerimine
Esmalt testitakse kõiki kõrgetasemelisi mooduleid ja järk-järgult lisatakse ükshaaval madalaid. Kõiki madalama taseme mooduleid simuleeritakse sarnase funktsionaalsusega stubidena, seejärel kui need on valmis, asendatakse need päris aktiivsete komponentidega. Nii testime ülalt alla.
Big Bang ("Suure paugu" integratsioon)
Kõik või peaaegu kõik väljatöötatud moodulid monteeritakse kokku terviklikuks süsteemiks või selle põhiosaks ning seejärel viiakse läbi integratsioonitestimine. See lähenemine on aja säästmiseks väga hea. Kui aga testjuhtumeid ja nende tulemusi ei fikseerita õigesti, muutub integreerimisprotsess ise väga keeruliseks, mis saab testimismeeskonnale takistuseks integratsioonitestimise põhieesmärgi saavutamisel.

Testimise põhimõtted

1. põhimõte– Testimine näitab defektide olemasolu
Testimine võib näidata defektide olemasolu, kuid ei saa tõestada, et neid ei esine. Testimine vähendab tarkvara defektide tõenäosust, kuid isegi kui defekte ei leita, ei tõesta see selle õigsust.

2. põhimõte– Põhjalik testimine on võimatu
Täielik testimine, kasutades kõiki sisendite ja eeltingimuste kombinatsioone, on füüsiliselt võimatu, välja arvatud triviaalsed juhtumid. Ammendava testimise asemel tuleks testimistegevuse paremaks suunamiseks kasutada riskianalüüsi ja prioriteetide seadmist.

3. põhimõte– Varajane testimine
Vigade võimalikult varaseks avastamiseks tuleks testimistegevustega alustada võimalikult varajases tarkvara- või süsteemiarenduse elutsüklis ning keskenduda kindlatele eesmärkidele.

4. põhimõte– Klastrite defektid
Testimistööd tuleks koondada proportsionaalselt eeldatava ja hiljem ka tegeliku mooduli defektide tihedusega. Reeglina sisaldub enamik testimise käigus avastatud või enamiku süsteemitõrkeid põhjustanud defektidest väheses arvus mooduleid.

5. põhimõte– Pestitsiidide paradoks
Kui samu teste ikka ja jälle läbi teha, ei leia see testjuhtumite komplekt lõpuks enam uusi defekte. Sellest pestitsiidide paradoksist ülesaamiseks tuleb katsejuhtumeid regulaarselt üle vaadata ja kohandada, uued testid peavad olema kõikehõlmavad, et hõlmata kõiki tarkvarakomponente,
või süsteem ning leida võimalikult palju defekte.

6. põhimõte– Testimine sõltub kontseptsioonist
Testimine toimub sõltuvalt kontekstist erinevalt. Näiteks turvakriitilist tarkvara testitakse teisiti kui e-kaubanduse saite.
7. põhimõte– Vigade puudumise eksitus
Puuduste leidmine ja parandamine ei aita, kui loodud süsteem kasutajale ei sobi ega vasta tema ootustele ja vajadustele.

Staatiline ja dünaamiline testimine
Staatiline testimine erineb dünaamilisest testimisest selle poolest, et see viiakse läbi ilma tootekoodi käivitamata. Testimine viiakse läbi programmikoodi analüüsimise (koodi ülevaatuse) või kompileeritud koodi abil. Analüüsi saab teha kas käsitsi või spetsiaalsete tööriistade abil. Analüüsi eesmärk on varakult tuvastada tootes esinevad vead ja võimalikud probleemid. Staatiline testimine hõlmab ka testimise spetsifikatsioone ja muud dokumentatsiooni.

Uurimuslik/ad-hoc testimine
Uurimusliku testimise lihtsaim määratlus on samaaegne testide kavandamine ja käitamine. Mis on vastupidine stsenaariumipõhisele lähenemisviisile (selle eelnevalt määratletud testimisprotseduuridega, olgu see siis käsitsi või automatiseeritud). Erinevalt stsenaariumitestidest ei ole uurimuslikud testid ettemääratud ja neid ei teostata täpselt nii, nagu plaanitud.

Erinevus ad hoc ja uurimusliku testimise vahel seisneb selles, et teoreetiliselt võib ad hoc testimist läbi viia igaüks, kuid uurimuslik testimine nõuab teatud tehnikate oskusi ja teadmisi. Pange tähele, et teatud tehnikad ei ole ainult testimismeetodid.

Nõuded on spetsifikatsioon (kirjeldus), mida tuleks rakendada.
Nõuded kirjeldavad, mida on vaja rakendada, ilma lahenduse tehnilist poolt täpsustamata. Mida, mitte kuidas.

Nõuded Nõuded:
Korrektsus
Ühemõttelisus
Nõuete kogumi täielikkus
Nõuete kogumi kooskõla
Kontrollitavus (testitatavus)
Jälgitavus
Arusaadavus

Vigade elutsükkel

Tarkvara arendamise etapid- need on etapid, mille tarkvaraarenduse meeskonnad läbivad enne, kui programm paljudele kasutajatele kättesaadavaks muutub. Tarkvaraarendus algab esialgsest arendusfaasist (alfa-eelne etapp) ja jätkub etappidega, mille käigus toodet täiustatakse ja täiendatakse. Selle protsessi viimane etapp on tarkvara lõpliku versiooni turule laskmine (“üldiselt saadaval olev väljalase”).

Tarkvaratoode läbib järgmised etapid:
projekti nõuete analüüs;
disain;
rakendamine;
toote testimine;
rakendamine ja toetamine.

Igale tarkvaraarenduse etapile määratakse konkreetne seerianumber. Samuti on igal etapil oma nimi, mis iseloomustab toote valmisolekut selles etapis.

Tarkvaraarenduse elutsükkel:
Alfa-eelne
Alfa
Beeta
Vabastamise kandidaat
Vabasta
Postitage vabastamine

Otsuste tabel– suurepärane tööriist keerukate ärinõuete korraldamiseks, mis tuleb tootes realiseerida. Otsustabelites on esitatud tingimuste kogum, mille samaaegne täitmine peaks viima konkreetse toiminguni.

*Testi usaldusväärsus ja valiidsus iseloomustavad uuringu vastavust formaalsetele kriteeriumidele, mis määravad kvaliteedi ja praktikas kasutamiseks sobivuse.

Mis on usaldusväärsus

Testi usaldusväärsuse testimise käigus hinnatakse testi kordamisel saadud tulemuste järjepidevust. Andmete lahknevused peaksid puuduma või olema ebaolulised. Vastasel juhul on võimatu katsetulemustesse enesekindlalt suhtuda.

Testi usaldusväärsus on kriteerium, mis näitab, et järgmisi testide omadusi peetakse oluliseks:

  • uuringust saadud tulemuste reprodutseeritavus;
  • täpsusaste või seotud instrumendid;
  • tulemuste jätkusuutlikkus teatud aja jooksul.

Usaldusväärsuse tõlgendamisel saab eristada järgmisi põhikomponente:

  • mõõtevahendi töökindlus (nimelt testimisülesande kirjaoskus ja objektiivsus), mida saab hinnata vastava koefitsiendi arvutamisega;
  • uuritava tunnuse stabiilsus pika aja jooksul, samuti selle kõikumiste prognoositavus ja sujuvus;
  • tulemuse objektiivsus (st selle sõltumatus uurija isiklikest eelistustest).

Usaldusväärsuse tegurid

Usaldusväärsuse taset võivad mõjutada mitmed negatiivsed tegurid, millest olulisemad on järgmised:

  • metoodika ebatäiuslikkus (valed või ebatäpsed juhised, ülesannete ebaselge sõnastus);
  • ajutine ebastabiilsus või uuritava indikaatori väärtuste pidevad kõikumised;
  • esialgsete ja järeluuringute läbiviimise keskkonna ebapiisavus;
  • uurija muutuv käitumine, samuti uuritava seisundi ebastabiilsus;
  • subjektiivne lähenemine testitulemuste hindamisel.

Testi usaldusväärsuse hindamise meetodid

Katse usaldusväärsuse määramiseks saab kasutada järgmisi meetodeid.

Kordustestimise meetod on üks levinumaid. See võimaldab teil määrata uuringute tulemuste korrelatsiooniastme ja nende läbiviimise aja. See tehnika on lihtne ja tõhus. Sellegipoolest põhjustavad korduvad uuringud reeglina katsealustes ärritust ja negatiivseid reaktsioone.

  • testi konstruktiivne valiidsus on kriteerium, mida kasutatakse hierarhilise struktuuriga testi hindamisel (kasutatakse keeruliste psühholoogiliste nähtuste uurimise protsessis);
  • kriteeriumipõhine valiidsus hõlmab testitulemuste võrdlemist katsealuse ühe või teise psühholoogilise tunnuse arengutasemega;
  • sisu valiidsus määrab metoodika vastavuse uuritavale nähtusele, samuti parameetrite ulatuse, mida see hõlmab;
  • ennustav valiidsus on selline, mis võimaldab hinnata parameetri edasist arengut.

Kehtivuskriteeriumide tüübid

Testi valiidsus on üks näitajatest, mis võimaldab hinnata tehnika adekvaatsust ja sobivust konkreetse nähtuse uurimiseks. On neli peamist kriteeriumi, mis võivad seda mõjutada:

  • sooritaja kriteerium (räägime teadlase kvalifikatsioonist ja kogemusest);
  • subjektiivsed kriteeriumid (subjekti suhtumine konkreetsesse nähtusse, mis kajastub testi lõpptulemuses);
  • füsioloogilised kriteeriumid (tervislik seisund, väsimus ja muud omadused, mis võivad testi lõpptulemust oluliselt mõjutada);
  • juhuse kriteerium (toimub konkreetse sündmuse toimumise tõenäosuse määramisel).

Kehtivuskriteerium on sõltumatu andmeallikas konkreetse nähtuse (psühholoogilise omaduse) kohta, mille uurimine toimub testimise teel. Kuni saadud tulemuste kriteeriumile vastavust pole kontrollitud, ei saa paikapidavust hinnata.

Põhikriteeriuminõuded

Testi kehtivuse indikaatorit mõjutavad väliskriteeriumid peavad vastama järgmistele põhinõuetele:

  • vastavus konkreetsele uurimisvaldkonnale, asjakohasus, samuti semantiline seos diagnostilise mudeliga;
  • häirete või teravate katkestuste puudumine proovis (asi on selles, et kõik katses osalejad peavad vastama eelnevalt kehtestatud parameetritele ja olema sarnastes tingimustes);
  • uuritav parameeter peab olema usaldusväärne, konstantne ega allu äkilistele muutustele.

Kehtivuse kindlakstegemise viisid

Testide kehtivust saab kontrollida mitmel viisil.

Näo kehtivuse hindamine hõlmab selle kontrollimist, kas test vastab eesmärgile.

Konstruktsiooni kehtivust hinnatakse siis, kui konkreetse kompleksse meetme uurimiseks viiakse läbi rida katseid. See sisaldab:

  • konvergentne valideerimine - erinevate keeruliste tehnikate abil saadud hinnangute seose kontrollimine;
  • lahknev valideerimine, mis seisneb selles, et metoodika ei eeldaks põhiuuringuga mitteseotud kõrvaliste näitajate hindamist.

Ennustava valiidsuse hindamine hõlmab uuritava näitaja tulevaste kõikumiste ennustamise võimaluse kindlakstegemist.

järeldused

Testi valiidsus ja usaldusväärsus on üksteist täiendavad näitajad, mis annavad kõige täielikuma hinnangu uurimistulemuste õiglusele ja olulisusele. Sageli määratakse need üheaegselt.

Usaldusväärsus näitab, kui palju saab testi tulemusi usaldada. See tähendab nende püsivust iga kord, kui sarnast testi korratakse samade osalejatega. Madal usaldusväärsus võib viidata tahtlikule moonutamisele või vastutustundetule lähenemisele.

Testi kehtivuse kontseptsioon on seotud katse kvalitatiivse poolega. Me räägime sellest, kas valitud tööriist vastab konkreetse psühholoogilise nähtuse hinnangule. Siin saab kasutada nii kvalitatiivseid näitajaid (teoreetiline hinnang) kui ka kvantitatiivseid näitajaid (sobivate koefitsientide arvutamine).



Liituge aruteluga
Loe ka
Kuidas koerale õigesti süsti teha
Sharapovo, sorteerimiskeskus: kus see asub, kirjeldus, funktsioonid
Usaldusväärsus – mõõtmistehnika korduval rakendamisel saadud tulemuste järjepidevuse aste