как можно установить надежность частей теста тест с ответами

Как можно установить надежность частей теста тест с ответами

Как можно описать надежный тест? Надежный тест измеряет некое качество, делает это устойчиво, относительно времени, позволяет сравнивать результаты испытуемых, протестированных в разное время, в разном месте, в разном состоянии.

Вариабельность измеряемого признака (вариативность как свойство психологического измерения) и многомерность, системность и сложность предмета психологии также ставят под сомнение любое измерение в психологии. Для повышения качества психологического измерения в психометрике используется такой показатель как валидность.

На результаты исследования действуют две группы факторов: (1)изменчивость, присущей самому измеряемому свойству, (2) нестабильность измерительной процедуры.

Свойства надежности могут изменяться при изменении:

1. условия проведения обследования,

2. характера заданий,

3. степени сложности заданий,

4. психологического состояния испытуемого.

Ретестовая надежность – характеристика надежности метода психодиагностики путем повторного обследования с помощью одного и того же теста. Надежность вычисляется по соответствию результатов первого и второго обследований или по сохранению ранговых мест испытуемых в выборке при ретесте.

Алгоритм вычисления ретестовой надежности:

1. первичное тестирование на выборке (при N ≥ 30);

2. повторное тестирование через 5 – 6 месяцев на той же самой выборке;

3. вычисление коэффициента корреляции между первичным и повторным тестированием.

Коэффициент надежности r_t соответствует коэффициенту корреляции между результатами первичного и повторного обследований.

Ретестовая надежность пригодна для ограниченного числа методик. Это: 1) Сенсомоторные пробы, 2) Тесты скорости, 3) Тесты, имеющие большое количество пунктов (ММ PI ). Одним из «минусов» процедуры определения ретестовой надежности является «эффект тренировки», который безусловно снижает достовенность надежности теста.

Для порядковых шкал в качестве меры устойчивости к повторному тестированию может быть использован коэффициент ранговой корреляции Спирмена или Кэндалла.

Еще одним достаточно популярным видом надежности является надежность параллельных форм. Параллельные (или взаимозаменяемые, или сопоставимые) формы:

· параллельные или взаимозаменяемые (снабженные таблицами эквивалентности);

· уравненные (попарно уравненные по структуре и содержанию задания);

· эквивалентные (результаты с близкими статистическими характеристиками).

Надежность параллельных форм – характеристика надежности методики с помощью взаимозаменяемых форм теста. При этом одни и те же испытуемые в выборке определения надежности обследуются вначале с использованием основного набора заданий, а затем – с применением аналогичных дополнительных. В практике встречается два алгоритма вычисления надежности параллельных форм.

Первый алгоритм определения надежности параллельных форм:

1. тестирование группы при помощи формы А теста;

2. тестирование группы при помощи формы Б теста (или сразу, или через определенное время);

3. вычисление коэффициента корреляции между результатами тестирования разными формами.

Второй алгоритм вычисления надежности параллельных форм:

1. разделение всех испытуемых на две группы (первая и вторая);

2. тестирование первой группы при помощи формы А теста;

3. тестирование второй группы при помощи формы Б теста;

4. тестирование первой группы при помощи формы Б теста (или сразу, или через определенное время);

5. тестирование второй группы при помощи формы А теста (или сразу, или через определенное время);

6. вычисление коэффициента корреляции между результатами первичного и вторичного исследований.

Надежность частей теста достаточно популярный и просто-просчитываемый вид надежности. Надежность частей теста – характеристика надежности методики путем анализа устойчивости результатов отдельных совокупностей тестовых задач или единичных заданий теста.

Основным методом вычисления надежности частей теста является расщепление – выполнение испытуемым двух равноценных частей теста. Для оценки надежности методом расщепления выбираются две эквивалентные по характеру и степени трудности группы задач. Разделение объема заданий достигается одним из способов:

1) распределение заданий на четные и нечетные (в том случае, если задания строго ранжированы по степени субъективной трудности).

2) разделение пунктов по принципу близости или равенства значений индексов трудности (такой принцип пригоден для тестов достижений, в которых обязателен ответ на все пункты).

3) разделение задач по времени решения каждой из частей (для тестов скорости).

Разделение заданий теста на равноценные половины является лишь частным случаем надежности частей теста. Расщепление возможно на 3, 4, 5 и более частей. В предельном случае число частей равно числу пунктов.

1. провести однократное тестирование на выборке (при N ≥ 30);

2. расщепить тест (используя один из вышеописанных способов), например на четные – нечетные задания;

3. посчитать коэффициент корреляции между выполнением первой и второй половины теста;

4. для перехода к целой форме вычислить надежность целого теста (или формула Спирмена-Брауна, или формулу Рюлона).

Алгоритм вычисления надежности отдельных заданий теста:

1. провести однократное тестирование на выборке (при N ≥ 30);

2. используя результаты выполнения каждого задания, подсчитать коэффициент Кьюдера-Ричардсона (для заданий «1-0») или коэффициент Кронбаха (для более дифференцированных заданий);

Коэффициент Кьюдера-Ричардсона используется для заданий типа «да-нет», «решил – не решил», «верно-неверно».

Надежность субъективных оценок (или экспертная надежность) – характеристика надежности методики путем анализа устойчивости-согласованности экспертных оценок.

Алгоритм вычисления экспертной надежности:

Сравнительные методы установления надежности

Необходимость повторного тестирования

Достаточное число форм

Источники ошибки индекса надежности

Запоминание, тренировка, научение, длина интервала.

Запоминание, тренировка, научение, недостаточная эквивалентность форм

Частей теста (методом расщепления)

Неоднородность содержания, число заданий в тесте

Число заданий в тесте неоднородность содержания,

Источник

Тест по психодиагностике, 70 вопросов с ответами

1. При проведении исследований часто встаёт вопрос о том, насколько характерный материал вы используете. Как называется мера соответствия по некоей характеристике испытуемого той популяции, к которой он принадлежит:
а) валидность;
б) вариабельность;
в) репрезентативность;
г) надёжность.

2. Как называется стадия исследования, на которой формулируются идеи о причинах и следствиях избранных для исследования явлений:
а) стадия наблюдения;
б) корреляционная стадия;
в) контрольная стадия;
г) стадия формирования гипотезы.

3. Какое из утверждений описывает понятие валидности:
а) способность теста определять меру дефекта;
б) характеристика единства способов использования теста;
в) показатель того, что тест измеряет то, для измерения чего предназначен;
г) мера вероятности получения ошибочных результатов.

4. Репрезентативность теста указывает на:
а) возможность применения к данной выборке норм, указанных в тесте;
б) степень однородности диагностируемой выборки;
в) насколько результат по данному тесту одного испытуемого отличается от результата другого испытуемого.

5. Какое утверждение определяет понятие стандартизации тестов:
а) приведение теста в соответствие со стандартами;
б) использование единообразных процедур проведения и обсчета результатов;
в) согласование популяционных нормативов с культурными и социальными стандартами.

6. Какое из утверждений точнее всего описывает, что такое коэффициент интеллекта:
а) характеристика имеющихся познавательных способностей;
б) характеристика врожденных способностей;
в) мера приобретенных интеллектуальных навыков;
г) характеристика зоны ближайшего развития.

7. Оценка психологического состояния при помощи системы тестов называется:
а) психодиагностика;
б) диагноз;
в) измерение;
г) психологический эксперимент.

8. Работы, каких двух исследователей стояли у истоков метода тестирования:
а) Э. Крепелина и А. Бине;
б) П. Жане и Ф. Гальтона;
в) Ф. Гальтона и Дж. Кеттелла;
г) Ф. Гальтона и А. Бине.
9. Кто предложил исследование памяти методом пиктограммы:
а) С.Л. Рубинштейн;
б) А.Р. Лурия;
в) Т. Рибо;
г) В.Б. Зейгарник.

10. Используемая в детской диагностике методика обучающего обучения А.Я. Ивановой направлена на изучение:
а) интеллектуального уровня;
б) зоны ближайшего развития;
в) мотивации учебной деятельности;
г) эмоциональных блоков интеллектуальной работы.

11. Целевые установки пробы Бурдона и матриц Равена соотносятся как:
а) предпосылки интеллекта — интеллект;
б) интеллект — мышление;
в) ригидность — гибкость.

12. Что одно из перечисленного является существенным элементом предложенного А.Ф. Лазурским «естественного эксперимента» в отличие от лабораторного:
а) условия эксперимента не связаны с искусственными условиями и требованиями;
б) эксперимент проводится без использования технических средств;
в) экспериментатор включен в выполнение задания вместе с испытуемым;
г) наблюдение в естественных условиях с точностью и научностью эксперимента, когда испытуемый не осведомлен о проводящемся исследовании;
д) применяется специальная аппаратура и четко спланированные задания.

13. Тест фрустрации Розенцвейга относится к одной из названных групп:
а) личностные опросники;
б) тесты достижений;
в) психометрические тесты;
г) проективные методы;
д) свободное интервью.

14. Оценка коэффициента интеллекта опирается на сопоставление:
а) паспортного возраста и уровня образования;
б) умственного и эмоционального возраста;
в) интеллектуального и паспортного возраста;
г) максимальных и минимальных показателей;
д) уровень актуального развития и потенциальных возможностей.

15. Включенное наблюдение – это:
а) наблюдение, использующее «батареи» психологических тестов;
б) длительное наблюдение;
в) наблюдение в условиях лаборатории;
г) наблюдение, при котором психолог является непосредственным участником событий;
д) наблюдение включает в себя несколько этапов.

16. Метод познания, который ограничивается регистрацией выявленных фактов при исследовании возрастных особенностей, называется:
а) формирующим экспериментом;
б) наблюдением;
в) констатирующим экспериментом;
г) квазиэкспериментом;
д) моделированием.

17. Метод активного воздействия исследователя на изменения психики ребенка – это:
а) включенное наблюдение;
б) пилотажный эксперимент;
в) контрольный эксперимент;
г) формирующий эксперимент;
д) констатирующий эксперимент.

18. Синонимом формирующего эксперимента является:
а) квазиэксперимент;
б) проективный эксперимент;
в) контрольный эксперимент;
г) генетико-моделирующий;
д) лабораторный эксперимент.

19. Данные о реальном поведении человека, полученные в ходе внешнего поведения, называются:
а) L- данными;
б) Q- данными;
в) T-данными;
г) Z- данными.

20. Б.Г.Ананьев относит лонгитюдный метод исследования:
а) к организационным методам;
б) к эмпирическим методам;
в) к способам обработки данных;
г) к интерпретационным методам.

21. Тип результатов, регистрируемых с помощью опросников и других методов самооценок, называется:
а) L- данными;
б) Q- данными;
в) T-данными;
г) Z- данными.

22. Целенаправленное, планомерно осуществляемое восприятие объектов, в познании которых заинтересована личность, является:
а) экспериментом;
б) контент-анализом;
в) наблюдением;
г) методом анализа продуктов деятельности.

23. Длительное и систематическое наблюдение, изучение одних и тех же людей, позволяющее анализировать психологическое развитие на различных этапах жизненного пути и на основе этого делать определённые выводы, принято называть исследованием:
а) пилотажным;
б) лонгитюдным;
в) сравнительным;
г) комплексным.

24. Понятие «самонаблюдение» является синонимом термина:
а) интроверсия;
б) интроекция;
в) интроспекция;
г) интроскопия.

25. Краткое, стандартизированное психологическое испытание, в результате которого делается попытка оценить тот или иной психологический процесс или личность в целом, — это:
а) наблюдение;
б) эксперимент;
в) тестирование;
г) самонаблюдение.

26 Получение субъектом данных о собственных психических процессах и состояниях в момент их протекания или вслед за ним – это:
а) наблюдение;
б) эксперимент;
в) тестирование;
г) самонаблюдение.

27. Активное вмешательство исследователя в деятельность испытуемого с целью создания условий для установления психологического факта называется:
а) контекст-анализом;
б) анализом продуктов деятельности;
в) беседой;
г) экспериментом.

28. Способ исследования структуры и характера межличностных отношений людей на основе измерения межличностного выбора называется:
а) контент-анализом;
б) методом сравнения;
в) методом социальных единиц;
г) социометрией.

29. Возможность исследователя вызвать какой-то психический процесс или свойство является главным достоинством:
а) наблюдения;
б) эксперимента;
в) контент-анализа;
г) анализа продуктов деятельности.

30. Оценка согласованности показателей, получаемых при повторном тестировании тех же испытуемых и тем же самым тестом или эквивалентной его формой, характеризует тест с точки зрения его:
а) валидности;
б) достоверности;
в) надёжности.

31. Первые интеллектуальные тесты для детей были разработаны:
а) Бине-Симоном;
б) И.П. Павловым;
в) Эббингаузом.

32. К формализованным методикам относятся:
а) тесты;
б) опросники;
в) проективные методики;
г) психофизиологические методики;
д) все ответы верны;
е) все ответы неверны.

33. К малоформализованным методикам НЕ относят:
а) наблюдение;
б) беседу;
в) анализ продуктов деятельности;
г) опросники;
д) тесты.

34.Стандартизация — это:
а) единообразие процедуры проведения и оценки выполнения теста;
б) согласованность результатов теста при первичном и повторном его применении на одних и тех же испытуемых
в) понятие, указывающее, что тест измеряет и насколько хорошо он это делает

35.Надежность- это:
а) единообразие процедуры проведения и оценки выполнения теста;
б) согласованность результатов теста при первичном и повторном его применении на одних и тех же испытуемых
в) понятие, указывающее, что тест измеряет и насколько хорошо он это делает

36.Валидность — это:
а) единообразие процедуры проведения и оценки выполнения теста;
б) согласованность результатов теста при первичном и повторном его применении на одних и тех же испытуемых
в) понятие, указывающее, что тест измеряет и насколько хорошо он это делает

37. Прием, используемый для повторного обследования испытуемых с помощью одной и той же методики для проверки стабильности диагностируемого признака, называется:
а) константностью;
б) контент-анализ;
в) тест-ретест.

38. Таблицы Шульте предназначены для исследования объема внимания, а таблицы Шульте-Горбова для исследования:
а) устойчивости внимания;
б) концентрации внимания;
в) переключаемости внимания;
г) динамической асимметрии внимания.

39. В каком пункте указаны методики, лучше всего позволяющие выявить разноплановость мышления:
а) классификация и сложение фигур;
б) сложение фигур и исключение предметов;
в) пиктограмма и сложение фигур;
г) классификация и исключение предметов;
д) пиктограмма и классификация.

40. Методика Дембо-Рубинштейн представляет собой:
а) тест уровня самооценки;
б) экспериментально-психологическую методику изучения свойств личности по самооценке;
в) экспериментально-психологическую методику изучения самооценки.

41. Какое из приведенных утверждений НЕ отражает основных правил оценки профиля MMPI:
а) профиль должен оцениваться как единое целое;
б) при оценке профиля наиболее существенно значение Т-нормы по каждой шкале, сравнение с которой отражает степень выраженности психопатологии;
в) профиль характеризует особенности личности и актуальное психическое состояние;
г) при оценке профиля наиболее существенно отношение уровня каждой шкалы к среднему уровню профиля в целом и, особенно, по отношению к соседним шкалам.

42. Тест «чернильных пятен» создан Г. Роршахом:
а) в 1912 г.;
б) в 1921 г.;
в) в 1935 г.;
г) в 1951 г.

43. Минимальный возраст, начиная с которого может использоваться цветовой тест отношений А.М. Эткинда:
а) 3-4 года;
б) 5-6 лет;
в) 7-8 лет;
г) 9-10 лет.

44. «Кубики Кооса», «куб Линка» являются методиками для исследования:
а) процесса решения конструктивных задач;
б) абстрактно-логического мышления;
в) дискурсивного мышления;
г) оперативной памяти.

45. Во взрослом и детском вариантах теста Векслера наиболее культурально-зависимы результаты по тесту:
а) недостающие детали;
б) арифметика;
в) лабиринт;
г) осведомленность.

46. Какой из перечисленных факторов может приводить к снижению показателей по вербальному тесту Векслера:
а) высокий уровень тревоги;
б) высокая потребность в самореализации;
в) высокий уровень внимания;
г) высокая самооценка.

47. Какой из перечисленных тестов НЕ является проективным:
а) ТАТ;
б) тест Роршаха;
в) тест тревожности Спилберга-Ханина;
г) тест незаконченных фраз.

48. Какой из перечисленных тестов НЕ предназначен для оценки интеллектуальных способностей:
а) ТАТ;
б) тест Векслера;
в) тест общих способностей;
г) тест Стенфорд-Бине.

49. Опросник Спилберга-Ханина позволяет:
а) оценить уровень депрессии;
б) выявить склонность к полярным колебаниям аффекта;
в) сопоставить истинную и ситуационную самооценку;
г) сопоставить ситуационную и конституциональную тревожность.

50. Какой из тестов позволяет сопоставить вербальные и невербальные способности:
а) тест Роршаха;
б) тест Векслера;
в) тест Бендер;
г) тест Кеттелла.

51. 16-факторный личностный опросник разработал …..
а) Кеттел
б) Рорших
в) Векслер
г) Бендер

52. Какой из тестов содержит 3 шкалы валидности и 10 клинических шкал:
а) тест Векслера для взрослых;
б) тест Айзенка;
в) MMPI;
г) Тест Кеттелла.

53. Тесты способностей показывают:
а) уровень предшествующей подготовки;
б) степень вклада наследственности в способности;
в) возможности успеха в той или иной области;
г) общий уровень умственных способностей.

54. Какой из цветов в тесте Люшера НЕ относится к основным:
а) синий;
б) желтый;
в) фиолетовый;
г) сине-зеленый.

55. Надежность теста показывает:
а) какую стабильность результатов измерения обеспечивает сам тест;
б) насколько стабильны те свойства и качества, которые измеряются с помощью теста;
в) насколько стабильна процедура подсчета суммарного балла по тесту.

56. Каково исходное назначение опросника Т. Лири:
а) изучение групповой динамики;
б) изучение взаимоотношений в семье;
в) изучение ролевых идентификаций личности;
г) изучение социальной конфликтности.

57. Какое из утверждений верно описывает назначение теста Розенцвейга:
а) выявление агрессивных реакций на стресс;
б) определение уровня стрессоустойчивости;
в) определение типов реагирования на фрустрацию;
г) диагностика клинических типов агрессивности.

58. Методологической основой психодиагностики является:
а) хорошо разработанная психологическая теория;
б) психометрика;
в) практическая область применения психодиагностических методов.

59. Фактор социальной желательности оказывает наибольшее влияние в:
а) ситуации клиента;
б) ситуации экспертизы;
в) патопсихологической диагностики.

60. Содержательная валидность теста – это:
а) степень представленности (репрезентации) исследуемого психологического конструкта в результатах теста;
б) отражение в содержании теста ключевых сторон изучаемого психологического феномена;
в) показатель внутренней однородности (согласованности) теста.

61. Если выборка репрезентативна срезу популяции, то:
а) результаты выборочного распределения можно описать распределением близким к нормальному;
б) результаты выборочного распределения можно описать любым математическим распределением;
в) по результатам выборочного распределения вообще нельзя судить о репрезентативности выборки.

62. Нелинейное преобразование стандартных показателей необходимо для того, чтобы:
а) удобства интерпретации полученных результатов;
б) добиться сопоставимости результатов, принадлежащих к распределениям полученным по различным тестам;
в) добиться сопоставимости результатов, принадлежащих к распределениям различной формы.

63. Социально-психологический норматив – это:
а) статистическая норма, эмпирически полученная на какой-либо выборке;
б) система требований общества к индивиду;
в) индивидуальная норма, рассчитанная для данного конкретного индивида.

64. Идея стандартизации методик и тестов принадлежит:
а) Дж. Кеттелу;
б) В.Вундту;
в) А. Бине.

65. Проективные тесты и методики отличаются от объективных тестов и стандартизированных самоотчетов тем, что:
а) не могут давать объективных и надежных результатов;
б) результаты по тесту не поддаются никакой формализации;
в) интерпретация результатов по тесту зависит от компетентности и уровня квалификации психодиагноста.

66. Экспертная эмпирическая валидизация относится к:
а) теоретическому типу валидизации;
б) практическому типу валидизации;
в) теоретическому и практическому типам валидизации.

67. Конструктная валидность теста – это:
а) степень представленности (репрезентации) исследуемого психологического конструкта в результатах теста;
б) показатель внутренней однородности (согласованности) теста;
в) отражение в содержании теста ключевых сторон изучаемого психического свойства.

68. Между валидностью и надежностью существует следующее соотношение:
а) валидность ≤ надежность;
б) валидность ≥ надежность;
в) валидность = надежность;

69. Достоверность теста – это:
а) его защищенность от фальсификации результатов психодиагностом;
б) его защищенность от влияния на результаты различных внешних воздействий;
в) его защищенность от фальсификации результатов испытуемым;

70. Валидность теста доказывает:
а) независимость результатов теста от мнения психодиагноста;
б) можно ли применять данный тест на практике;
в) измеряет ли тест тот психический феномен, для измерения которого он предназначен.

Источник