Педагогическое тестирование: виды, применение, составление тестов.

Баламошева Светлана Валентиновна

Что такое тестирование ? Сегодня этот термин встречается довольно часто и в областях далеких от образования.

Тестирование (от слова test - испытание, проверка). Тестирование применяется для определения соответствия предмета испытания заданным спецификациям. Тестирование - один из разделов диагностики. Однако, если мы говорим о педагогическом тестировании, то на мой взгляд, больше подойдет такое определение:

Педагогическое тестирование - это форма измерения знаний учащихся, основанная на применении педагогических тестов. Включает в себя п одготовку качественных тестов, собственно проведение тестирования и последующую обработку результатов , которая даёт оценку обученности тестируемых. Соответственно:

Педагогический тест определяется как система заданий возрастающей трудности, специфической формы, позволяющая качественно и эффективно измерить уровень и оценить структуру подготовленности учащихся.

Тестирование в педагогике выполняет три основные взаимосвязанные функции: диагностическую , обучающую и воспитательную :

  • Диагностическая функция заключается в выявлении уровня знаний, умений, навыков учащегося. Это основная и самая очевидная функция тестирования. По объективности, широте и скорости диагностирования, тестирование превосходит все остальные формы педагогического контроля.
  • Обучающая функция тестирования состоит в мотивировании учащегося к активизации работы по усвоению учебного материала. Для усиления обучающей функции тестирования могут быть использованы дополнительные меры стимулирования студентов, такие как: раздача преподавателем примерного перечня вопросов для самостоятельной подготовки, наличие в самом тесте наводящих вопросов и подсказок, совместный разбор результатов теста.
  • Воспитательная функция проявляется в периодичности и неизбежности тестового контроля. Это дисциплинирует, организует и направляет деятельность учащихся, помогает выявить и устранить пробелы в знаниях, формирует стремление развить свои способности .

Преимущества

Преимущества тестирования в процессе обучения школьников очевидны:

  • Тесты - это удобный инструмент для поурочного и тематического контроля знаний. Экономит время и позволяет объективно оценить знания.
  • Формируют навыки учащихся по работе с учебным материалом, извлечению информации.
  • Повышает плотность опроса и накопляемость оценок в журнале.
  • Помогает учителю варьировать методику и технологию проведения урока в соответствии с задачами контроля, сложности изучаемого материала, психологических и возрастных особенностей учащихся.
  • Позволяют организовать взаимоконтроль, самоконтроль и самооценку знаний учащимися.
  • Тесты, однажды приготовленные учителем значительно облегчают деятельность учителя, вносят разнообразие в методику работы.

Недостатки

Однако, наряду с преимуществами, тестирование сопровождается определенными недостатками:

  • - большая вероятность выбора ответов наугад или методом исключения;
  • - проверка лишь конечного результата действий;
  • - затруднение со стороны учителя, а чаще невозможность проследить логику рассуждений ученика.

Ни один из методов не является абсолютно универсальным. Любой метод имеет преимущества и недостатки одновременно. Поэтому творческий учитель будет использовать разнообразные методы, приемы и формы. Все познается в сравнении и постепенно учитель сам выбирает наиболее оптимальные для себя формы работы, руководствуясь принципами активизации и оптимизации обучения, творчески совершенствуя их по форме и содержанию.

Следовательно, тесты – это одна из форм контроля и оценки знаний, умений и навыков, которая может и должна использоваться в сочетании с другими формами и методами контроля и оценки.

Применение тестов на уроках.

Как правильно определить место и время тестирования? Какие методы и приемы при этом использовать? Эти, и наверное, другие вопросы встают перед учителем при разработке технологической карты любого урока и в частности урока окружающего мира. Тесты можно эффективность использовать на любом этапе урока. Это зависит от целей, методики, целей контроля.

Основным этапом урока Окружающего мира является опрос и повторение изученного материала. Это обязательная часть урока, на котором учитель имеет возможность контролировать, корректировать, оценивать уровень знаний. На традиционном уроке опрос занимает 15 минут в начале урока. Существует много методов опроса. Я в основном использую индивидуальный опрос. От ученика требую полный развернутый ответ. Считаю, что такая форма опроса развивает монологическую речь, память, мышление, умение делать выводы, обобщать, публично выступать. Отвечают 2- 3 ученика. К сожалению, время опроса ограниченно и трудно опросить большое число учащихся. Поэтому использую и другие методы опроса, например, поурочное тестирование или поурочный контроль. Тесты предлагаются на этапе опроса домашнего задания. Тесты включают вопросы репродуктивного характера, а так же требующие логического мышления и применения знаний в новой ситуации. Тесты легко, быстро оцениваются учителем или учеником по ключу - ответу. Позволяет увеличить число опрошенных учеников и накопляемость оценок.

При тестировании выявляются как знания, так и незнания учащихся и учитель может определить пробелы в знаниях учащихся по тем или иным вопросам темы.

Закрепление материала. Закрепление - обязательная часть урока, так как на этом этапе в сознании учащихся происходит обобщение и систематизация информации. На данном этапе можно не оценивать знания, так как материал усвоен не в полной мере. Позволяет каждому ученику выявить свои пробелы в определенном вопросе, чтобы дома обратить на это большее внимание. Можно провести обсуждение тестов, расширить представление о предмете обсуждения. При этом для проецирования тестов можно использовать технические средства обучения.

Обучающая роль тестов . Тесты можно использовать при изучении новой темы при работе с учебником или пособием. После проработки текста в план, тезисы, схемы. Вопросы тестов при этом направляют деятельность учащихся, помогают выявить главное, обратить внимание на детали.

Тематический контроль и итоговая аттестация.

Используется тестирование как форма тематической проверки знаний и итоговой аттестации

Причиной низкого качества знаний учащихся является нарушение объективного закона усвоения знаний, когда на уроке деятельность учащихся сводится лишь к восприятию излагаемых учителем и не остается времени на осмысление, применение на практике и проверку знаний, умений. Существует простая истина: все этапы усвоения знаний и умений должны выполняться каждым учеником, его умственным трудом, хотя и под руководством учителя.

Проверка и оценка тестов.

Для проверки тестов готовлю карточку с ключом. Здесь же имеется и критерии оценок. Например, 90 – 100 % правильных ответов – оценка «5», 70- 90 % - «4», 50- 70 % - «3», менее 40 %- «2».

Нормы времени для проведения тестирования и максимальное количество заданий, выполняемых учащимися за один урок.

Обязательный уровень:
2 класс 1 задание – 2 мин.
3 класс – 1,5 мин.
4 класс – 1 мин.
Задания предполагают проверку не только практических умений учащихся, но и научных теоретических понятий и проверяют уровень сформированности учебных действий.

Разработка качественного тестового инструментария - длительный, трудоемкий процесс. Стандартные наборы тестов для большинства дисциплин ещё недостаточно разработаны, а чтобы самостоятельно составить качественный тест необходимо чётко представлять его структуру в зависимости от вида теста.

Виды тестовых заданий

Рассмотрим наиболее популярную классификацию тестовых заданий. В рамках данной классификации тестовые задания можно разделить на две группы:

тестовые задания закрытого типа (каждый вопрос сопровождается готовыми вариантами ответов, из которых необходимо выбрать один или несколько правильных);

тестовые задания открытого типа (на каждый вопрос испытуемый должен предложить свой ответ: дописать слово, словосочетание, предложение, знак, формулу и т.д.).

Выбор типа и вида тестового задания определяется, прежде всего, целями, в соответствии с которыми проводится тестирование, характером материала, усвоение которого необходимо выявить, возрастными особенностями испытуемых.

  • Множественный выбор - испытуемому необходимо выбрать один или несколько правильных ответов из приведенного списка
  • Альтернативный выбор - испытуемый должен ответить «да» или «нет»
  • Установление соответствия - испытуемому предлагается установить соответствие элементов двух списков
  • Установление последовательности - испытуемый должен расположить элементы списка в определенной последовательность
  • Свободное изложение - испытуемый должен самостоятельно сформулировать ответ; никакие ограничения на них в задании не накладываются
  • Дополнение - испытуемый должен сформулировать ответы с учетом предусмотренных в задании ограничений (например, дополнить предложение)

Программ для составления тестов множество. Каждая из них имеет свои преимущества и недостатки. Но плюсом для всех таких программ является их универсальность – возможность применения для осуществления контроля знаний в любой учебной дисциплине. Проверку можно осуществлять и на бумажных носителях, если класс не оборудован для проведения компьютерного тестирования.

С началом активного развития компьютерных технологий в качестве инструмента анализа заданий очень эффективно использование компьютера. Сегодня компьютерные тесты являются одним из электронных средств обучения (ЭСО).

Основными этапами оценки результативности обучения школьников с использованием электронных средств обучения должны быть:
1. Четкое формулирование требований к знаниям, умениям и навыкам школьников. Требования формулируются до начала обучения и создания ЭСО, должны соответствовать содержанию и методам обучения;
2. Разработка контрольно-измерительных подсистем ЭСО для проведения тестирования школьников. Материалы разрабатываются в строгом соответствии с требованиями к знаниям, умениям и навыкам учащихся. Для каждого задания указывается, какому требованию (требованиям) оно соответствует;

Литература:

  • Аванесов В. С. Композиция тестовых заданий. - М., Центр тестирования, 2002.
  • Майоров А. Н. Теория и практика создания тестов для системы образования: Как выбирать, создавать и использовать тесты для целей образования. М: Интеллект-Центр, 2002.
  • Нейман Ю. М., Хлебников В. А. Педагогическое тестирование как измерение. Ч.1. - М.: Центр тестирования МО РФ, 2002.
  • Челышкова М. Б. Теория и практика конструирования педагогических тестов. Уч. Пособие. - М.: Логос, 2002.
  • Кабанова Т. А., Новиков В. А. Тестирование в современном образовании. Уч. Пособие. - М.: Высшая школа, 2010.
  • Батешов Е.А. «Основы технологизации компьютерного тестирования»: Учебное пособие. – Астана: ТОО «Полиграф-мир», 2011. – 241 с.

Ряд исследователей отмечает, что понятийный аппарат теории педагогических измерений еще полностью не сформирован. В частности не существует общепризнанного определения теста. Каждый исследователь отражает в определении теста свое видение проблемы педагогического тестирования.

Существует много определений ТЕСТА, довольно заметно отличающихся друг от друга. Приведем некоторые из них.

Согласно словарю ЕГЭ, ТЕСТ - это измерительная процедура, включающая инструкцию и набор заданий, прошедшая широкую апробацию и стандартизацию.

Рубинштейн С.Л. дал следующее определение: ТЕСТ - это испытание, которое ставит своей целью градуирование, определение рангового места личности в группе или коллек­тиве, установление её уровня.

Это определение сформулировано только с точки зрения достижения цели, не оговаривая, как эта цель достигается, а главное, не определяет тест как измерительный инструмент.

К.Ингенкамп - ТЕСТИРОВАНИЕ - это метод педагогической диагностики, с помощью которого выборка поведения, репрезентирующая предпосылки или результаты учебного процесса, должна максимально отвечать принципам сопоставимости, объективности, надежности и валидности измерений, должна пройти обработку и интерпретацию и быть готовой к использованию в педагогической практике.

В определении К.Ингенкампа рассматривается метод, а не средство педагогической диагностики и никак не характеризуются задания теста.

А.Н.Майоров приводит следующее определение теста, разработанное в 1997-1998 гг. группой авторов при разработке понятийного аппарата тестологии:

ТЕСТ – это инструмент, состоящий из квалиметрически выверенной системы тестовых заданий, стандартизованной процедуры проведения и заранее спроектированной технологии обработки и анализа результатов, предназначенный для измерения качества и свойств личности, изменение которых возможно в процессе систематического обучения.

В.С.Аванесов определяет ПЕДАГОГИЧЕСКИЙ ТЕСТ как систему параллельных заданий равномерно возрастающей трудности, специфической формы, позволяющую качественно и эффективно измерить уровень и оценить структуру подготовленности учащихся.

В одной из последних работ В.С.Аванесов (2005) несколько смягчил формулировку:

ПЕДАГОГИЧЕСКИЙ ТЕСТ определяется как система параллельных заданий возрастающей трудности, специфической формы, которая позволяет качественно и эффективно измерить уровень и структуру подготовленности испытуемых.

Сравнение обоих определений показывает, что произошло исключение требования равномерности возрастания трудности заданий. Обусловлено это тем, что обеспечить возрастание трудности заданий достаточно легко. Чтобы достичь этого составитель тестовых заданий ориентируется на различную сложность элементов предметной области. Для каждого элемента составляются задания и затем эмпирически проверяются, что действительно получены задания различной трудности. В самом тесте задания располагаются в порядке возрастания трудности.



Требование же равномерности возрастания трудности задания чрезвычайно сложно реализовать на практике. Хотя такой тест обеспечил бы линейную шкалу трудностей, что снизило бы ошибку измерения.

Исключение требования равномерности возрастания трудности задания заметно упрощает создание теста. Отметим, однако, что в этом случае, шкала трудностей получается нелинейной, с неравномерным покрытием заданного диапазона трудности заданий теста. Это, естественно, снижает точность педагогического теста как измерительного инструмента.

Определение Аванесова

Для лучшего понимания этого определения полезно дать краткое истолкование его основных терминов.

Система означает, что в тесте собраны такие задания, которые обладают системообразующими свойствами. Здесь, в первую очередь, надо выделить общую принадлежность заданий к одной и той же системе знаний, т.е. к одной учебной дисциплине, их связь и упорядоченность. Для итоговой аттестации выпускников школ нужно разрабатывать интегративные задания, содержание которых охватывает систему знаний.

Специфическая форма тестовых заданий отличается тем, что задания теста представляют собой не вопросы и не задачи, а задания, сформулированные в форме высказываний, истинных или ложных, в зависимости от ответов. Традиционные вопросы, напротив, истинными или ложными не бывают, а ответы на них нередко настолько неопределенны и многословны, что для выявления их правильности требуются заметные, в суммарном исчислении, затраты интеллектуальной энергии преподавателей. В этом смысле традиционные вопросы и ответы нетехнологичны, и потому их лучше не включать в тест.

Определенное содержание означает использование в тесте только такого контрольного материала, который соответствует содержанию учебной дисциплины; остальное в педагогический тест не включается ни под каким предлогом. Например, проверка уровня интеллектуального развития является предметом психологического тестирования. Содержание теста существует, сохраняется и передается в одной из четырех основных форм заданий. Вне тестовых форм ни тест, ни его содержание не существуют.

Теоретически оправданным критерием упорядочения содержания так называемого гомогенного теста является критерий трудности заданий. Внеучебное содержание (например, проверка уровня интеллектуального развития) в педагогический тест не включается. Это предмет психологического измерения.

Возрастающую трудность заданий можно образно сравнить с барьерами на беговой дорожке стадиона, где каждый последующий выше предыдущего. Пробежать дистанцию и успешно преодолеть все барьеры сможет только тот, кто лучше подготовлен. Поскольку в педагогическом тесте задания упорядочиваются по принципу возрастающей трудности, одни испытуемые "заваливаются" уже на самом легком, первом задании, другие - на последующих заданиях. Ученик среднего уровня подготовленности могут ответить правильно только на половину заданий теста и, наконец, только самые знающие в состоянии дать правильный ответ на задания самого высокого уровня трудности, расположенные в конце теста.

Трудность задания может определяться двояко: а) умозрительно, на основе предполагаемого числа и характера умственных операций, необходимых для успешного выполнения заданий, и б) после эмпирического опробывания заданий, с подсчетом доли неправильных ответов. В классической теории тестов многие годы рассматривались только эмпирические показатели трудности. В новых вариантах психологических и педагогических теорий тестов больше внимание стало уделяться характеру умственной деятельности учащихся в процессе выполнения тестовых заданий различных форм (1).

К этому можно добавить еще один критерий - это критерий логической определенности тестового задания. Его можно сформулировать следующими словами: задание является определенным, если на него можно ответить утвердительно или отрицательно, и если существует эффективный процесс для нахождения такого ответа.

Ответ на задание педагогического теста представляет собой краткое суждение, связанное по содержанию и по форме с содержанием задания. Каждому заданию ставятся в соответствие ответы правильные и неправильные. Критерии правильности заранее определяются авторами теста. Вероятность правильного ответа на любое задание зависит от соотношения уровня знаний испытуемого и уровня трудности задания. При наличии сопоставимых шкал, эту вероятность выражают значением от нуля до единицы. Оценка ответов по степени их правильности проводится довольно редко, но при необходимости создаются задания с такими ответами, которые правильны в различной степени. Инструкция для испытуемых в таких случаях может быть такой: "Обведите кружком номер (нажимайте на клавишу с номером) наиболее правильного ответа!"

Посредством тестирования чаще других признаков проверяются знания, умения, навыки и представления. С точки зрения педагогических измерений полезно ввести два основных показателя качества знаний - уровень и структура знаний. Они оценивается посредством регистрации оценок, как за знание, так и за незнание всех требуемых компонентов проверяемого материала. Для объективизации этого процесса все компоненты должны быть одинаковы. Одинаковыми являются и правила выставления оценок испытуемым. Эти условия открывают дорогу для объективного сравнения индивидуальных структур знания и не знания.

Уровень знаний выявляются при анализе ответов каждого ученика на все задания теста. Чем больше правильных ответов, тем выше индивидуальный тестовый балл испытуемых. Обычно этот тестовый балл ассоциируется с понятием "уровень знаний" и проходит процедуру уточнения на основе той или иной модели педагогического измерения. Один и тот же уровень знаний может быть получен за счет ответов на различные задания. Например, в тесте из тридцати заданий ученик получил десять баллов. Эти баллы, скорее всего, получены за счет правильных ответов на первые десять, сравнительно легких заданий. Присущую для такого случая последовательность единиц, а затем нулей можно назвать правильным профилем знаний ученика.

Если тестовый балл ниже требуемого уровня (измеряемого критерия), то проявленные при этом знания, умения, навыки и представления указывают на докритериальный уровень подготовленности испытуемого.

В истории науки и искусств известно немало случаев, когда имевшийся в соответствующие времена критериальный уровень требований к знаниям (или мастерству) мешал общественному признанию отдельных талантов. Поэтому признание нередко приходило только по мере изменения критериев оценки. Чаще всего после смерти авторов многих бессмертных произведений в сфере науки, музыки, живописи и др. Яркий пример такого рода - изменение критериев оценки творчества Ван Гога, творчества многих художников-импрессионистов, формалистов и др. Известны и такие, например, факты. Будущий лауреат Нобелевской премии Альберт Эйнштейн летом 1895 года не смог сдать экзамены в Цюрихский политехникум, а всемирно известный пианист С. Рихтер дважды отчислялся из консерватории за общую неуспеваемость.

Структура знаний оценивается на основе последовательности правильных и неправильных ответов на задания возрастающей трудности. Формой представления индивидуальной структуры знания и незнания является профиль знаний испытуемого, представляемый последовательностью единиц и нулей, получаемых каждым студентом.

Профиль знаний представляет собой упорядоченный набор оценок (вектор-строку) в матрице тестовых результатов. Если испытуемый отвечает правильно на первые, сравнительно легкие задания, можно говорить о правильной структуре знаний. Профиль называется правильным, если в строке баллов у испытуемого все нули следуют за всеми единицами.

Если же обнаруживается противоположная картина, (испытуемый правильно отвечает на трудные задания и неправильно - на легкие), то это противоречит логике теста и потому такая структура знаний может быть названа инвертированной. Она встречается редко, и чаще всего, из-за нарушения требования располагать задания по мере возрастающей трудности. При условии, что тест сделан правильно, каждый профиль свидетельствует о структуре знаний.

Каждое учебное заведение должно стремиться, в первую очередь, к формированию правильных индивидуальных структур знаний, в которых не было бы пробелов (разрывов в знаниях), и на этой основе повышать уровень подготовки.

Человек не может хорошо учиться, если разрывы для него между известным и неизвестным слишком велики. Уровень знаний в значительной степени зависит от личных усилий и способностей учащихся. В то время как структура знаний зависит от правильной организации учебного процесса, от индивидуализации обучения, от мастерства педагога, от объективности контроля. В общем, от всего того, чего обычно у нас не хватает.

В результате анализа приведенных определений теста мы склоняемся к выводу, что приемлемым может оказаться следующее определение:

ПЕДАГОГИЧЕСКИЙ ТЕСТ - это система тестовых заданий различной трудности, которая позволяет качественно и эффективно измерить уровень и структуру подготовленности испытуемых.

Это достаточно лаконичное и полное определение основано на определении В.С.Аванесова с некоторыми изменениями. Рассмотрим эти отличия.

1. Вместо слова «задание» использован термин «тестовое задание». Это позволило исключить требование «специфической формы», поскольку оно содержится в понятии «задание в тестовой форме» и, следовательно, в понятии «тестовое задание».

2. Исключено требование «параллельности» заданий. Это требование введено В.С.Аванесовым для повышения «живучести» теста, с тем, чтобы обеспечить возможность многократного использования теста, за счет варьирования в нем параллельных заданий. С этой точки зрения это вполне обоснованное требование. Однако, если мы определяем тест как таковой, отвлекаясь от привлекательной для практики его применения свойства «непотопляемости», то требование параллельности можно исключить.

3. Требование «возрастающей трудности» заменено требованием «различной трудности». Дело в том, что если мы располагаем тестовыми заданиями различной, известной трудности, то, формируя тест, легко можем расположить их в любом порядке, в частности, в порядке возрастания трудности.

Некоторые авторы предлагают размещать задания в порядке уменьшения трудности, аргументируя это оптимальным распределением умственного напряжения тестируемых во времени. К концу тестирования, когда испытуемые утомлены, целесообразно предъявлять им более легкие задания.

Иногда предлагается дать возможность выбора задания самими испытуемыми, которые будут соизмерять свои возможности с теми усилиями, которые им понадобятся при прохождении теста. Это позволит им показать наилучший результат.

При компьютерном тестировании зачастую используется случайный порядок предъявления заданий, при этом сам тест формируется «на лету». Тестовые задания автоматически извлекаются из банка заданий в соответствии с той или иной процедурой, заданной разработчиком теста. Если порядок предъявления одинаков для всех испытуемых, то, находясь в одном компьютерном классе, за соседними компьютерами, они могли бы подглядывать за ответами других испытуемых. При случайном порядке предъявления заданий уменьшается вероятность подобного нарушения процедуры тестирования.

В настоящее время отмечается методологически слабая обеспеченность тестирования. Она во многом определяется недостаточной разработанностью категорийно-понятийного аппарата педагогического тестирования. Постоянно смешиваются такие ключевые понятия, как "тест" и "тестовое задание", не конкретизирована терминология видов тестов и тестовых заданий. Кроме того, большинство педагогов-практиков не имеют представления о таких важных элементах обеспечения качества экспериментальной работы, как репрезентативность выборки, надежность, валидность.

Зарубежные психологи называют науку по теории тестов психометрикой (Psychometrika). а педагоги - педагогическим измерением (Educational measurement). Поскольку общего названия на русском языке пока нет. то мы будем придерживаться устоявшегося названия данной науки - тестология , которое используется в педагогическом, психологическом или социологическом контексте. Само название "тестология" определяется как наука о тестах.

Педагогическая тестология является прикладной методической теорией научной педагогики, которая призвана заниматься вопросами разработки тестов для объективного контроля подготовленности учащихся.

Ключевыми понятиями тестологии являются педагогическое задание, тест, содержание и форма заданий, надежность и валидность результатов измерения. Кроме того, в тестологии используются такие понятия статистической науки, как выборочная и генеральная совокупность, корреляция и др.

Исходным понятием тестологии является понятие "педагогическое задание". Педагогическое задание - средство интеллектуального развития, образования и обучения, способствующее активизаций учения, повышению подготовленности учащихся, а также повышению эффективности педагогического труда . Задания могут формулироваться как в тестовой, так и в нетестовой форме.

Еще одним важным понятием является понятие теста. В настоящее время существует несколько десятков определения понятия "тест". Для обыденного сознания тест означает перевод с английского test - проба, испытание, метод. Смысл этого слова охватывает любой метод проверки, даже субъективный.

Часто мы встречаемся с упрощенным пониманием данного термина как системы заданий с выбором правильного ответа из представленных вариантов. Положение усугубляется многочисленными примерами "тестов" в газетно-журнальной периодике, многочисленными книжными публикациями под одноименным названием. Часто под такими развлекательными и даже педагогическими заданиями оказываются не тесты, а нечто, только внешне похожее на них. Между тем различия в понимании сущности тестов следует искать в самом отношении к тестам

С.Л. Рубинштейн в 1938 г. дал следующее определение теста: "Тест - это испытание, которое ставит своей целью градирование, определение рангового места личности в группе или коллективе, установление ее уровня. Тест направлен на личность, он должен служить средством диагноза и прогноза" . Его современник, один из основоположников советской психотехники С.Г. Геллерштойн писал: "Тест - это испытательный эксперимент, носящий характер определенного задания, которое стимулирует определенную форму активности и выполнение которого, поддаваясь количественной и качественной оценке, служит симптомом совершенствования определенных функций" .

Под термином "тест" в советской психолого-педагогической литературе до 1980-х гг. имелось в виду задание с четким и однозначным вариантом правильного ответа, ориентированным на определенные нормативы.

В целом сегодня научное мышление под термином "тест" понимает но только метод тестирования, но и научно-педагогическую систему. B.C. Аванесов рассматривает тест как единство метода, результата, полученного определенным методом, и интерпретации результатов.

Традиционный тест представляет собой стандартизированный метод диагностики и уровня структуры подготовленности школьников. В таком тесте все испытуемые отвечают на одни и то же задания, в одинаковое время, в одинаковых условиях и с одинаковыми правилами оценивания ответов. Цель применения данных тестов - установить отношение порядка между испытуемыми по уровню проявляемых при тестировании знаний И на этой основе определить место каждого на заданном множество тестируемых испытуемых.

Далеко не однозначен и термин "дидактический тест": как синонимы используются термины "педагогические", "учительские", "преподавательские тесты", "тесты достижений", "тесты исполнения", "тесты контроля знаний", "тесты умений и навыков", "учебные тесты", "контрольные тесты".

При этом разные авторы вкладывают свое (не всегда четко определенное) понимание в эти термины. Например, у Ч. Куписевича "преподавательский тест - это не стандартизированные тесты, которые "могут быть составлены лицами, исследующими результаты учебы, достигнутые на проведенных ими учебных занятиях" .

С.М. Вишнякова в словаре профессионального образования дает следующее определение теста. Тест, во-первых, стандартное задание, соответствующее определенным требованиям (однозначности, краткости и простоты). выполнение которого позволяет оценить некоторые психофизиологические характеристики испытуемого (умственное развитие, способности.

полевые качества), а также уровень его знаний, умений и навыков. Во-вторых. тест является объективным методом контроля качества знаний учащегося, инструментом, позволяющим выявить факт усвоения. В-третьих, cостоит из контрольного задания и эталона - образца последовательного и правильного выполнения задания. Задание выдается испытуемому, а эталон используется преподавателем или заложен в техническое средство для сравнения с ответом испытуемого и выведения оценки. Следует отметить, что этот метод требует:

  • - объемного и дорогостоящего методического обеспечения (набора тестов по каждой цели обучения) и высокой квалификации разработчиков тестов;
  • - вопросник для конкретных социологических исследований;
  • - информационную задачу с известным решением, предназначенную для проверки правильности работы вычислительной машины .

А Н. Майоров рассматривает тест как инструмент, состоящий из квалиметрически выверенной системы тестовых заданий, стандартизированной процедуры проведения и заранее спроектированной технологии обработки и анализа результатов, предназначенный для измерения качеств и свойств личности, изменение которых возможно в процессе систематического обучения .

B.C. Аванесов определяет педагогический тест как систему параллельных заданий возрастающей трудности, специфической формы, которая позволяет качественно и эффективно измерять уровень и структуру подготовленности испытуемых .

При этом под системой понимается, что в тесте собраны такие задания. которые обладают системообразующими свойствами. Это, в свою очередь. означает общую принадлежность заданий к одной и той же системе знаний, а также их связь и упорядоченность. Еще одним необходимым атрибутом настоящего теста является расположение заданий по мере возрастания трудности - от самого легкого до самого трудного. Иначе говоря, главным формальным системообразующим признаком теста является различие заданий по степени их трудности.

Показатель трудности теста и тестовых заданий является содержательным и формальным одновременно. Содержательным показателем - потому что в хорошем тесте трудность может зависеть только от содержания и от уровня подготовленности самих испытуемых, в то время как в плохом тесте на результаты начинают заметно влиять форма заданий (особенно если она не адекватна содержанию), плохая организация тестирования, если имеются возможности списывания, утечки информации.

Формальная составляющая сторона показателя трудности возникает при рассмотрении тестирования как процесса противоборства каждого испытуемого с каждым предлагаемым ему заданием. Получаемый при этом исход полезно рассматривать как результат такого противоборства

Специфическая форма тестовых заданий говорит о том. что задания теста представляют собой и не задачи, а задания, сформулированные в форме высказываний, истинных или ложных. Такие задания носят название "тестовые задания" или "задания в тестовой форме" в зависимости от употребляемого контекста. Традиционные вопросы, напротив. истинными или ложными не бывают, а ответы на них часто бывают многословны, они не поддаются сравнению с жестким эталоном. В этом смысле традиционные вопросы и ответы менее нетехнологичны, чем задания в тестовой форме или тестовые задания.

Нельзя не согласиться с B.C. Аванесовым, который указывает на то, что не всякое содержание поддается представлению в форме тестового задания. Затруднительным представляется выражение доказательств, обширных вычислений, многословных описаний в тестовой форме.

Определенное содержание означает, что при тестировании проверяется не весь программный материал, а лишь та часть учебной программы, которая входит в содержание проверяемых знаний учащихся. Остальное в педагогический тест не включается. При этом некоторые элементы проверяемых знаний используются только в текущем контроле, другие - в рубежном контроле, например, в конце учебной четверти. И, наконец, в итоговом контроле используются задания, правильные ответы на которые требуют знания многих, а иногда и всех тем, изученных в течение учебного года. Особое внимание следует уделять комплексности и сбалансированности содержания теста . Согласно этому положению тест, разработанный для итогового контроля знаний, не должен строиться на материале одной темы, даже самой основной. Тест необходимо конструировать, исходя, из сбалансированности всех тем курса. В то же время необходимо добиваться комплексного включения в тест как вопросов теории, так и методов научной и практической деятельности, умения эффективно решать основные профессиональные задания.

Согласно принципу научной достоверности в тест включается только то содержание учебной дисциплины, которое является объективно истинным и обладает аргументацией. Не следует включать спорные вопросы, то есть вопросы, имеющие неоднозначное решение. Кроме того, в педагогический тест, предназначенный для контроля. диагностики обученности и обучаемости, недопустимо включать вопросы, которые выясняют оценки, мотивацию, мнения.

По своей длине тесты могут быть короткими (10-20 заданий), средними (40-60 заданий) и длинными (до 500 заданий). Оптимальное количество заданий определяется целями контроля, но практика показывает, что это примерно 40-60 заданий. Количество заданий в тесте принято называть длиной теста. К настоящему времени сложилась практика организации различных видов тестирования, требующих соответственно разных тестов. Таким образом. кроме приведенных подходов, тесты можно классифицировать по целому ряду оснований.

1. Прежде всего по процедуре создания могут быть выделены стандартизированные и нестандартизированные тесты.

Стандартизируются процедура и условия проведения тестирования, способы обработки и интерпретации результатов, которые должны привести к созданию равных условий для испытуемых и минимизировать случайные ошибки и погрешности как на этапе проведения, так и на этапе обработки результатов и интерпретации данных

В образовании можно выделить ряд задач, которые могут быть решены нестандартизированными тестами. Однако для целей мониторинга необходимо использовать только стандартизированный тестовый инструмент.

  • 2. По степени однородности задач выделяют гомогенные и гетерогенные тесты.
  • 3. По средствам предъявления выделяют бланковые тесты (""бумага и карандаш").

Эти тесты в свою очередь можно разделить на два вида:

  • 1) с использованием тестовых тетрадей, в которых находятся тестовые задания и в которых испытуемый фиксирует результаты;
  • 2) с использованием бланков, в которых испытуемые отмечают или вписывают правильные ответы (фиксируют ответы). Бланки предъявляются отдельно от заданий:

предметные, в которых необходимо манипулировать материальными объектами, результативность выполнения этих тестов зависит от скорости и правильности выполнения заданий;

аппаратурные - тесты с использованием устройств для изучения особенностей внимания, восприятия, памяти и мышления;

практические, появившиеся относительно недавно. Эти тесты сходны с известными у нас лабораторными работами (по химии, физике, биологии и пр.). однако снабженные соответствующими инструкциями и имеющие тестовое оснащение;

компьютерные тесты .

  • 4. По направленности развития и формирования человеческих качеств:
    • - тесты интеллекта, выявляющие особенности последнего;
    • - тесты общих умственных способностей, умственного развития;
    • - тесты специальных способностей в различных областях деятельности;
    • - тесты обученности, успеваемости, академических достижений;
    • - тесты для определения отдельных качеств (черт) личности , личностные тесты (иногда называемые тестами темперамента), с помощью которых изучаются особенности личности испытуемого (память, мышление, характер, эмоции и др.);
    • - тесты для определения уровня воспитанности (сформирован- мости общечеловеческих, социально-нравственных, обще интеллектуальных, общекультурных и других качеств);
    • - тесты достижений.

Правильно составленные тесты учебных достижений (обученности) должны удовлетворять определенным требованиям. Желательно сделать их:

  • - краткосрочными, чтобы не требовались большие затраты времени;
  • - однозначными, не допускающими произвольного толкования тестового задания;
  • - правильными, исключающими возможность формулирования многозначных ответов;
  • - краткими, требующими сжатых ответов;
  • - информационными, т.е. такими, которые обеспечивают возможность соотнесения количественной оценки за выполнение теста с порядковой или даже интервальной шкалами измерений; удобными, т.е. пригодными для быстрой математической обработки результатов;
  • - стандартными, пригодными для широкого практического использования - измерения уровня обученности возможно более широких групп учеников, овладевающих одинаковым объемом знаний на одном и том же уровне обучения.

Применение тестов будет наиболее эффективным и обеспечит надежные выводы лишь при условии правильного сочетания всех выделенных групп тестов. Поэтому тестовые испытания всегда имеют комплексный характер: выводы одних дополняются и корректируются другими.

При подготовке материалов для тестового контроля необходимо придерживаться следующих основных правил.

  • 1) Нельзя включать ответы, неправильность которых на момент тестирования не может быть обоснована учащимися.
  • 2) Неправильные ответы должны конструироваться на основе типичных ошибок и должны быть правдоподобными.
  • 3) Правильные ответы среди всех предлагаемых должны размещаться в случайном порядке.
  • 4) Вопросы не должны повторять формулировок учебника.
  • 5) Ответы на одни вопросы не должны быть подсказками для ответов на Другие.
  • 6) Вопросы не должны содержать "ловушек" .
  • 5. По характеру действий.

Вербальные (связанные с необходимостью произведения умственных действий - словесно-логические тесты, вопросники на проверку знаний, установление закономерностей и пр.). Данные тесты требуют сформированности навыков и наличия определенных знаний. Поэтому именно те дети, которые хорошо успевают в школе, как правило, набирают большее количество баллов при прохождении этих тестов.

Невербальные (практические), связанные с практическим манипулированием предметами - карточками, блоками, деталями. Невербальные тесты, по мнению многих английских педагогов, меньше зависят от школьной успеваемости, домашних условий воспитания, социального положения. При выполнении этих тестов учащийся должен анализировать, сравнивать, делать выводы на основе наборов картинок, диаграмм, предметов, фигур и т.д. С заданиями невербальных тестов нередко лучше справляются учащиеся с высоким уровнем интеллекта из семей с низким социальным статусом, отличающиеся плохим поведением, частыми нарушениями дисциплины и т.д. .

6. По ведущей ориентации.

Тесты скорости, содержащие простые задачи, время решения которых ограничено настолько, что ни один испытуемый не успевает решить все задачи в заданное время.

Тесты мощности или результативности, включающие трудные задачи. время решения которых либо вовсе не ограничено, либо мягко лимитировано. Оценке подлежит успешность и способ решения задачи. Примером такого рода тестовых заданий могут быть задания для письменных итоговых экзаменов за курс школы.

Смешанные тесты, которые объединяют в себе черты двух вышеперечисленных. В таких тестах представлены задачи различного уровня сложности. от самых простых до очень сложных. Время испытания в данном случае ограничено, но достаточное для решения предлагаемых задач большинством обследуемых. Оценкой в данном случае служат как скорость выполнения заданий (количество выполненных заданий), так и правильность решения.

Эти тесты наиболее часто применяются на практике, и именно к ним относится большинство тестов учебных достижений, которые можно использовать для нужд мониторинга.

7. По характеру объективности.

Объективные тесты - тесты, объективность оценки результатов которых обусловливается тем обстоятельством, что в процессе обработки результатов тестирования не предусматривается использование их субъективных толкований тестирующим, к этой группе тестов относятся тесты школьных достижений.

Проективные тесты - совокупность методик, разработанных в рамках проективного подхода в психологии и характеризующихся неопределенностью. неоднозначностью используемых в ходе тестирования стимулов. Соответственно, такой подход допускает большое разнообразие ответов и их интерпретацию.

8. По степени ориентированности.

Широко ориентированные, позволяющие оценить эффективность процесса обучения по степени реализации одной из его основных целей, то есть степени освоения учащимися системы знаний, умений и навыков в ходе учебного процесса.

Узко ориентированные, направленные на выявление достижений учащихся в процессе освоения отдельных предметов, отдельных тем и т.д..

  • 9. По целям использования выделяются следующие группы тестов:
    • - знаний или поведения студента в начале обучения (определяющий тест) :
    • - прогресса, достигнутого в процессе обучения (формирующий тест) :
    • - трудностей обучения и их источников во время процесса обучения (диагностический тест) :
    • - основных достижений в конце обучения (суммирующий тест).

Предварительный определяющий тест предназначен для оценки начальных способностей, обычно является несложным и охватывает очень небольшой диапазон знаний. Он может затрагивать минимум базовых знаний по теме обучения или другой ограниченный набор требуемых знаний.

Формирующий тест, используемый для контроля за прогрессом обучения, затрагивает ограниченный сегмент обучения, например, раздел или главу, и с его помощью делается попытка оценить все важные результаты данного сегмента. Акцент делается на оценке степени владения материалом изучаемых задач и обеспечения обратной связи со студентом по корректировке отдельных ошибок.

Диагностический тест содержит относительно большое число вопросов, имеющих отношение к конкретной тестируемой области. В связи с тем, что целью теста является определение трудностей обучения, внимание фокусируется на ответах учащихся на конкретный вопрос или группу вопросов, и общий балл имеет второстепенное значение. Этот тест обычно больше фокусируется на распространенных ошибках, которые делают учащиеся, чем на попытке широкого отбора ожидаемых результатов обучения.

Суммирующий тест разрабатывается для оценки широкого диапазона результатов обучения, ожидаемого в конце учебного процесса. Сложность и представительность выборки являются важными аспектами данного теста в связи с тем. что результаты используются для простановки баллов и определения степени достижения задач курса обучения. Для того чтобы адекватно отобрать все ожидаемые результаты обучения, суммирующий тест обычно содержит вопросы, которые представляют более высокий уровень сложности, чем другие виды тестов.

10. По широте использования.

Для использования учителем.

Для использования группой учителей или администрацией образовательно по учреждения.

Для целей отбора и формирования групп.

2.1. Тест (от англ. test -- испытание, проверка) -- стандартизованные, краткие, ограниченные во времени испытания, предназначенные для установления количественных и качественных индивидуальных различий.

По мере использования тестов была сформирована их классификация по цели и содержанию:

* тесты личности -- для оценки эмоционально-волевых качеств индивидуума;

* тесты интеллекта -- для анализа уровня развития познавательных процессов и функций мышления;

* тесты способностей -- для оценки возможности в овладении различной деятельностью;

* тесты достижений, с помощью которых оценивают развитие знаний, умений, навыков после обучения.

Из всего многообразия типов стандартизованных тестов в образовании используют тесты достижений. Они создавались для проверки результатов обучения на разных ступенях получения образования, измерения эффективности программ и процесса обучения. Тесты достижений принято противопоставлять тестам способностей, состоящим из тестов общего интеллекта, комплексных батарей способностей и тестов специальных способностей. Можно сказать, что тесты способностей измеряют эффективность обучения в относительно неконтролируемых и неизвестных условиях, в то время как тесты достижений измеряют эффективность обучения при частично известных и контролируемых условиях.

* По процедуре создания могут быть выделены стандартизированные и не стандартизированные тесты.

Стандартизация -- последовательный ряд процедур по планированию, проведению оценивания и выставлению баллов. Цель стандартизации состоит в том, чтобы обеспечить всем учащимся возможность проходить оценивание в равных условиях, чтобы их оценки имели одинаковое значение и не подвергались влиянию различных условий. Это важная процедура, когда оценки планируется использовать для сравнения отдельных людей или групп.

В образовании можно выделить и ряд задач, которые могут быть решены не стандартизированными тестами, -- в том числе текущий контроль знаний на этапе обучения. Однако для итоговой аттестации учащихся используются только стандартизованные тесты.

По способу предъявления различают тесты:

бланковые (машиночитаемые бланки, тестовые тетради);

предметные (манипуляция материальными объектами рассчитана на быстроту реакции и четкость действий);

аппаратурные (с использованием специальной аппаратуры -- датчиков для фиксации сигналов);

практические (аналоги лабораторных работ, но с тестовыми условиями заданий);

компьютерные (как частный случай -- адаптивные).

По характеру действий тесты делят на:

вербальные;

невербальные.

По ведущей ориентации выделяют:

тесты на скорость;

тесты на результативность (мощность);

смешанные тесты.

По степени однородности задач тесты делят на:

гомогенные, позволяющие измерить одно качество (уровень подготовки по одному предмету) однородными по составу заданиями;

гетерогенные (многомерные) -- для измерения уровня подготовленности учащихся по нескольким учебным предметам и (или) свойствам личности.

Гетерогенные тесты бывают полидисциплинарными и междисциплинарными. Полидисциплинарные тесты состоят из гомогенныхсубтестов по отдельным дисциплинам. Результаты учеников по субтестам объединяются для подсчета итоговых баллов по всему полидисциплинарному тесту. Для выполнения заданий междисциплинарных тестов требуется применение обобщенных, межпредметных, интегративных знаний и умений. Междисциплинарные тесты всегда многомерны, их разработка требует обращения к факторным методам анализа данных, математико-статистическим методам многомерного шкалирования и т. д.

По целям использования в системе образования:

определяющий (знания или поведение обучаемого в начале обучения).

Для отечественной системы образования наиболее приемлемый и используемый педагогами термин -- «тестирование во входном контроле». При входном контроле с помощью педагогических тестов можно ответить на вопрос -- насколько обучаемые владеют базовыми знаниями, умениями и навыками, чтобы успешно освоить новый материал, а также определить степень владения новым материалом до начала его изучения.

Учащиеся в классе имеют разную подготовку, различные способности и раз-личаются по мотивирующему фактору. В этой ситуации реализовать в большей мере личностно ориентированное обучение возможно при следующем подходе. Сначала следует провести входное тестирование, которое позволит разделить учащихся на две подгруппы. В первую попадают сильные учащиеся; при анализе выполнения ими входного теста прежде всего важна не степень их готовности к изучению нового материала, а оценка степени владения новым материалом, которая поможет учителю организовать его изучение на приемлемом уровне. Для второй группы учащихся на начальном этапе важно определить, каких базовых компонентов знаний им не хватает для успешного продолжения учения, и принять меры по устранению выявленных пробелов еще на первоначальном этапе. В этом случае учитель может подобрать такой метод обучения, который был бы наиболее эффективным для всей группы и позволил бы получить высокие результаты по окончании обучения. Сравнение же начального и конечного состояния обучаемых позволяет оценить прирост знаний; тогда во входном тестировании используется тестовый материал, незначительно отличающийся от материала для итогового контроля по изучаемой теме.

При первоначальном изучении материала учителю педстоит большая подготовительная работа по разработке собтвенного проверочного материала или по адаптации уже существующего; в дальнейшем же используется уже готовый материал и необходимы только незначительные его корректировки. Входное тестирование бесполезно, когда:

учитель хорошо знает возможности обучаемых, поскольку давно работает с классом;

область планируемых к усвоению знаний достаточно новая, так что у учащихся не может быть никаких «заделов», либо трудно пока выделить качественный уровень усвоения.

Тесты для входного контроля, обычно называемые претестами (предварительными тестами), делятся на два типа. Претесты первого типа позволяют выявить готовность к усвоению новых знаний в классе. Они разрабатываются в рамках критериально-ориентированного подхода и содержат задания для проверки базовых знаний, умений и навыков, необходимых для усвоения нового материала, В основном эти претесты предназначены для наиболее слабых учеников, находящихся на границе между явно подготовленными и явно не подготовленными к началу усвоения нового материала. По результатам выполнения претеста проводится деление тестируемых на две группы, в одну из которых попадают те, кто может двигаться дальше, а в другую -- те, кто нуждается в дополнительной работе и консультациях педагога.

П р е т е с т ы второго типа разрабатываются в рамках нормативно-ориентированного подхода. Они охватывают планируемые результаты предстоящего обучения и построены полностью на новом материале. По результатам выполнения претеста преподаватель принимает решение, позволяющее внести элементы индивидуализации в массовый учебный процесс. Если ученик показал некоторые предварительные знания по новому материалу, то план его обуче-ния необходимо перестроить и начать с более высокого уровня, чтобы учебный материал имел для него действительный характер новизны. Иногда роль входного претеста выполняет итоговый тест, который предназначен для будущей оценки результатов усвоения нового материала после завершения его изучения.

26. Понятия, используемые в тестировании (предтестовое задание, тестовое задание, педагогический тест).

Предтестовое задание . Определение предтестового задания является базовым, содержащим специфические требования, с тем чтобы отличить его от традиционного контрольного задания. Предтестовое задание – это единица контрольного материала, содержание, логическая структура и форма представления которого удовлетворяют ряду требований и обеспечивают однозначность оценок результатов выполнения благодаря стандартизованным правилам проверки.

В предтестовых заданиях проверяются наиболее существенные опорные элементы содержания дисциплины. В каждом предтестовом задании определяется то, что однозначно считается правильным ответом с запланированной степенью его полноты.

Требования, предъявляемые к форме пред тестовых заданий, можно условно разделить на специальные, отражающие специфику формы, и общие, инвариантные относительно выбранной формы. Согласно, общим требованиям задание должно иметь определенный порядковый номера стандартную инструкций по выполнению, адекватную форме, эталон правильного ответа, стандартизованные правила по оценке результатов его выполнения и т. д..

Преимущества предтестовых заданий по сравнению с традиционными контрольными заданиями обеспечиваются предельной стандартизацией при предъявлении и оценивании результатов их выполнения, что в целом повышает объективность оценок учащихся по тесту.

Тестовое задание. Предтестовые задания должны пройти обязательную эмпирическую проверку, по результатам которой часть из них превращается в тестовые, а оставшаяся часть удаляется из первоначальной совокупности заданий теста.Предтестовое задание превращается втестовое, если количественные оценки его характеристик удовлетворяют определенным критериям, нацеленным на эмпирическую проверку качества содержания, формы и системообразующих свойств предтестовых заданий.

Обычно требуется не менее двух-трех апробаций, по результатам которых ведется коррекция содержания, формы, трудности задания, его валидности и статистических свойств, характеризующих качество его работы вместе с остальными заданиями теста. Исследование системообразующих характеристик тестового задания проводится на основе анализа дескриптивной (описательной) статистики, а также методов корреляционного, факторного и латентно-структурного анализа. Интерпретация результатов анализа – это всегда сложная аналитическая работа, результаты которой зависят от множества условий, в том числе и от вида создаваемого теста. В длительной апробации и коррекции нуждаются в основном итоговые тесты, используемые для принятия управленческих решений в образовании.

Педагогический тест . В отличие от первых двух определений, инвариантных относительно целей тестирования и решаемых задач, определение педагогического теста должно быть ориентировано на конкретный вид теста. В частности итоговый нормативно-ориентированный тест – это система тестовых заданий, упорядоченных в рамках определенной стратегии предъявления и обладающих такими характеристиками, которые обеспечивают высокую дифференциацию, точность и обоснованность оценок качества учебных достижений.

Из этого определения следуют два важных вывода. Первый: нет и не может быть тестов, качественных вообще, так как оценка дифференцирующего эффекта теста, точности измерений (надежности) и их адекватности поставленным целям (валидности) зависит не только от характеристик тестовых заданий, но и от особенностей тестируемого контингента учащихся. Второй: для оценки качества теста необходимы эмпирические данные тестирования, полученные на репрезентативной выборке учащихся. Работа по коррекции теста консолидирует систему тестовых задании – постепенно нарастают внутренняя связь и целостность, интегративностъ системы, совершается переход от совокупности предтестовых.заданий к профессионально разработанному тесту.

Итоговый критериально-ориентированный тест – это система тестовых заданий, упорядоченных в рамках определенной стратегии предъявления и обладающих такими характеристиками, которые обеспечивают валидную содержательную интерпретацию учебных достижений по отношению к установленным, статистически обоснованным критериям выполнения. В определении не конкретизируется базовая содержательная область, используемая при интерпретации, что позволяет применять его для различных разновидностей критериально-ориентированных тестов.

27. Классификация тестовых заданий.

Все задания разбиваются на две большие группы - задания в открытой форме и задания в закрытой форме. В основу классификации положено наличие или отсутствие ввода дополнительной информации испытуемым. Если дополнительная информация нужна, то это задание в открытой форме . Если не нужна, то это задание в закрытой форме .

Задания в открытой форме подразделяются на задания с дополнениеми в виде свободного изложения. В первом случае испытуемому необходимо дополнить содержание задания своей информацией. В результате задание должно превратиться в истинное логическое высказывание. Дополнение должно быть кратким - одно, в крайнем случае, два - три слова. При свободном изложении объем водимой информации может быть значительно больше.

В тестировании чаще всего используются задания в закрытой форме. Эти задания характерны тем, что содержат в себе и основу (вопрос, утверждение) и ответы (элементы ответов), из которых испытуемый должен выбрать или составить верный ответ.

В простейшем случае испытуемый просто указывает ответ, который ему кажется правильным - задания с выбором верного ответа. Об этих заданиях более подробно будет сказано далее.

В заданиях с выбором нескольких верных ответов, испытуемый должен указать все верные ответы. Процедура оценивания здесь сложнее, чем в предыдущем случае. Сумма баллов за такое задание может быть больше чем в заданиях с выбором одного верного ответа.

Задания с градуированными ответами содержат ответы, которые возможно все являются правильными в той или иной степени. Ответы имеют градацию по степени правильности. Задача составителя заключается в том, чтобы найти и применить признак, позволяющий осуществить такую градацию. Максимальное количество баллов испытуемый получает, если его градация ответов полностью совпадает с градацией эксперта, например, разработчика задания.

Задания на установление соответствия требуют от испытуемого найти соответствие между элементами двух множеств. Соответствие устанавливается на основании логических умозаключений или использовании смысловых ассоциаций.

В заданиях на установление правильной последовательности испытуемому необходимо не просто выбрать соответствующие элементы ответа, но и расположить их в нужной последовательности. Заданиями такого типа хорошо проверять знание алгоритмов действий, технологических приемов, логики рассуждений и т.п. С помощью этих заданий удобно проверять знание и понимание испытуемыми формулировок определений, понятий, терминов, путем конструирования их из отдельным слов, предложений, символов, графических элементов.

Тест (анг. - проба, испытание, исследование) представляет собой совокупность вопросов и заданий, предъявляемых испытуемому с целью измерения (диагностирования) его личностных характеристик.

Тестирование - это стандартизированный метод, используемый для измерения различных характеристик отдельных лиц. Часто оно является наименее трудоемким способом получить сведения об объективных данных или субъективных позициях. Оценка теста производится по числу правильных ответов в порядковой или интервальной шкапе.

Тестирование - целенаправленное, одинаковое для всех испытуемых обследование, проводимое в строго контролируемых условиях, позволяющее объективно измерить изучаемые характеристики педагогического процесса.

Тестовая методика позволяет получать более объективные и точные данные по сравнению с анкетным опросом, облегчает математическую обработку результатов.

Однако тестирование уступает другим методикам по глубине качественного анализа, лишает испытуемых разнообразия возможностей самовыражения.

В зарубежной психологии и педагогике тестирование применяется весьма широко; в нашей стране официально тесты применялись только для целей профессионального отбора, психопатологической диагностики, изучения физиологических возможностей человека в различных видах спорта и некоторых других областях. В настоящее время тестологические обследования применяются в образовательных учреждениях для проверки знаний, умений и навыков учащихся.

Контролирующая программа, заложенная в тесте, может иметь глобальный, общегосударственный статус (стандартизированный тест) или местный, локальный, самодеятельный (нестандартизированный тест). Стандартизация теста предполагает создание единообразного содержания, процедуры проведения и оценки выполнения тестовых заданий. Такой тест строится на научно-методической основе и подвергается проверке на большом количестве испытуемых. После этого тест принимается в качестве интервальной шкалы оценки того или иного качества (и называется стандартизированным).

В практике массового педагогического экспериментирования применяются адаптированные (видоизменение стандартизированных) и самостоятельно разрабатываемые педагогами и методистами тесты. Результаты их применения имеют поэтому ограниченную надежность.

По функциональным признакам различают:

  • интеллектуальные тесты;
  • тесты достижений;
  • тесты специальных способностей;
  • личностные тесты;
  • тесты интересов, установок, ценностей;
  • тесты, диагностирующие межличностные отношения.

Распространенный за рубежом тест количественного определения уровня умственного развития детей (коэффициент интеллекта) содержит определенное количество вопросов и заданий. Количество правильных ответов и решений переводится с помощью таблиц, заранее отработанных на большом контингенте испытуемых, в соответствующий показатель. По мнению большинства психологов, коэффициент интеллекта оценивает главным образом наличный уровень знаний, степень приобщенности личности к культуре, а не общую характеристику качеств интеллекта.

Обычно тестирование как метод педагогического исследования сливается с тестированием текущей успеваемости, выявлением уровня обученосги. В образовательной практике применяются тесты достижений. Оценка знаний педагогом - это педагогическое тестирование, т. е. выявление уровня знаний, умений, навыков, приобретенных в процессе изучения того или иного предмета. Выделяется два вида тестов: скорости и мощности. По тестам скорости у испытуемого обычно не хватает времени ответить на все вопросы, по тестам мощности у каждого такая возможность есть.

Тесты способностей - совокупность методик для изучения и оценки творческих способностей личности: способности порождать необычные идеи, отклоняться от традиционных схем мышления, быстро решать проблемные ситуации. Однако надежных способов и критериев для этих тестов пока не найдено.

По структурным признакам могут быть:

  • закрытые тесты и тесты со свободно конструируемым ответом (открытые);
  • тесты с альтернативным, множественным и перекрестным выбором ответа;
  • тесты на скорость и на сложность (состоящие из все более усложняющихся заданий);
  • тесты с выводом и обработкой ответов с помощью вычислительной техники и без нее.

Наконец, имеется целая серия тестов, основывающихся на предположении о том, что качества личности могут отражаться не только в формализованных ответах на вопросы, айв реакциях на неопределенные, произвольные ситуации. Это могут быть картинки, неоконченные предложения, продукты свободной творческой деятельности, игра и т. д. Предполагается, что такой тестовый материал должен выступать как своего рода экран, на который испытуемый «проецирует» свои мысли, потребности, чувства и т. д. Такие тесты называются проективными (например, методики незаконченных предложений, рисуночных ассоциаций, чернильных пятен (тест Роршаха), и др.). Проективные тесты - методики, направленные на выявление определенных психологических качеств человека.

Для того чтобы тест можно было назвать научным и отличить его от «любительского», он должен обладать критериями качества. Эти качества - валидность, надежность, научность, стандартизация результатов.

1. Валидность (от лат. «valid» - действительный, пригодный) - означает пригодность для измерения именно того качества, на которое он направлен, то есть означает ответы на вопросы: для какой цели применяется тест? что он измеряет? насколько хорошо он способен работать?

Существуют хорошо разработанные процедуры проверки теста на валидность: по содержанию теста, по связи с объективными критериями, по конструкции теста.

Интересен тот факт, что если для педагогического исследования мы подберем тесты, отвечающие качественному критерию валидности в диагностическом смысле, то их прогностическая валидность всегда будет сомнительной. Используя тесты, исследователь должен учесть, что с их помощью можно определить уровень развития или наличие какого-либо свойства личности на данный момент. Прогнозировать, как оно будет проявляться в дальнейшем, нельзя.

  • 2. Надежность - означает точность психолого-педагогических измерений, свободу от погрешностей процедуры тестирования, т. е. постоянство показателей тестовых испытаний. В качестве цифрового показателя может выступать коэффициент корреляции с результатами, полученными с помощью других тестов (методик). Качественные показатели могут быть получены путем: проверки результатов с помощью других тестов (методик); деления теста на две половины (если это опросник, практикуют деление на четную и нечетную половины); анализа содержания вопросов и ответов; оценки степени стабильности результатов при повторном тестировании.
  • 3. Научность - означает связь теста с фундаментальными исследованиями, т. е. в основе теста должна лежать какая-либо научная концепция. Настоящий критерий качества позволяет отличить научный тест от «любительского».
  • 4. Стандартизация результатов тестирования. Использование теста подразумевает единообразие процедуры и обработки результатов. Оценка результатов осуществляется с помощью нормативов, которые, как правило, получены на представительной выборке испытуемых, соответствующей той, на которую тест ориентирован. Норму (норматив) можно получить графическим способом - путем построения нормального распределения результатов для каждого показателя.

В современном психолого-педагогическом исследовании чаще всего используются три разновидности тестов:

  • собственно психодиагностические тесты. Они используются, как правило, в целях оптимального управления процессом формирования личности учащегося и коррекции стиля педагогической деятельности педагога;
  • дидактические тесты. Они применяются в целях изучения результатов педагогико-образовательной деятельности, оптимизации процесса обучения. В эту группу входят: тесты способностей, тесты достижений, тесты интеллекта, ориентировочные тесты знаний (часто их комплекс по нескольких учебным предметам), прогностические тесты;
  • функциональная проба в виде экспериментальных заданий, призванных активизировать умственные операции, мотивы, интересы и т.д.