Другие журналы
|
научное издание МГТУ им. Н.Э. БауманаНАУКА и ОБРАЗОВАНИЕИздатель ФГБОУ ВПО "МГТУ им. Н.Э. Баумана". Эл № ФС 77 - 48211. ISSN 1994-0408![]()
Метод автоматизированного формирования контрольно-измерительного материала на основе числовой оценки уровня взаимозначимости учебных элементов
# 02, февраль 2013 DOI: 10.7463/0213.0533251
Файл статьи:
![]() УДК 378:53+004.04:004.822 Россия, Муромский институт (филиал) ФГБОУ ВПО
Введение В настоящее время автоматизация диагностики уровня усвоения учебного материала позволила значительно снизить нагрузку на преподавателей и составителей педагогических тестов в рамках традиционного образовательного процесса, а в случае информационно-образовательных систем способствовала развитию адаптивных методов диагностики и в целом повышению эффективности тестовых методов контроля уровня подготовленности учащихся. Под педагогическим тестом в общем случае понимается репрезентативная система параллельных заданий равномерно возрастающей трудности, специфической формы, определённого содержания, позволяющая качественно оценить структуру и эффективно измерить уровень подготовленности испытуемых [1]. Процедуру диагностики уровня усвоения учебного материала можно условно разделить на три составляющие: – формирование контрольно-измерительного материала; – непосредственно процедура контроля, состоящая в фиксации действий испытуемых; – анализ исходных результатов тестирования. Среди круга задач, относящихся к области диагностики уровня усвоения учебного материала, выделим задачу, состоящую в определении уровня подготовленности учащегося перед изучением учебного материала, иными словами задачу входного контроля, решение которой позволяет оценить в какой мере учащийся готов к изучению выбранного учебного элемента. Значимость результатов входной диагностики в рамках информационно-образовательных систем объясняется тем, что они лежат в основе управления индивидуальной траекторией обучения. На сегодняшний день наиболее рутинным и одновременно ответственным этапом в рассматриваемой задаче, который требует как можно более полного вовлечения педагога-эксперта, является этап формирования содержания контрольно-измерительного материала, представляющего собой основу педагогического теста. Сложность разработки методов и алгоритмов автоматизированного формирования контрольно-измерительного материала объясняется, в первую очередь, необходимостью повышения уровня автоматизации совместно с соблюдением ряда требований, предъявляемых к контрольно-измерительному материалу со стороны теории педагогических измерений. Актуальность рассматриваемой задачи, а в ней именно этапа формирования контрольно-измерительного, обусловлена ростом востребованности информационно-образовательным систем вместе с недостаточностью проработанности настоящего вопроса. Таким образом, целью настоящей работы является разработка метода автоматизированного формирования содержания контрольно-измерительного материала, результаты диагностики в соответствии с которым будут наиболее полно отвечать требованиям, предъявляемым к ним со стороны теории педагогических измерений. Для достижения поставленной цели необходимо рассмотреть теорию педагогических измерений и проанализировать существующие методы автоматизированного формирования контрольно-измерительного материала, а именно: – определить базовые принципы отбора содержания контрольно-измерительного материала; – выделить критерии оценки результатов диагностики уровня усвоения учебного материала; – выполнить обзор и анализ существующих методов автоматизированного формирования контрольно-измерительного материала и оценить степень соответствия их требованиям, предъявляемым со стороны теории педагогических измерений; – обосновать необходимость и выполнить разработку метода автоматизированного формирования контрольно-измерительного материала.
1. Принципы отбора содержания и критерии оценки результатов педагогического теста В теории педагогических измерений вопрос отбора содержания контрольно-измерительного материала является одним из самых важных, решение по которому напрямую влияет на качество контроля, его эффективность и результативность [2]. Определение формальных правил отбора контрольных заданий опирается на необходимость соответствия результатов отбора следующим требованиям, предъявляемым в целом к педагогическому тесту и его результатам. – Валидность. Под валидностью теста понимают характеристику, отражающую его способность получать результаты, соответствующие поставленной цели и обосновывающая адекватность принимаемых решений [3]. При этом выделяют три вида валидности педагогического теста: содержательная, критериальная и конструктная [4]. – Надежность. Под надежностью результатов диагностики часто понимается мера корреляции ее результатов по параллельным вариантам контрольно-измерительного материала. Однако следует рассматривать характеристику надежности как величину не абсолютную для выбранного педагогического теста, но как сильно зависящую от условий проведения диагностики подготовленности учащихся, а именно: гомогенность групп испытуемых, их уровень предметной подготовленности, а также многие другие факторы [5]. – Эффективность. Процедура диагностики уровня усвоения учебного материала тем эффективней, чем больше информации об уровне предметной подготовленности учащегося она позволяет получить при меньшем числе контрольных заданий. Эффективность процедуры диагностики можно оценить с точки зрения свойства дискриминативности контрольно-измерительного материала или его дифференцирующей способности. В качестве одного из возможных показателей дискриминативности теста может выступать дисперсия результатов диагностики. Иными словами, тот тест, результаты диагностики в соответствии с которым имеют большую дисперсию, считается более эффективным в сравнении с другим вариантом теста при прочих равных условиях [3]. В работах [6, 7], посвященных вопросам формирования контрольно-измерительного материала, выделяются основные принципы отбора содержания педагогического тестирования, среди которых в рамках настоящего исследования отметим следующие. – Значимость. Принцип значимости указывает на приоритетность включения в содержание контрольно-измерительного материала тех заданий, которые направлены на диагностику наиболее важных, ключевых элементов учебного материала. – Репрезентативность. Помимо приоритетного включения в содержание контрольно-измерительного материала элементов, отвечающих требованиям принципа значимости, важно, чтобы эти элементы позволяли наиболее полно оценить уровень предметной подготовки испытуемого. Иными словами диагностируемый учебный материал должен быть наиболее полно отражен в содержании теста. – Возрастающая трудность заданий. Кумулятивность знания, основанность трудных учебных элементов на более простых, в особенности в технических дисциплинах, требует проверки целостности знания испытуемых. Принцип равномерно возрастающей трудности заданий проистекает из зависимости тестового балла испытуемого от количества контрольных заданий и распределения тестовых баллов по трудностям заданий [1, 3]. – Вариативность. Изменение содержания обучения, равно как и изменение характеристик испытуемых, влечет за собой необходимость соответствующего обновления содержания контрольно-измерительного материала. – Системность. Подбор содержания контрольно-измерительного материала должен отвечать требованиям системности элементов содержания обучения. Помимо подбора элементов теста с точки зрения системности их содержания, необходимо иметь среди них задания, связанные между собой общей смысловой структурой. На основе анализа требований к содержанию педагогического тестирования и принципам его отбора выделим следующие наиболее общие критерии оценки методов автоматизированного формирования контрольно-измерительного материала. – Надежность. Оценивается величиной корреляции результатов по параллельным вариантам контрольно-измерительного материала, а также на основе результатов расчетов по формуле Спирмена-Брауна [3] и значения коэффициента Кронбаха [3]. – Дискриминативность. В общем случае вариация тестовых баллов по каждому из контрольных заданий, входящих в состав контрольно-измерительного материала, оценивается величиной дисперсии результатов диагностики – Валидность. Сложность определения степени валидности контрольно-измерительного материала, является основной причиной того, что в подавляющем числе случаев эта аналитическая задача выполняется экспертом. В рамках настоящей работы акцент при определении валидности будет смещен в сторону оценки соотношения содержания контрольно-измерительного материала к семантико-логической структуре диагностируемых учебных элементов.
2. Обзор современных методов автоматизированного формирования контрольно-измерительного материала Современные методы диагностики, включающие в себя этапы формирования содержания контрольно-измерительных материалов, можно условно разделить на методы, относящиеся к классической теории педагогических измерений, и адаптивные методы, включая теорию «ItemResponseTheory» и метрическую систему «Rasch Measurement». Ключевым различием этих дух подходов, с точки зрения настоящей работы, является то, что в отличие от традиционной педагогической теории конкретное содержание контрольно-измерительного материала в случае теории адаптивного тестирования не известно в начале процедуры диагностики и варьируется в ее процессе в зависимости от ответов испытуемого. Популярность адаптивных методов объясняется возможностью оптимизации задачи диагностики посредством использования заданий, соответствующих по сложности уровню подготовленности испытуемого, что позволит повысить точность измерений и снизить время контроля. В силу удобства реализации адаптивных методов на основе современных информационных технологий, в настоящее время методы адаптивной диагностики уровня усвоения учебного материала все чаще используются в рамках информационно-образовательных систем, обеспечивающих управление процессом дистанционного обучения. Однако, несмотря на высокую популярность сегодня адаптивных методов, не вполне верным является распространенное мнение о тотальном преимуществе адаптивных методов над методами, разработанными в соответствии с классической теорией педагогических измерений [2, 8]. Фиксированность содержания контрольно-измерительного материала, сформированного в соответствии с классической теорией педагогических измерений, позволяет использовать его в целях установления целевого уровня усвоения учебного материала. В этом случае контрольно-измерительный материал может выступать в роли некоего ориентира, позволяющего учащемуся самому оценить соотношение его уровня владения учебными элементами с максимально возможным уровнем. Соответственно, имея фиксированный контрольно-измерительный материал, возможно проводить анализ результатов диагностики всех учащихся, получая информацию об уровне достаточности или недостаточности изученности учебных элементов применительно к отдельно взятым индивидуальным траекториям обучения. Обзор и анализ существующих методов формирования контрольно-измерительного материла с точки зрения эффективности их применения в решении задачи диагностики уровня усвоения отдельного учебного элемента, позволяют сделать выводы о неполном соответствии рассматриваемых методов требованиям, выдвигаемым со стороны теории педагогических измерений. По характеру несоответствия проанализированных методов указанным выше требованиям и принципам отбора содержания контрольно-измерительного материала можно говорить о недостаточном использовании возможностей анализа содержания и результатов обучения. Также следует отметить недостаточную гибкость методов автоматизированного формирования контрольно-измерительного материала, построенных в соответствии с классическими подходами теории педагогических измерений. В случае автоматизированных методов формирования содержания тестирования, относящихся к классу адаптивных, также необходимо заметить контекстную отстраненность параметров, на основе значений которых производится выбор последующего контрольного задания, от семантико-логической структуры содержания и результатов обучения. Исходя из результатов проведенных обзора и анализа существующих методов автоматизированного формирования контрольно-измерительного материала, обоснованной является необходимость разработки метода автоматизированного формирования контрольно-измерительного материала, позволяющего преодолеть указанные недостатки существующих методов.
3. Разработка метода автоматизированного формирования контрольно-измерительного материала По результатам анализа характера несоответствия существующих методов автоматизированного формирования контрольно-измерительного материала предъявляемым к ним требованиям выдвинем следующую гипотезу: использование результатов семантико-логического анализа учебно-образовательной информации, а именно численной оценки уровня взаимозначимости учебных элементов, в методах автоматизированного формирования содержания контрольно-измерительного материала, позволит повысить показатели валидности, надежности и эффективности результатов диагностики, выполняемой на их основе. В соответствии с выдвинутой гипотезой рассмотрим семантико-логическую структуру учебно-образовательной информации, представляемой посредством интегративной модели, описанной в работе [9]. На рисунке 1 приведен пример произвольного фрагмента структуры содержания обучения, где
Рисунок 1 — Произвольный фрагмент структуры содержания обучения
Тогда согласно разработанному методу автоматизированное формирование контрольно-измерительного материала для проведения процедуры входной диагностики целевого учебного элемента включает в себя следующие шаги. 1) Выбор целевого учебного элемента 2) Определение глубины 3) Анализ семантико-логической структуры учебного материала относительно целевого учебного элемента на основе определенных ранее параметров; формирование конечного массива учебных элементов 4) На основе предлагаемого автором в работе [10] метода, определение числовой оценки степени взаимозависимости учебных элементов — величин 5) Кластеризация контрольных заданий на основе анализа результатов диагностики уровня усвоения учебных элементов 6) Установление функциональных зависимостей взаимозначимости учебных элементов и весов групп контрольных заданий в соответствии с их сложностями на основе предлагаемой модели
где
Настройка функциональных зависимостей настоящей модели, наряду со значениями взаимозависимостями учебных элементов
Рисунок 2 — Модель функциональных зависимостей взаимозначимости учебных элементов и весов групп контрольных заданий в соответствии с их сложностями. Приведен пример для
7) На основе полученных числовых значений степени взаимозависимости учебных элементов
Матрица весов групп контрольных заданий для
8) Формирование контрольно-измерительного материала с фиксированным содержанием. Определение числа контрольных заданий
Для примера, приведенного в предыдущем шаге, матрица
9) На основе информации, содержащейся в строке матрице
Рисунок 3 — Диаграмма распределения заданий в контрольно-измерительном материале
Создание и использование в учебном процессе программных средств, разработанных в соответствии с предлагаемым методом, позволит решать такие задачи, как формирование конечного содержания контрольно-измерительного материала, кластеризация контрольных заданий на основе анализа результатов обучения. Применение рассматриваемого метода позволит при формировании контрольно-измерительного материала автоматически определять соотношение таких параметров контрольных заданий, как тема, число и сложность.
Выводы Научная новизна предлагаемого в настоящей статье метода заключается в следующем. Формирование контрольно-измерительного объективированного на основе параметра, автоматически определяемого в ходе совместного анализа результатов обучения и семантико-логической структуры учебного материала — числовой оценки уровня взаимозначимости учебных элементов, входящих в состав контрольно-измерительного материала. Использование автоматизированной кластеризации массива контрольных заданий на основе анализа результатов обучения. Применение модели настраиваемых функциональных зависимостей взаимозначимости учебных элементов и весов групп контрольных заданий в соответствии с их сложностями. Подобный подход позволил повысить степень автоматизации процедуры формирования контрольно-измерительного материала. При этом, опираясь на объективированные показатели, автоматически получаемые в ходе анализа содержания и результатов обучения, педагог-эксперт имеет возможность настраивать правила выборки контрольных заданий. Экспериментальные исследования программных решений, реализованных в соответствии с разработанным методом, позволили определить следующие значения показатели надежности и дискриминативности: – среднее значение точечно-бисериальной корреляции результатов по каждому отдельному заданию и результатов по контрольно-измерительному материала – значения коэффициентов Кронбаха, Спирмена-Брауна, а также значения, получаемые по формуле KR-20 (F. Kuderи M. Richardson) в ходе экспериментов не опускались ниже значения Полученные результаты экспериментальных исследований разработанного приложения на базе предлагаемого метода автоматизированного формирования контрольно-измерительного материала на основе числовой оценки степени взаимозависимости учебных элементов позволяют судить о достоверности выдвинутой авторами гипотезы. Значения показателей надежности и дискриминативности контрольно-измерительных материалов, сформированных в соответствии с разработанным методом, позволяют сделать вывод о повышении степени автоматизации процедур диагностики совместно с соответствием их результатов требованиям теории педагогических измерений. Разработанный метод, равно как и его отдельные составляющие, могут быть использованы при решении задач формирования контрольно-измерительного материала в рамках классической и адаптивной теорий педагогических измерений.
Список литературы 1. Аванесов В.С. Тест как педагогическая система // Педагогические измерения. 2007. № 1. С. 33-55. 2. Аванесов В.С. Содержание теста и тестовых заданий. Статья вторая // Педагогические измерения. 2007. № 3. С. 3-36. 3. Ким В.С. Тестирование учебных достижений. Монография. Уссурийск: Издательство УГПИ, 2007. 214 с. 4. Майоров А.Н. Теория и практика создания тестов для системы образования. М.: «Интеллект-центр», 2001. 296 с. 5. Аванесов В.С. Композиция тестовых заданий. Учебная книга для преподавателей вузов, техникумов и училищ, учителей школ, гимназий и лицеев, для студентов и аспирантов педагогических вузов. М.: Центр тестирования, 2002. 240 с. 6. Прокофьева Н.О. Вопросы организации компьютерного контроля знаний // EducationalTechnology & Society (Международный электронный журнал). 2006. № 9 (1). С. 433-440. Режим доступа: http://ifets.ieee.org/russian/depository/v9_i1/pdf/6.pdf (дата обращения: 01.12.2012). 7. Карпенко А.П., Домников А.С., Белоус В.В. Тестовый метод контроля качества обучения и критерии качества образовательных тестов. Обзор // Наука и образование. МГТУ им. Н.Э. Баумана. Электрон. журн. 2011. № 4. Режим доступа: http://technomag.edu.ru/doc/184741.html (дата обращения: 01.12.2012). 8. Wright B.D., Stone M.H. Best Test Design. Chicago: MesaPress, 1979. 219 p. 9. Макаров А.В., Ан А.Ф. Концептуальные основы проектирования информационно-образовательной среды непрерывного физического образования // Современные проблемы науки и образования. 2011. № 6. Режим доступа: www.science-education.ru/100-5211 (дата обращения: 05.06.2012). 10. Макаров А.В., Макаров К.В. Подходы к проектированию метода числовой оценки степени взаимозависимости учебных элементов на основе модели персептрона // Алгоритмы, методы и системы обработки данных. 2012. № 21. Режим доступа: http://amisod.ru/index.php?option=com_content&view=article&id=150:amisod-2012-3-21-makarov-makarov&catid=21:amisod-2012-3-21 (дата обращения: 01.12.2012). Публикации с ключевыми словами: семантико-логические взаимосвязи, метод формирования контрольно-измерительного материала, взаимозначимость учебных элементов, модель функциональных зависимостей Публикации со словами: семантико-логические взаимосвязи, метод формирования контрольно-измерительного материала, взаимозначимость учебных элементов, модель функциональных зависимостей Смотри также: Тематические рубрики: Поделиться:
|
|
||||||||||||||||||||||||||||||||
|