Другие журналы

научное издание МГТУ им. Н.Э. Баумана

НАУКА и ОБРАЗОВАНИЕ

Издатель ФГБОУ ВПО "МГТУ им. Н.Э. Баумана". Эл № ФС 77 - 48211.  ISSN 1994-0408

ПРОГНОЗИРОВАНИЕ ЭЛЕКТРОПОТРЕБЛЕНИЯ С ПОМОЩЬЮ НЕЙРО-НЕЧЕТКОЙ СИСТЕМЫ ANFIS. АЛГОРИТМ ОТБОРА ВХОДНЫХ ПЕРЕМЕННЫХ.

#7 июль 2006

Выбор входных переменных

ПРОГНОЗИРОВАНИЕ ЭЛЕКТРОПОТРЕБЛЕНИЯ С ПОМОЩЬЮ НЕЙРО-НЕЧЕТКОЙ СИСТЕМЫ ANFIS. АЛГОРИТМ ОТБОРА ВХОДНЫХ ПЕРЕМЕННЫХ.

И.Ю. Петрова1, А.А. Глебов2.

1. Проректор по информатизации и инновациям Астраханского Государственного университета, д.т.н, профессор.

2. Филиал ОАО «СО-ЦДУ ЕЭС» Астраханское РДУ, гл. специалист СЭПАК. Аспирант Астраханского Государственного Университета.

E-mail: glebov@rduastra.so-cdu.ru.

 

Аннотация. В статье рассмотрены два вида обучающих выборок для нейро-нечеткой сети типа Сугэно. Сформулирована проблема отбора входных параметров сети. Рассмотрены алгоритмы отбора входных параметров методом последовательного поиска вперед, модифицированным методом последовательного поиска вперед и методом на основе таблиц корреляции. Предложено модифицировать алгоритм последовательного поиска вперед,  что позволило снизить ошибку прогноза. Приведены результаты тестирования алгоритмов на двух видах обучающих выборок.

 

 

Прогнозирование режимных параметров и технико-экономических показателей  является одной из важных задач, как при планировании, так и при ведении текущих режимов электроэнергетической системы (ЭЭС). Изменение электропотребления – это сложный процесс, зависящий от множества факторов и имеющий вероятностную составляющую. В последнее время получили большое развитие методы прогнозирования с помощью гибридных систем, в основе которых лежат нечеткая логика, нейронные сети, генетический алгоритм и другие новые информационные технологии. В качестве предиктора была выбрана модель прогнозирования с помощью нейро-нечетких систем.

Для применения в качестве   нейронного эмулятора объекта была выбрана гибридная технология адаптивной нейро-нечеткой системы заключений (Adaptive-Network-Based Fuzzy Inference System -ANFIS), обладающая, по сравнению с другими методами, высокой скоростью обучения, простотой алгоритма и оптимальной проработанностью программного обеспечения в системе математического моделирования MatLAB и показывающая более точные результаты прогнозирования во многих областях науки и производства, в том числе ив энергетике.

При выборе представления данных для их использования в сети необходимо иметь в виду два принципа (аспекта) - количество переменных (определяет размерность данных) и содержательность данных (содержание информации, которую необходимо получить с помощью сети). Из соображений сложности и скорости обработки часто бывает необходимо минимизировать количество переменных (входных и выходных) с которыми будет работать сеть. Проблемы также могут быть связаны с разрешением предъявляемых данных: чем выше разрешение, тем сложнее должна быть сеть и, следовательно, возрастает время тренировки и количество данных, необходимых для тренировки. Это приводит нас ко второму аспекту представления тренировочных данных - ясность, содержательность. При ограничении количества входных переменных, возникает необходимость обеспечить, чтобы используемые переменные содержали информацию, достаточную для того, чтобы обеспечить обучение сети.

Анализ зарубежных и отечественных источников литературы по прогнозированию электропотребления с помощью искусственных нейронных сетей и нейро-нечетких систем [3,4,5,6,7,8,9] показал, что наиболее часто берутся две выборки в качестве входов сети.

Выборка 1. Входными переменными являются почасовые значения нагрузки Pi (i = 1, ... , 48) для двух суток, предшествующих прогнозируемым (48 значений) или 96 значений, если учитывать получасовые значения нагрузки. Кроме значений нагрузки в выборку входят значения переменной дня недели, часа прогноза, прогноза максимальной и минимальной температуры [55].

Выборка 2. Входными переменными являются почасовые значения нагрузки Pi (i = 1, ... , 48) для суток, предшествующих прогнозируемым (24 значения), и для суток недельной давности (24 значения).

При обучении сети соответствующим образом учитываются рабочие, выходные и праздничные дни. Так, для рабочих дней, в качестве входных переменных используются ретроспективные значения почасовых нагрузок только рабочих дней. Для понедельника в качестве переменных предыдущего дня берутся значения нагрузки за последнюю пятницу, поскольку она является его предыдущим рабочим днем. Для выходных, праздничных дней, рабочих суббот и т.п. с целью приближения периода обучения к настоящему моменту времени обучение, дообучение и прогнозирование предложено проводить на значениях нагрузки всех дней недели, но с той особенностью, что при переходе с рабочего дня на выходной или наоборот вводится псевдо-выходной или псевдорабочий день в качестве предыдущего прогнозируемому дня. Почасовые значения нагрузки этого дня рассчитываются по средним почасовым коэффициентам соотношения нагрузки рабочего дня к выходному (или наоборот) за некоторый промежуток времени (например, за четыре предыдущих недели) [9].

Проведенный анализ и результаты тестирования показали, что результат прогноза зависит от того, какие и сколько независимых переменных используется, то есть от размерности данных и их содержательности. Увеличение размерности сети не всегда приводит к повышению точности прогноза, однако время прогноза при этом может увеличиваться до нескольких часов и даже суток, что не приемлемо для оперативного прогноза. Некоторые результаты тестов приведены в таблицах 1,2,3.

 

 

 

 

Таблица 1

 

Дата

Кол-во входов

Факт

Прогноз

Ошибка (%)

Время обучения (с)

Входы

25.02.2006 12:00

4

510.61

506.3057

 

0.84298

 

23.69137

2,29,43,51

25.02.2006 12:00

5

510.61

515.0795

 

0.87533

 

67.79538

2,20,29,43,51

 

25.02.2006 12:00

6

510.61

510.6701

0.01177

296.6421

2,18,20,29,43,51

25.02.2006 12:00

7

510.61

514.8721

0.8347

1650.661

2,18,20,29,43,48,51

 

 

Таблица 2

Дата

Кол-во входов

Факт

Прогноз

Ошибка (%)

Время обучения (с)

Входы

25.05.2006 00:00

4

309.47

308.38

 

0.353

 

11.33

2,19,25,51

25.05.2006 00:00

5

309.47

310.49

 

0.33

 

78.75

1,2,19,28,51

 

25.05.2006 00:00

6

309.47

310.3

0.2686

1101.9

1,2,19,28,50, 51

25.05.2006 00:00

7

309.47

311.3

0.591

1552.1

1,2,19,28,42, 50,51

 

Таблица 3

Дата

Кол-во входов

Факт

Прогноз

Ошибка (%)

Время обучения (с)

Входы

25.04.2006 00:00

4

319.78

315.57

 

1.3159

 

11.98

2,29,31,51

25.04.2006 00:00

5

319.78

314.55

 

1.63

 

85.146

2,4,29,31,51

25.04.2006 00:00

6

319.78

321.72

0.61

1130.1

2,4,29,31,35, 51

25.04.2006 00:00

7

319.78

348.29

8.91

1571.74

2,4,29,31,35, 53,51

 

Из приведенных таблиц можно выделить, что наименьшая погрешность прогноза и нормальное время расчета достигается при количестве входов равное шести. Однако, как видно из таблиц, состав входных параметров в каждом прогнозе с минимальной ошибкой отличается. То есть эксперту нужно будет каждый раз перед прогнозом провоить исследования влияния входных переменных на выходнуюи самому делать вывод по составу выброк. А это увеличить время оперативного прогноза. Для решения проблемы выбора входных переменных рассмотрим следующие три алгоритма:

·       метод последовательного поиска вперед;

·       модифицированный метод последовательного поиска вперед;

·       метод отбора переменных на основе таблиц корреляции.

Для выбора входных переменных модели рассмотрим эвристический подход, основанный на так называемом последовательном поиске вперед (sequential forward search) [1,2]. При таком поиске временной ряд входных переменных делятся на тренировочную и тестовую выборки. На каждом шаге в модель добавляется одна входная переменная, обеспечивающая минимальное значение среднеквадратической ошибки на тренировочной выборке. Указанная поисковая процедура реализована функцией seqsrch  в системе Matlab.

Однако, как видно на рисунке 1, что уменьшение ошибки на тренировочной выборке (график красного цвета)  при добавлении в модель той или иной входной переменной не всегда ведет к уменьшению ошибки на тестовой выборке (график зеленого цвета) и, соответственно, при прогнозе.

Рис.1. Среднеквадратичная ошибка при последовательном поиске вперед.

 

Таким образом, на выходе данной функции мы можем получить массив переменных, выбранных с помощью функции seqsrch, который будет иметь минимальную ошибку на тренировочной выборке, но не оптимальную на тестовой, ошибка на которой является более важным показателем адекватности модели, так как данные из этой выборке неизвестны системе. Поэтому алгоритм отбора переменных был модифицирован тем, что в результате работы функции суммируются среднеквадратичные ошибки на тестовой и тренировочной выборке и на каждом шаге в модель добавляется одна входная переменная, обеспечивающая минимальное значение среднеквадратической ошибки на тренировочной и тестовой выборках. Это улучшение позволило снизить среднюю ошибку за сутки для суточного прогноза на  2 %  в среднем.

Третий способ отбора переменных для прогноза потребления, который использовался при тестировании, использует таблицу корреляции переменных и p уровень значимости коэффициента корреляции. Алгоритм заключается в следующем. Формируется матрица взаимной корреляции и матрица p-уровня значений корреляций. После этого отбираются из выборки те переменные, у которых значения корреляции максимальные и p-уровень меньше 0,05. Количество переменных определяется пользователем.  Результаты тестов трех алгоритмов отбора переменных приведены в таблице 4.

Таблица 4

 

Ср. квад. ошибка прогноза с помощью стандартной функцией seqsrch (%).

Ср. квад. ошибка прогноза с помощью улучш. алгоритма отбора переменных (%).

Ср. квад. ошибка прогноза с помощью таблицы корреляции (%).

Краткосрочный прогноз

7,01

5,21

5,47

 

В таблице 5 представлены результаты тестирования выборок № 1 и выборки № 2.

 

Таблица 5

 

Ср. квад. ошибка прогноза с выборкой № 1

 (%).

Ср. квад. ошибка прогноза с выборкой № 2 (%).

Краткосрочный прогноз

1,43

2,14

 

 

Заключение.

В результате анализа источников были выбраны два вида обучающих выборок, которые использовались для обучения сети. Для отбора значимых переменных был применен последовательный поиск вперед (sequential forward search). В результате исследований был модифицирован данный алгоритм, что привело к уменьшению ошибки прогноза.

По результатам тестирования можно определить вид выборки, который будут использоваться в модели краткосрочного прогнозирования, а так же методы отбора переменных из соответствующих выборок для прогноза.

 

 


Список литературы.

1.    С.Д.Штовба "Введение в теорию нечетких множеств и нечеткую логику". Сообщество пользователей Matlab и Simulink.  Режим доступа: http//matlab.exponenta.ru, свободный. – Заглавие с экрана. – Яз. рус.

2.    Сообщество пользователей Matlab и Simulink.  Режим доступа: http//matlab.exponenta.ru, свободный. – Заглавие с экрана. – Яз. рус.

3.    Ajith Abraham. Cerebral Quotient of Neuro Fuzzy Techiques –Hype or Hallelujan? Url: http://ajith.softcomputing.net.

4.    Шумилова Г.П., Готман Н.Э., Старцева Т.Б. Краткосрочное прогнозирование электрических нагрузок с использованием искусственных нейронных сетей // Электричество. 1999. № 10.

5.    Шумилова Г.П., Готман Н.Э., Старцева Т.Б. Краткосрочное прогнозирование электрических нагрузок с использованием методов искусственных нейронных сетей // Региональные энергетические исследования: 1953-1998 годы. Сыктывкар: Изд-во Коми НЦ УрО РАН,1999.

6.    Шумилова Г.П., Готман Н.Э., Старцева Т.Б. Модели прогнозирования нагрузок на основе аппарата искусственных нейронных сетей // Методические вопросы исследования надежности больших систем энергетики. Вып. 51. Сыктывкар: Изд-во Коми НЦ УрО РАН, 2000.

7.    Шумилова Г.П., Готман Н.Э., Старцева Т.Б. Модель суточного прогнозирования нагрузок ЭЭС с использованием нечетких нейронных сетей // Известия Академии наук. Энергетика.2001. № 4.

8.    Шумилова Г.П., Готман Н.Э., Старцева Т.Б. Прогнозирование электрических нагрузок ЭЭС с использованием методов искусственного интеллекта // РНСЭ, 10-14 сентября 2001: Материалы докладов. Казань: Казан. Гос. Энерг. ун-т, 2001 - Т. II.

  1. Шумилова Г.П., Готман Н.Э., Старцева Т.Б. Прогнозирование нагрузки ЭЭС на базе новых информационных технологий. Новые информационные технологии в задачах оперативного управления электроэнергетически-ми системами / Н.А.Манов, Ю.Я.Чукреев, М.И.Успенский и др. Екатеринбург: УрО РАН,2002. С.127-156.

 

Поделиться:
 
ПОИСК
 
elibrary crossref ulrichsweb neicon rusycon
 
ЮБИЛЕИ
ФОТОРЕПОРТАЖИ
 
СОБЫТИЯ
 
НОВОСТНАЯ ЛЕНТА



Авторы
Пресс-релизы
Библиотека
Конференции
Выставки
О проекте
Rambler's Top100
Телефон: +7 (915) 336-07-65 (строго: среда; пятница c 11-00 до 17-00)
  RSS
© 2003-2024 «Наука и образование»
Перепечатка материалов журнала без согласования с редакцией запрещена
 Тел.: +7 (915) 336-07-65 (строго: среда; пятница c 11-00 до 17-00)