Другие журналы
|
научное издание МГТУ им. Н.Э. БауманаНАУКА и ОБРАЗОВАНИЕИздатель ФГБОУ ВПО "МГТУ им. Н.Э. Баумана". Эл № ФС 77 - 48211. ISSN 1994-0408![]()
77-30569/270497 Алгоритм выбора архитектуры параллельной системы баз данных по критерию стоимости
# 12, декабрь 2011
Файл статьи:
![]() УДК 004.657 МГТУ им. Н.Э. Баумана Оценка стоимости параллельных систем базы данных Для тех проектов построения информационных систем, для которых важен экономический эффект, должна выбираться архитектура системы с минимальной совокупной стоимостью владения. Совокупная Стоимость Владения (TCO - total cost of ownership ) - это методика расчета, созданная чтобы помочь потребителям и руководителям предприятий определить прямые и косвенные затраты и выгоды, связанные с любым компонентом компьютерных систем.[11] Также основной целью подсчета стоимости владения, кроме выявления избыточных статей расхода, является оценка возможности возврата вложенных в информационные технологии средств. В процессе анализа оценки совокупной стоимости владения (ССВ) архитектуры параллельных систем баз данных должны учитываться соответствующие затраты. В работе предлагается проводить оценку ССВ архитектуры на основании следующей формулы:
где
Детализируем значение стоимости эксплуатации комплекса
где
Детализируем значение стоимости обслуживания комплекса
где
На основе формул (2) и (3), можно переписать формулу совокупной стоимости (1) как
В расчетах стоимости оборудования необходимо учитывать специфику увеличения стоимости оборудования комплекса в зависимости от изменений технических характеристик. Ниже приводятся формулы для оценки стоимости ПСБД, состоящей их нескольких SMP-систем (рис. 1). На рис. 1 введены следующие обозначения:
Такая конфигурация позволяет исследовать следующие архитектуры: o SE (одна SMP-система), o СE (кластер SMP-систем), o SN (MPP-система с одним процессором в узле), Рис. 1. Общая схема комплекса, состоящего из нескольких SMP систем. Формулы для оценки стоимости ПСБД определяются особенностями зависимости стоимости системы от числа процессоров и числа дисков в дисковом массиве. На рис. 2 показана зависимость стоимости SMP-системы от числа процессоров. Рис. 2 Зависимость стоимости SMP-системы от числа процессоров. На рис. 3 показана зависимость стоимости RAID-массива от числа дисков [12]. Рис. 3. Зависимость стоимости RAID-массива от числа дисков. Допуская, что комплексы с различными архитектурами требуют одинаковые инженерные системы и одинаковую численность обслуживающего персонала, а также то, что системы имеют соизмеримые коэффициенты готовности систем, можно переписать формулу стоимости совокупного владения комплексом, оптимизировав ее для сравнения архитектур параллельных систем баз данных, следующим образом:
Для сравнительной оценки стоимости различных архитектур параллельных систем баз данных предлагается использовать оценку затрат ежемесячного ССВ комплекса на протяжении пяти лет без модернизации комплекса с выделением следующих компонентов ПСБД: SMP-узлов, системы хранения и коммутационной сети. Таким образом, оценку стоимости определяется по формуле:
где
Оценка ССВ в пересчете затрат на месяц позволяет рассчитать рентабельность системы и упрощает оценку построения систем по лизинговой схеме.
Алгоритм выбора архитектуры ПСБД Учитывая специфику сравнения архитектур ПСБД и особенности стоимостной оценки, предлагается использовать следующий алгоритм для выбора архитектуры ПСБД.
Шаг 1. Рассчитать число дисков в RAID-массиве. Расчёт числа дисков проводится по формуле (8)
где
Таблица 1 Значения коэффициента
Шаг 2. Оценить стоимость дискового массива На данном шаге проводится запрос стоимости конфигурации системы хранения данных у официальных дистрибуторов оборудования.
Шаг 3. Проанализировать запросы к хранилищу данных. Для каждого i-го запроса 1) определить количество измерений, по которым выполняется поиск ( 2) оценить число записей таблиц измерений в запросе ( 3) рассчитать среднее значение Эти данные занести в табл. 2 и назначить граничные значения для среднего времени выполнения этих запросов. Таблица 2 Сводная таблица параметров запросов с граничными значениями для среднего времени их выполнения
Шаг 4. Положить n=1 и nAMP=1 Это соответствует самой дешёвой конфигурации (одна SMP-система c одним процессором).
Шаг 5. Рассчитать среднее время выполнения запросов. Рассчитать среднее время (М) для всех запросов из табл. 2, используя соответствующие формулы [10]. Если для какого-либо запроса время его выполнения превышает граничное значение, то перейти к Шагу 6, иначе перейти к Шагу 8.
Шаг 6. Проверить nAMP. Если для текущего значения
Шаг 7. Увеличить число SMP-систем. Положить
Шаг 8. Полученная конфигурация является оптимальной (
Приведённый выше алгоритм путём последовательного наращивания В этой последовательности можно выделить подпоследовательность, в которой ПСБД упорядочены по убыванию среднего времени выполнения запросов. Действительно, для ПСБД с параметрами Так как в алгоритме последовательно анализируются все варианты ПСБД, то за конечное число итераций будет найдено оптимальное решение.
ЛИТЕРАТУРА 1. М. Тамер Оззу, Патрик Валдуриз. Распределенные и параллельные системы баз данных: [Электронный ресурс]. [http://citforum.ru/database/classics/distr_and_paral_sdb/]. Проверено 26.11.2010. 2. Соколинский Л. Б., Цымблер М. Л. Лекции по курсу "Параллельные системы баз данных”: [Электронный ресурс]. [http://pdbs.susu.ru/CourseManual.html]. Проверено 04.12.2010. 3. Григорьев Ю.А., Плужников В.Л. Оценка времени соединения таблиц в параллельной системе баз данных// Информатика и системы управления. – 2011. - № 1. – С. 3-16. 4. Лисянский К., Слободяников Д. СУБД Teradata® для ОС UNIX®: [Электронный ресурс]. [http://citforum.ru/database/kbd98/glava5.shtml]. Проверено 14.03.2011. 5. КузнецовС. Essential Modelling Options: [Электронныйресурс]. [http://citforum.ru/database/digest/dig_1612.shtml]. Проверено 14.03.2011. 6. Лев Левин. Teradata совершенствует хранилища данных: [Электронный ресурс]. [http://www.pcweek.ru/themes/detail.php?ID=71626]. Проверено 26.11.2010. 7. Григорьев Ю.А., Плутенко А.Д. Теоретические основы анализа процессов доступа к распределённым базам данных. - Новосибирск: Наука, 2002. – 180 с. 8. Миллер Р., Боксер Л. Последовательные и параллельные алгоритмы. Общий подход. – М.: БИНОМ. Лаборатория знаний, 2006. – 406 с. 9. Григорьев Ю.А., Плужников В.Л. Оценка времени соединения таблиц в параллельной системе баз данных// Информатика и системы управления. – 2011. - № 1. – С. 3-16. 10. Григорьев Ю.А., Плужников В.Л. анализ времени обработки запросов к хранилищу данных в параллельной системе баз данных // Информатика и системы управления. – 2011. - № 2. – С. 94-106. 11. П. Тарасенко Расчет и распределение затрат [Электронный ресурс]. [http://www.eg-online.ru/article/52214/] Проверено 23.10.2011. 12. John P. Desmond Infrastructure: storage resource management software and SAN architecture seen lowering TCO // Journal Software Magazine Volume 22 Issue 2, 2002 P. 19-20. 13. Штоян Д. Качественные свойства и оценки стохастических моделей. – М.: Мир, 1979. – 268 с. Публикации с ключевыми словами: преобразование Лапласа-Стилтьеса в параллельной системе базы данных, время обработки запросов, архитектура параллельной системы базы данных Публикации со словами: преобразование Лапласа-Стилтьеса в параллельной системе базы данных, время обработки запросов, архитектура параллельной системы базы данных Смотри также: Тематические рубрики: Поделиться:
|
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|