Другие журналы

научное издание МГТУ им. Н.Э. Баумана

НАУКА и ОБРАЗОВАНИЕ

Издатель ФГБОУ ВПО "МГТУ им. Н.Э. Баумана". Эл № ФС 77 - 48211.  ISSN 1994-0408

77-48211/630563 Комплекс инструментальных средств анализа моделей доступа к базам данных: назначение и обзор компонентов

# 08, август 2013
Файл статьи: Grigorev_P.pdf (268.86Кб)
авторы: Григорьев Ю. А., Плужникова О.

УДК 004.415.2.043

Россия, МГТУ им. Н.Э. Баумана

grigorev@iu5.bmstu.ru

 

Введение

 

На кафедре "Системы обработки информации и управления" МГТУ им. Н.Э. Баумана совместно с Амурским государственным университетом разработан  автоматизированный программный Комплекс инструментальных Средств Анализа Моделей доступа к базам данных (КСАМ) распределённых систем обработки данных. Он предназначен для проведения вычислительных экспериментов с целью анализа временных показателей проектируемых информационных систем (ИС). Среда разработки - PersonalOracle и Developer 2000. Комплекс запускается в среде виртуальной машины.

При создании ИС большое значение имеет анализ временных показателей. Особенность этих характеристик определяется тем, что даже опытному проектировщику ИС бывает очень трудно спрогнозировать их значения, так как временные показатели зависят, в основном, от решений, принимаемых на ранних этапах проектирования информационной системы, то есть от концептуальной схемы базы данных, спецификаций разрабатываемых программ, архитектуры будущей системы (комплекса технических средств, операционной системы, системы управления базой данных), от наполнения базы данных. Поэтому важно дать проектировщику, выполняющему разработку в среде СУБД, инструмент, позволяющий прогнозировать временные показатели ИС и выявлять потенциальные "узкие места" ИС на основе описаний проектных решений. Это особенно важно, если учесть, что основной язык (SQL) доступа к данным относится к классу непроцедурных языков. Неосторожное использование спецификаций этого языка может привести к существенному увеличению времени реакции проектируемой системы.

В настоящее время для оценки показателей  производительности  вычислительных систем используются системы массового обслуживания (СМО), которые не учитывают особенностей выполнения приложений; для них непросто получить исходные данные; трудно проверить выполнение предпосылок их использования. Тем более в этих моделях не учитывается механизм декомпозиции запросов к базе  данных на подзапросы  и особенности их обработки в узлах ИС; не учитываются также объемы данных промежуточных и результирующих таблиц базы данных, передаваемых по каналам связи.

В предлагаемом комплексе указанные проблемы решаются  путем использования  принципиально нового класса моделей анализа временных характеристик ИС, учитывающих механизмы оптимизации запросов к БД.

КСАМ включает взаимосвязанные подсистемы, обеспечивающие описание:

 

1)   концептуальной (инфологической) схемы базы данных ИС и наполнения базы данных (прогнозируемое число записей в таблицах и мощности атрибутов),

2)    запросов (SQL-операторов) и транзакций ИС, которые могут обращаться к другим транзакциям информационной системы,

3)   архитектуры ИС (топологии и характеристик узлов и сетей из реестров результатов тестов TPC и параметров сетей),

4)   распределения таблиц (с учетом тиражирования) и транзакций по узлам ИС,

5)   интенсивностей обращений рабочих станций к транзакциям.

 

На рис. 1 представлена реализованная в КСАМ схема организации связей между компонентами проектируемой информационной системы. Здесь сплошными стрелками показаны связи типа "обращение к", а пунктирные линии изображают связи типа "входят, размещаются в". Так запросы (операторы SQL) входят в состав транзакций (2), при выполнении которых операторы SQL обращаются к таблицам базы данных (1). Описания таблиц базы данных, запросов и транзакций образуют концептуальный проект (КП) ИС. При проектировании стремятся, чтобы концептуальный проект не зависел от реализации, то есть от архитектуры будущей ИС (комплекса технических средств, общесистемных пакетов и др.). После выбора КТС, ОС, СУБД выполняется распределение таблиц базы данных и транзакций по узлам информационной системы (стрелки 3, 4, 5, 6). Таблицы хранятся на серверах базы данных, а транзакции могут размещаться и выполняться на рабочих станциях, серверах приложений, серверах базы данных (хранимые процедуры). Стрелки  7, 8, 9 обозначают обращения транзакций к таблицам базы данных. Следует отметить, что серверы приложений могут отсутствовать или располагаться в тех же узлах, что и серверы базы данных.

 

 

Рис. 1. Схема организации связей между компонентами  ИС.

 

В рамках КСАМ созданы реестры с описанием параметров различных типов сетей, а также с результатами тестов, проведённых по спецификациям международной организации TransactionalProcessingPerformanceCouncil (ТРС) для разных серверов и суперсерверов (более 20 фирм: Sun, Compaq, HP, Digital, IBM и т. д.), СУБД (Oracle, Informix, Sybase, MSSQLServer и т. д.), сетевых ОС (различных версий UNIX, WindowsNT 4.0 и т. д.) и серверов приложений (Tuxedo, TopEnd и т. д.).

На основе описания параметров ИС комплекс анализирует характеристики производительности и выявляет "узкие места"  информационной системы. КСАМ рассчитывает для каждого варианта архитектуры следующие показатели:

 

1)   загрузки узлов (серверов и клиентов) и сетей, их составляющие по запросам и транзакциям,

2)   время выполнения транзакций и его составляющие по узлам, сетям, запросам и вызываемым транзакциям,

3)   время доступа из узлов к транзакциям, учитывающее время передачи входных и выходных данных от рабочих станций,

4)   число блоков, обрабатываемых при выполнении запросов SQL.

 

 Важно подчеркнуть, что проектирование распределённых систем обработки данных, как правило, выполняется в условиях большой неопределённости исходных данных. Поэтому описание параметров ИС и расчёты характеристик могут выполняться с использованием нечётких чисел. Ниже приводится краткое описание подсистем КСАМ.

 

1. Описание концептуальной схемы базы данных.

 

 

Рис. 2. Схема формы, используемой для описания схемы базы данных

 

Прямоугольник на рис. 2 (и на других рисунках) соответствует блоку. Блоки, обозначенные на рисунке прямоугольниками с тенью, отображаются в одном головном окне формы. Остальные блоки отображаются в отдельных окнах при нажатии той или иной кнопки головного окна. Жирная точка на стрелке обозначает кнопку типа "добавить" или "назначить".

Сначала проектировщик должен определить список разрабатываемых подсистем (предметных областей) и для каждой из них описать тезаурус (список реквизитов). Далее необходимо добавить список таблиц будущей базы данных и для каждой таблицы определить её схему (список атрибутов).  Для включения реквизита в схему таблицы его необходимо отметить в тезаурусе и нажать кнопку "добавить". После этого проектировщик может описать дополнительные свойства блоков головного окна формы, используемые в дальнейших расчётах характеристик производительности. Эти свойства перечислены на рис. 2 в прямоугольниках  без тени.

Если свойство отмечено буквами (н.ч.), то это означает, что его значение можно задавать в виде чёткого (т.е. обычного) или нечёткого числа. В КСАМ используется трапециевидная форма нечёткого числа. Нечёткие числа являются частным случаем нечетких множеств. Они часто используются для описания показателей, для которых трудно указать конкретное значение.

 

2. Описание запросов и транзакций.

 

 

Рис. 3. Схема формы, которая используется для описания запросов и транзакций.

 

Описание транзакций выполняется в следующей последовательности (рис. 3). Сначала определяются списки транзакций и запросов к БД (блоки 1 и 2). Затем описывается состав каждой транзакции (блок 3). Далее определяется список таблиц, связанных с каждым запросом к БД (блок 4). После этого проектировщик может описать дополнительные свойства блоков головного окна (прямоугольники без тени). Язык описания запросов к БД (SQL-операторов) внешне напоминает язык исчисления с переменными на доменах QBE (Query-By-Example) и не требует навыков в программировании.

 

3. Описание архитектуры проектируемой ИС.

 

С помощью КСАМ можно описать несколько вариантов архитектуры проектируемой ИС (рис. 4, блок 1). Для каждого варианта следует определить узлы (блок 2), сети (или каналы связи, блок 3), топологию ИС (блок 4) и некоторые дополнительные свойства.

 

 

Рис. 4. Схема формы, которая используется для описания архитектуры ИС.

 

В КСАМ на основе описаний результатов экспериментов, проведённых по спецификациям TPC-С, создан справочник (реестр) конфигураций узлов. Этот реестр включает более 100 конфигураций. С помощью кнопки "назначить" можно определить конфигурацию каждого узла ИС. В справочнике конфигураций сетей определены некоторые важные параметры локальных сетей и телекоммуникационных каналов связи, а также вариантов абонентского доступа. Этот справочник можно использовать для определения конфигурации каждой сети и канала связи, которые предполагается задействовать в проектируемой ИС.

С целью уменьшения объёма задаваемых исходных данных однотипные узлы (рабочие станции или серверы) можно объединять в группы. Изменяя долю заполнения диска сервера, проектировщик может исследовать влияние количества дисков, подключённых к серверу базы данных, на характеристики производительности ИС.

По условным длинам сетей КСАМ автоматически рассчитывает маршруты (виртуальные каналы) передачи данных между каждой парой узлов ИС. Проектировщик может вручную изменить описания маршрутов. Задание параметров пакетов и кадров, передаваемых по виртуальному каналу, позволяет учесть влияние заголовков на реальную производительность сети, а также проанализировать эффект "туннелирования" пакетов при их прохождении через разнородные сети (Ethernet, FDDI, X.25, FrameRelay, ATM и др.).

 

4. Распределение таблиц БД и транзакций по узлам ИС.

 

С помощью формы, схема которой представлена на рис. 5, проектировщик ИС выполняет распределение таблиц базы данных и транзакций по узлам системы (блоки 1 и 2). Узел, где хранятся таблицы БД, выступает в качестве сервера БД. А узел, где выполняются транзакции, является клиентом узла-сервера. При этом сервер и клиент могут размещаться в одном узле.

 

 

Рис. 5. Схема формы, которая используется для распределения таблиц БД и транзакций по узлам ИС.

 

Для каждой транзакции можно назначить свой узел-сервер. На этом сервере КСАМ выполняет декомпозицию запроса транзакции на подзапросы, моделирует их параллельную обработку и соединение результатов выполнения подзапросов.  Если требуемая таблица запроса не хранится в указанном узле-сервере, то соответствующий подзапрос будет выполняться на ближайшем сервере, где эта таблица располагается.

В КСАМ допускается размещение (дублирование) одной таблицы на разных узлах. Можно установить признак копии таблицы (только для чтения). При этом в каком-то другом узле должна храниться основная таблица. Если транзакция пытается обновить копию таблицы, то КСАМ автоматически перенаправляет запрос на обновление в ближайший узел с основной таблицей (моделируется запуск обновляющей процедуры по подписке). В КСАМ учитывается  распространение (тиражирование) изменений от узла с основной таблицей к узлам, где хранятся её копии.

 

5. Описание обращений к транзакциям из узлов.

 

С помощью этой формы (рис. 6) можно определить транзакции, к которым обращаются пользователи информационной системы (блок 1), и параметры этих обращений. Узлы-пользователи и узлы-клиенты, где выполняются вызываемые транзакции, могут совпадать или быть разными.

 

 

Рис. 6. Схема формы, которая используется для описания обращений к транзакциям из узлов

 

6. Описание обращений к транзакциям из транзакций.

 

Форма, схема которой представлена на рис. 7, может быть использована, чтобы определить транзакции, к которым обращаются другие транзакции (блок 1). Это важно, например, при моделировании технологий COM и CORBA, где один метод объекта может обращаться к другому методу. Эти методы могут выполняться на разных узлах ИС.

 

 

Рис. 7. Схема формы, которая используется для описания обращений к транзакциям из транзакций

 

7. Справочник конфигураций узлов.

 

В рамках КСАМ создан реестр с описанием результатов тестов, проведённых по спецификациям международной организации TransactionalProcessingPerformanceCouncil (ТРС) для разных серверов и суперсерверов (более 20 фирм: Sun, Compaq, HP, Digital, IBM и т. д.), СУБД (Oracle, Informix, Sybase, MSSQLServer и т. д.), сетевых ОС (различных версий UNIX, WindowsNT 4.0 и т. д.) и серверов приложений (Tuxedo, TopEnd и т. д.). Реестр постоянно пополняется. С помощью рассматриваемой формы (рис. 8) проектировщик может посмотреть характеристики конфигураций узлов, включённых в разработанный реестр, при необходимости модифицировать некоторые параметры требуемой конфигурации, включить в реестр новые описания. Данный справочник используется при описании архитектуры ИС (рис. 4).

 

 

Рис. 8. Схема формы, которая используется для ведения справочника конфигураций узлов.

 

8. Справочник конфигураций сетей.

 

 В рамках КСАМ создан реестр с описанием параметров различных типов сетей. С помощью рассматриваемой формы (рис. 9) можно посмотреть характеристики конфигураций сетей, включённых в разработанный реестр, при необходимости модифицировать некоторые параметры требуемой конфигурации, включить в реестр новые описания. Данный справочник используется при описании архитектуры ИС (рис. 4).

             

 

Рис. 9. Схема формы, которая используется для ведения справочника конфигураций сетей.

 

После обработки вариантов архитектуры, т.е. после выполнения требуемых расчётов, проектировщик с помощью рассматриваемых ниже форм может проанализировать характеристики производительности разрабатываемой системы.

 

Заключение

 

В статье приведены описания подсистем  программного Комплекса инструментальных Средств Анализа Моделей доступа к базам данных (КСАМ), предназначенного для проведения вычислительных экспериментов с целью анализа временных показателей распределённых систем обработки данных (РСОД), основу которых составляют распределённые базы данных и приложения, на этапе их проектирования и испытания.

КСАМ был использован при проектировании ряда информационных систем, а также применяется в учебном процессе на кафедре "Системы обработки информации и управления" МГТУ им. Н.Э. Баумана. Он используется студентами при выполнении курсовых работ по дисциплине "Структурное проектирование АСОИУ" [6].

 

Список литературы

 

1. Григорьев Ю.А. Программный комплекс анализа индексов производительности распределённых систем обработки данных // Наука и образование [Электронный ресурс]. - Электрон. журн. – М., 2012, № 2. – URL:http://technomag.edu.ru/doc/296095.html, свободный. -  (Дата обращения: 15.01.2012)

2. Липаев В.В. Системное проектирование сложных программных средств для информационных систем. - М.: СИНТЕГ, 1999. – 224 с.

3. Григорьев Ю.А., Плутенко А.Д. Жизненный цикл проектирования распределённых баз данных. - Благовещенск: Изд-во Амурского гос. ун-та, 1999. – 266 с.

4. Кузнецов С.Д. Стандарты языка реляционных баз данных SQL: краткий обзор // Системы управления базами данных (М.). - 1996. - № 2. - с. 6-36.

5. Герман О.В. Введение в теорию экспертных систем и обработку знаний. - Мн.: ДизайнПРО, 1995. – 255 с.

6. Григорьев Ю.А. Методические указания к выполнению курсовой работы по дисциплине "Структурное проектирование АСОИУ" //Сборник учебно-методических работ кафедры "Системы обработки информации и управления (бакалавры). Учебное пособие. Вып. 1 / Под ред. В.М. Чёрненького. М.: Изд-во ООО "АртКом", 2013, 280 с.


Тематические рубрики:
Поделиться:
 
ПОИСК
 
elibrary crossref ulrichsweb neicon rusycon
 
ЮБИЛЕИ
ФОТОРЕПОРТАЖИ
 
СОБЫТИЯ
 
НОВОСТНАЯ ЛЕНТА



Авторы
Пресс-релизы
Библиотека
Конференции
Выставки
О проекте
Rambler's Top100
Телефон: +7 (915) 336-07-65 (строго: среда; пятница c 11-00 до 17-00)
  RSS
© 2003-2024 «Наука и образование»
Перепечатка материалов журнала без согласования с редакцией запрещена
 Тел.: +7 (915) 336-07-65 (строго: среда; пятница c 11-00 до 17-00)