Подход к масштабированию

В данном разделе описывается конкретный порядок действий, рекомендуемый для масштабирования компьютеров в среде; именно данный способ и использовался нами для масштабирования лабораторной среды. Этот подход позволяет найти оптимальную конфигурацию для рабочей нагрузки и описывается следующим образом.

Сначала мы выполнили горизонтальное масштабирование веб-серверов. Это было выполнено в максимально допустимом при тестовой рабочей нагрузке объеме, пока сервер базы данных не стал узким местом и уже не мог обрабатывать дополнительные запросы от веб-серверов. До этого момента базы данных контента и служб (база данных профилей, база данных социального контента и т. д.) находились на одном сервере. Когда мы обнаружили, что сервер баз данных стал узким местом, мы провели его масштабирование, переместив базы данных контента на другой сервер баз данных. На данном этапе веб-серверы не создавали достаточной нагрузки на серверы баз данных, поэтому было выполнено их масштабирование. В лабораторной среде мы не тестировали дальнейшее масштабирование. Однако если вам потребуются большие масштабы, следующим логическим шагом будет выделение двух компьютеров для выполнения функций сервера приложений.

Мы начали с минимальной конфигурации фермы, которая включала один интерфейсный веб-сервер, один сервер приложений и один компьютер с SQL Server. Спустя несколько итераций мы остановились на восьми интерфейсных веб-серверах, одном сервере приложений и двух серверах SQL Server в ферме. В разделе «Результаты и выводы» приводится сравнение характеристик производительности Зеленой зоны и Максимальной зоны для разных итераций. Сведения об определении этих зон на каждой итерации приведены в разделе «Приложение».

НЕ нашли? Не то? Что вы ищете?

Согласование лабораторной среды с производственной средой

Описанная в данном документе лабораторная среда представляет собой уменьшенную модель производственной среды корпорации Майкрософт, и хотя между этими двумя средами существуют значительные различия, может оказаться удобным исследовать их параллельно, поскольку обе они являются средами для личных сайтов и социальных сетей, а наблюдаемые в них шаблоны должны быть похожи.

Лабораторная среда содержит набор данных, который довольно подробно повторяет набор данных из производственной среды. Рабочая нагрузка, которая используется для тестирования, в большой степени аналогична нагрузке в производственной среде с некоторыми существенными отличиями.

Самое важное отличие относится к лабораторной среде. Здесь меньше отдельных пользователей, выполняющих операции, а сами операции выполняются с меньшим числом пользовательских профилей по сравнению с производственной средой. Кроме того, лабораторные тесты проходят за более короткое время.

Все это влияет на количество попаданий в кэш для кэша профилей пользователей на сервере приложений. Служба профилей пользователей кэширует недавно использованные профили пользователей на сервере приложений. Размер этого кэша по умолчанию составляет 256 МБ, что соответствует примерно 500 000 пользовательских профилей. Поскольку число пользовательских профилей, которые использовались во время тестирования, было ограничено до 1500, а продолжительность тестов была меньше времени очистки кэша, попадание в кэш происходило практически всегда. Таким образом, показатели пропускной способности в данном документе достаточно высоки. В реальной среде следует учитывать промахи в кэше и ожидать меньшей пропускной способности.

Подробное исследование портала личных сайтов и социальных сетей в производственной среде в Microsoft см. в статье Пример внедрения SharePoint 2010: социальная среда.

Замечания по тестированию

В этом документе представлены результаты, полученные в тестовой лабораторной среде. Поскольку это лабораторная, а не производственная среда, мы могли контролировать определенные факторы, чтобы продемонстрировать конкретные аспекты производительности для данной рабочей нагрузки. Кроме того, некоторые перечисленные ниже элементы производственной среды не были включены в лабораторную среду для упрощения тестирования. Имейте в виду, что в производственных средах исключать эти элементы не рекомендуется.

    Между тестовыми запусками мы изменяли только по одной переменной за раз, чтобы упростить сравнение полученных результатов. Серверы баз данных, которые использовались в данной лабораторной среде, не входили в кластер, поскольку избыточность для такого тестирования не требовалась.

Обход контента при поиске во время тестирования не выполнялся, хотя в производственной среде это возможно. Чтобы учесть это, мы снизили уровень использования ЦП на компьютере с SQL Server при определении Зеленой и Максимальной зон, чтобы выделить ресурсы, которые были бы использованы при обходе контента в процессе поиска.

Настройка тестовой среды

Оборудование

В таблице ниже приведены характеристики оборудования для компьютеров, использовавшихся в этом тестировании. Каждый интерфейсный веб-сервер, добавляемый в ферму на протяжении нескольких итераций тестирования, соответствует указанным характеристикам.

Интерфейсный веб-сервер

Сервер приложений

Сервер базы данных

Модель сервера

PE 2950

PE 2950

Dell PE 6850

Процессоры

2 четырехъядерных процессора с тактовой частотой 2,33 ГГц

2 четырехъядерных процессора с тактовой частотой 2,33 ГГц

4 четырехъядерных процессора с тактовой частотой 3,19 ГГц

ОЗУ

8 ГБ

8 ГБ

32 ГБ

Количество сетевых адаптеров

2

2

1

Скорость передачи данных сетевого адаптера

1 гигабит

1 гигабит

1 гигабит

Тип службы балансировки нагрузки

F5 — аппаратная балансировка нагрузки

Н/д

Н/д

Уровень ведения журнала ULS

Средняя

Средняя

Н/д


Таблица 1. Характеристики оборудования для серверов

Программное обеспечение

В таблице ниже перечислено программное обеспечение, установленное и запущенное на серверах, которые использовались при тестировании.

Интерфейсный веб-сервер

Сервер приложений

Сервер базы данных

Операционная система

Windows Server® 2008 R2 x64

Windows Server 2008 R2 x64

Windows Server 2008 x64

Версия программного обеспечения

Microsoft SharePoint 4763.1000 (RTM), Office Web Applications 4763.1000 (RTM)

Microsoft SharePoint 4763.1000 (RTM), WAC 4763.1000 (RTM)

SQL Server 2008 R2 CTP3

Тип службы балансировки нагрузки

F5 — аппаратная балансировка нагрузки

Н/д

Н/д

Уровень ведения журнала ULS

Средняя

Средняя

Н/д

Параметры антивируса

Отключено

Отключено

Отключено


Таблица 2. Характеристики программного обеспечения для серверов

Топология и конфигурация

На приведенной ниже схеме топологии показана настройка оборудования, которое использовалось при тестировании.

Схема 1. Конфигурация фермы

На схеме 1 приведены службы, работающие в тестовой среде.

Архитектура набора данных и диска

В тестовой ферме 166,5 ГБ занимали личные сайты (всего 10 баз данных контента одинакового размера), 27,7 ГБ — база данных профилей, 3,7 ГБ — база данных социального контента (идентификаторы GUID для социальных тегов, заметок и рейтингов) и 0,14 ГБ — база данных управления метаданными (текст социальных тегов и соответствующие идентификаторы GUID).

В таблице ниже приведено подробное описание набора данных.

Число профилей пользователей

Примерно 150 000

Среднее число отношений участия на пользователя

74

Среднее число прямых отчетов на пользователя

6

Среднее число коллег на пользователя

28

Число всех свойств профиля

101

Число многозначных свойств

21

Число аудиторий

130

Число личных сайтов

Примерно 10 000

Число сайтов блогов

~600

Общее число событий в веб-канале активности

798 000*

Число социальных тегов и рейтингов

5,04 млн.**


Таблица 3. Подробное описание набора данных

* Исследование социальных тегов, проведенное на портале del. icio. us, говорит, что активный пользователь создает 4,2 тега в месяц. (Под созданием тегов в данном исследовании подразумевается любое назначение метаданных URL-адресам. Сюда относятся теги ключевых слов, рейтинги и заметки.) Это означает, что активный пользователь создает 4,2 тега/30 дней = 0,14 тегов/день. Если предположить, что теги создает одна треть пользователей социального портала, в день происходит 150 000 / 3 * 0,14 событий, связанных с тегами. Таблицы веб-каналов активности хранят действия в течении 14 дней, поэтому общее число событий, связанных с тегами, в таблице веб-каналов активности составляет 150 000 / 3 * 0,14 * 14. Если предположить, что активные пользователи создают одно дополнительное событие в день, например обновляют свойства профиля или состояния, мы получим 150 000 / 3 * 1 * 14 событий, добавляемых в таблицы веб-каналов активности. Таким образом, общее количество событий в таблицах веб-каналов активности достигает 150 000 / 3 * 1,14 * 14 = 798 000. Из них 98 000 событий связаны с тегами, что может привести к применению фильтрации по ролям безопасности; остальные события представляют собой обновления состояний и изменения свойств профилей в равных пропорциях.

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6