Текущее состояние проекта "Дубна-Грид"
1. Аппаратные ресурсы.
Практически все задейсвованные аппаратные ресурсы расположены
в данный момент в Университете и школах г. Дубны.
Сеть.
- Канал 100 Мбит/сек ОИЯИ Университет.
- Каналы 100 Мбит/сек Университет школы.
- Мосты и шлюзы в Университете и структуре городской сети.
Серверы и вспомогательное оборудование.
- Основной сервер - принадлежит ЛИТ ОИЯИ, расположен в Университете.
- Программный мост (bridge) для разделения сетей проекта "Дубна-Грид",
школ и классов Университета - принадлежит ЛИТ ОИЯИ, расположен
в Университете.
- 20-40 счетных узлов - расположены в 2-х классах Университета (407, 39) и в 11-ой школе, пренадлежат соответсвенно Университету и городской администрации (?).
2. Программное обеспечение.
Описывается только специфицеское программное обеспечение проекта
"Дубна-Грид", так как фактически нет никакой зависимости от ПО на физических
машинах для счетных узлов.
Базовое ПО.
- ОС - "Scientific Linux CERN", текущая версия - 304,
работает на серверах и виртуальных машинах счетных
узлов.
- Кластерное окружение - модифицированнй вариант "Warewulf
Cluster Toolkit", текущая версия - 2.2.3.
- ПО поддержки виртуальных машин - VMware, текущая версия
- 4.5.2.
- Для работы всех счетных узлов используется диапазон не рутируемых
адресов, не пересекающийся с адресами Университета и школ.
- Доступ от счетных узлов вовне производится через NAT на
основном сервере.
- Непосредственный доступ извне к счетным узлам и программному
мосту не возможен.
- Загрузка узлов - DHCP/PXE/BOOTP, встроенными в VMware, ОС, Warewulf средсвами.
- ПО счетных узлов загружается и работает в TMPFS, то
есть фактически в оперативной памяти виртуальной машины.
- На каждой виртуальной машине имеется постоянное дисковое
пространство (~8GB), для сохраняемых данных и дополнительного
ПО.
- Доступ к внешнему ПО и домашним директориям пользователей
осуществляется по AFS.
- Доступ к большим объемам внешней информации планируется
осуществлять через CASTOR и/или dCache, и средствами
Grid.
- ПО Grid в данный момент не установлено.
3. Анализ текущего состояния.
Имеются несколько не до конца решенных проблем.
- Доступ к ресурсам школ.
Административные проблемы успешно решены.
Проблема прямой маршрутизации от сервера к школьным
узлам будет решена после закупки оптического кабеля.
- Бесперебойная работа (24x7) всех счетных узлов.
Проблема в основном административного характера: как
предотвратить выключение узлов в Университете студентами.
Возможно, надо ввести порядок письменого отчета ответсвенных
за машины в классах по случаю каждой перезагрузки машины.
- Создание тестового комплекса в ОИЯИ.
В ближайшие дни в ЛИТ будут выводиться из эксплуатации в
составе ЦИВК несколько старых машин, возможно создание из
этих машин небольшого протопипа класса Университета, с
одновременном обеспечением рабочих мест с Windows для
студентов, временно прикомандированных сотрудников
сторонних организаций и других временных пользователей
ЛИТ.
- Надежная загрузка большого количества узлов одновременно.
Есть основания надеяться на улучшение этого параметра
системы при появлении новой версии Warewulf, beta версия
которой уже имеется у разработчиков Warewulf.
- Мониторинг всей системы проекта "Дубна-Грид".
На первом этапе можно сделать достаточно простой, но
информативный мониторинг счетных узлов с помощью пакета
"mon", с долговременным хранением истории работы системы и
с выдачей статистики в HTTP.
- Антивирус AVP во время сканирования дисков в физической
машине почти полностью останавливает работу виртуальной
машины. Обращения на фирму Касперского результатов не
дали. Попытки понизить ему приоритет приводят к еще
худшим результатам. Как мне кажется, единственным решением
может быть только полный отказ от этого ПО - антивируса
AVP. Видимо, это невозможно до конца года, пока не истечет
оплаченный контракт с фирмой (Ох! За что деньги платили!?)
06/04/2005 В. Мицын
|