Чтение Official DSTs с помощью CRABа

Партнерка на США и Канаду по недвижимости, выплаты в крипто

30% recurring commission
Выплаты в USDT
Вывод каждую неделю
Комиссия до 5 лет за каждого referral

Чтение Official DSTs с помощью CRABа.

Александр Торопин, ИЯИ РАН

CRAB Home Page: войти в http://cms-project-ccs. web. cern. ch/cms-project-ccs/,

далее кликнуть ORCA (левая колонка на странице) и далее

кликнуть CRAB в строке “Related projects: ...., CRAB, ....”

Предполагается, что GRID Certificate уже получен.

Успешно запускаются задания только из environment RedHat 7.3.4 с ORCA_8_7_1 (SCRAM_ARCH = Linux__2.4). Попытки запустить аналогичным образом задания из SLC3 (SCRAM_ARCH = slc3_ia32_gcc323) успехом не увенчались.

Для чтения Official DSTs с помощью CRABа необходимо выполнить следующие действия:

● Войти в директорию, где есть Path to ORCA, например ~/ORCA_8_7_1/src/DST_test.

● Сделать инициализацию CRAB: source $CMS_PATH/ccs/ww/scripts/Crab/crab. csh. В директории появится файл 'crab. cfg'.

● Определить ORCA environment: 'eval `scram runtime - csh`'

● Скопировать в данную директорию требуемый для анализов '.orcarc' файл, например, 'Analysis. orcarc'.

● Создать стандартным способом при помощи команды 'scram b' library и executable файлы в соответствующих директориях ~/ORCA_8_7_1/lib и ~/ORCA/8_7_1/bin

● В 'crab. cfg' сделать изменения в соответствующих строках:

dataset = hg03b_zz_2l2nu

owner = hg_DST871_2x1033PU_g133_CMS

executable = Analysis

orcarc_file = Analysis. orcarc

output_file = MyData. root

first_event = 0

total_number_of_events = 10000

job_number_of_events = 500

Здесь предполагается, что Analysis является именем executable file, и выходная информация будут писаться в файл MyData. root.

НЕ нашли? Не то? Что вы ищете?

total_number_of_events лучше задавать > job_number_of_events * number_of_jobs.

dataset и owner здесь соответствуют DST для процесса zz -> 2l2nu. Эти DST

находятся на site PIC, который откликается практически всегда, его можно

использовать для тестов работоспособности данной системы.

● Создать задания для CRABа: 'crab. py - create 10'. Т. е. создали 10 заданий по 500 events/job, согласно предыдущему определению. В данной директории создалась поддиректория crab_0_<date>_<time>. Здесь <date> и <time> являются реальными числами, которые CRAB определяет сам.

● Поскольку на тех sites, где будет вестись обработка событий, computers могут быть с SLC3, а не с RedHat 7.3.4, нужно приготовить такие же library и executable файлы на машине с SLC3, задав на ней соответственно 'setenv SCRAM_ARCH slc3_ia32_gcc323', сделать 'eval `scram runtime - csh`' и 'scram b'. При этом подразумевается, что результаты предыдущей компиляции на RedHat 7.3.4, будут сохранены.

● Далее нужно приготовить свой tarball 'default. tgz' следующим образом:

Cоздать поддиректорию test.

В test создать поддиректории bin и lib.

В bin и lib соответственно создать поддиректории Linux__2.4 и slc_ia32_gcc323

Поместить в эти поддиректории соответствующие library и executable файлы

приготовленные предварительно для Linux__2.4 и slc3_ia32_gcc323.

Получится следующая структура

test/bin/Linux_2.4/Analysis

/slc_ia32_gcc323/Analysis

test/lib/Linux__2.4/libMyAnalysis. so

/slc_ia32_gcc232/libMyAnalysis. so

Далее запустить команду 'tar - czvf default. tgz *' в директории test.

Файл default. tgz лучше поместить куда-нибудь в корневую директорию

(cp default. tgz ~/.), т. к. его не нужно создавать каждый раз для данного

sample of events.

Удалить директорию test.

● Заменить созданный CRAB'ом default. tgz на приготовленный в предыдущем пункте файл 'cp ~/default. tgz crab_0_<time>_<date>/share/.'

● Запустить задания: 'crab. py - submit 10 - continue'.

● Посмотреть состояние заданий можно следующим образом:

edg-job-status - i crab_0_<date>_<time>/log/submission_id. log

● Удобно запустить команду 'crab. py - mon noprint - continue', которая по окончании каждого задания сделает извлечение полученной информацию в директорию crab_0_<date>_<time>/res

● Вместо этой команды можно извлекать информацию руками после окончания соответствующего задания

edg-job-get-output - i crab_0_<date>_<time>/log/submission_id. log

● Списки всех опубликованных DST можно посмотреть на site

http://cmsdoc. cern. ch/cms/production/www/PubDB/GetPublishedCollectionInfoFromRefDB. php

Site FNAL, где находятся, например, DST фонового процесса ttbar->leptonic, удается использовать только по утрам в выходные дни. Имеется в виду процесс

## FNAL

dataset = jm03b_TTbar_leptonic

owner = jm_DST871_2x1033PU_g133_OSC

Для счета запускались пакеты в 5 заданиях по 20 jobs в каждом задании и по 1000 events/job. Т. е. за один заход обрабатывалось по 100000 events. Все задания в одном заходе обрабатывались за ~2.5 часа (астрономического времени, не CPU). Практически ~957000 events были обработаны за 3 Weekend'а. По-видимому это можно сделать быстрее, т. к. убыстрять этот процесс не было необходимости, поскольку это происходило параллельно с другой работой. Получить такое количество событий без применения DST не представляется возможным за разумное время.

Последний раз (для контроля) попытка работы с этим site была предпринята 31.08.2005 (Wednesday). Были запущены 2 задания по 100 events/job. Они простояли в состоянии Scheduled 12 часов (default time for GRID window) и были завершены с состоянием Aborted. Те же задания были запущены 3.09.2005 (Saturday), стартовали практически сразу и завершились нормально.

Задания, запущенные на site PIC без замены tarball'а default. tgz, также заканчивались неудачей, т. к. система не могла найти соответствующий executable.

Для DST, находящихся в CERNе, эта процедура с CRAB не срабатывает, хотя все должно быть симметрично.

На некоторых sites, например IN2P3, проходили очень небольшие задания

(10 events/job), но не удавалось запускать задания с разумным числом events/job.

В этой заметке описано состояние с CRAB на текущий момент. Видно, что ситуация меняется по мере развития CRABа и описанная здесь процедура может достаточно быстро устареть.

Правила пользования Сайтом
Правила публикации материалов
Политика конфиденциальности и обработки персональных данных

При перепечатке материалов ссылка на pandia.org обязательна.
Минимальная ширина экрана монитора для комфортного просмотра сайта: 1200 пикселей.
Сайт не содержит автоматически сгенерированных данных и не принимает подобные материалы.

Мы признательны за найденные неточности в материалах, опечатки, некорректное отображение элементов на странице - отправляйте на [email protected]

Партнерка на США и Канаду по недвижимости, выплаты в крипто

Домашний очаг

Справочная информация

Техника

Общество

Образование и наука

Мир

Бизнес и финансы