Запустите пакет Stata, нажав на кнопку .

pwd // узнать место расположение программной директории, в которой располагается пакет Stata. На экране появится похожая запись:

. pwd

E:\programs\Stata10

cd "E:\programs\Stata10\Me" // можно заменить программную директорию (по умолчанию) на Вашу с помощью команды cd (change directory), в кавычках указав целиком путь. Скажем, создав папку «Me». В такой папке можно хранить собственные файлы для быстрого доступа к ним и удобства сохранения результатов (массивов данных, графиков, летописей и пр.).

Некоторые полезные команды для начала и завершения работы в Stata:

capture log close //[1] закрыть предыдущую «летопись», если она была начата.

log using filename, replace text // начать новую летопись (filename, выделенное курсивом, предполагает, что Вы зададите свое название файла)

clear all // стереть все

Загрузите данные, например, через интерфейс или с помощью команды use filename.dta

save "filename.dta" // сохранить изменения в файле filename.dta в своей директории (в нашем случае – в папке «Me»)

log close // закрыть летопись

exit // выйти из Stata.

1)  Стандартизация данных

Результатом стандартизации данных является приведение значений переменной к такому виду, что среднее значение равно 0, а стандартное отклонение – 1 по следующей формуле:

.

summarize varname // получить описательные статистики.

В памяти пакета после команды summarize сохраняются последние результаты. Они хранятся в памяти как особого рода объекты, обращаться к которым можно через команду r(название объекта). Например,

НЕ нашли? Не то? Что вы ищете?

display r(mean) // показывает на экране среднее значение по выборке (команда display – это команда вывода на экран; команда r(mean) – это команда вызова среднего значения, сохраненного после запуска команды summarize.

display r(sd) // вывод на экран стандартного отклонениа

О том, какие еще статистики доступны, можно узнать, используя Справку:

help summarize

Для стандартизации значений переменной используется команда, реализующая указанную выше формулу:

generate varnameSN = (varname - r(mean))/r(sd) // , где varnameSN – любое Ваше название новой переменной. Так была создана новая переменная, которая имеет нулевое среднее и единичную стандартную ошибку.

Это утверждение можно проверить, получив описательные статистики новой переменной:

summarize varnameSN

2)  Приведение данных к унифицированным десятибалльным шкалам (от 0 до 10)

a)  В случае, когда большее значение показателя означает лучшее качество, используется формула

.

b)  В случае, когда большее значение показателя означает худшее качество, используется формула

c)  В случае, когда существует иное оптимальное (не минимальное или максимальное) значение показателя, используется формула

Команды в Stata будут следующими:

a)  В числителе , в знаменателе

summarize varname

generate newvarname = 10*(varname - r(min))/(r(max) - r(min))

summarize newvarname

b)   

summarize varname

generate newvarname2 = 10*(r(max) - varname)/(r(max) - r(min))

summarize new2varname

c)   

scalar a = 123 // обозначить через a оптимальное значение (в данном случае для примера считает, что оптимальное значение равно 123 – но это только пример; в Вашем случае это может быть другое число).

summarize varname

scalar b = r(max) – a // обозначить через b максимальное отклонение от оптимального значения

scalar c = r(min) – a // обозначить через c максимальное отклонение от оптимального значения

di b

di c // необходимо увидеть на экране полученные значения и выбрать из них наибольшее. Допустим, это b. Далее по указанной формуле (с):

generate newvarname3 = 10*(varname - a)/b

summarize newvarname3

После унификации всех переменных нулевое и десятибалльное значения соответствуют наихудшему и наилучшему качеству анализируемых показателей.

3)  Импортирование данных формата txt (текстового редактора «Блокнот»)

Например, нам необходимо открыть в Stata базу данных «Институты и выборы» (Regan, Clark): http://www. *****/jesda/mathbase/databases/db_13

clear all

insheet using "E:\docs\msa\filename.txt" // команда insheet импортирует файл filename. txt из указанной папки. Важно задать полный путь к массиву и указать расширение файла, а также избегать русскоязычных слов в указании пути.

insheet using filename.txt // команда insheet импортирует файл filename. txt из Вашей директории (оттуда, где лежит Stata).

insheet using filename.txt, names // опция names указывает пакету на то, что информацию в первой строке в массиве необходимо воспринимать как имена переменных

insheet using filename.txt, names delimiter(";") // опция delimiter указывает на то, каким образом было задано разделение столбцов/переменных. Последнее специфицируется в кавычках. Это могут быть точки, запятые и пр.

Если в ряду значений переменной встречаются нечисловые значения и пропуски, то пакет будет воспринимать переменную (весь ряд) как текстовую, а не количественную.

Это можно изменить следующим образом:

replace varname = "" if real(varname) == . // заменить на пропуски все нечисловые значения в переменной varname.

generate new = real(varname) // создать новую переменную new, скопировав все числовые значения старой с помощью команды real, аргументом которой будут значения переменной varname.

drop varname // удалить старую переменную varname.

rename new varname // переименовать переменную. После команды rename следует имя старой переменной (new), затем – новой (varname).

Подробнее можно узнать в справке (help insheet), а также по ссылке: http://www. /support/faqs/data/newexcel. html

4)  Импортирование данных формата sav (пакета SPSS)

clear all

findit usespss // найти пакет usespss.

Пройти по ссылке: usespss from http://fmwww. bc. edu/RePEc/bocode/u

Напротив INSTALLATION FILES кликнуть на (click here to install)

После завершения установки появится installation complete. Далее можно закрыть окно справки. Установленный пакет готов к использованию.

usespss using "E:\docs\msa\filename. sav" [, clear] // открыть файл в формате sav с указанием пути расположения файла.

usespss using filename [, clear] // открыть файл в формате sav из Вашей директории (оттуда, где лежит Stata).

desspss using filename [, clear] // получить описание файла.

save "filename.dta" // сохранить файл в формате dta

Подробнее можно узнать в справке (help usespss).

[1] Шрифтом courier new выделяются команды. Двойным слешем отделяются комментарии к командам, они набраны шрифтом Times New Roman.