Лекция 11 - Планиране на клинични изпитания и епидемиологични изследвания. Оценяване на големината на извадката. Рандомизация

Планиране:

-  определяне на целите на проучването;

-  дефиниране на популацията;

-  избиране на зависими променливи;

-  избиране на метод за набиране на подходяща случайна извадка;

-  избиране на подходящ дизайн;

-  разработване на план за статистически анализ;

-  оценяване на големината на извадката, необходима за тестване на основните хипотези или построяване на съответните доверителни интервали.

Oценяване големината на извадката

Основни понятия: Мощност (power) е вероятността за отхвърляне на нулевата хипотеза, когато конкретна проста алтернативна проста хипотеза е вярна.

Всяко оценяване на големината на извадката (или еквивалентно анализ на мощността – power analysis) има четири компонента: вероятност за грешка от първи тип (ниво на съгласие, type I error, significance level), мощност (или вероятност за грешка от втори тип, type II error), големина на ефекта (effect size) и големина на извадката (sample size). Всеки набор от кои да е три от тези компоненти еднозначно определят четвъртия. Обикновено нивото на съгласие, желаната мощност и желаната големина на ефекта са предварително определени, а се търси големината на извадката. Но понякога етични или други ограничения налагат да се фиксира максималната възможна големина на извадката и тогава мощността се определя от останалите три компонента и въз основа на тези изчисления се решава дали да се предприеме съответното проучване.

НЕ нашли? Не то? Что вы ищете?

1. Сравнение на средните на две независими групи чрез т-тест:

H0: m1= m2 срещу Hа: m1> m2

Колко големи извадки са ни необходими, за да отхвърлим H0 с 80% мощност при ниво на съгласие 5% и ако действителната стандартизирана разлика между двете средни е d=m/σ? Да допуснем, че знаем дисперсията (σ), че разпределенията са нормални и че размерите на двете извадки са еднакви.

Обща формула за двустранен тест:

Най-често използвани стойности:

Когато дисперсията е неизвестна, се използва t-разпределение.

Домашно: Имаме две групи мишки: едните получават плацебо, а другите селен. Искаме да намерим 0.16 mol/ml разлика в нивата на хормона GSH между двете групи. Средното и стандартното отклонение на контролната група са оценени от предишни опити на 0.88 и 0.4 mol/ml съответно.

А. Колко голяма извадка ни е необходима, за да намерим такава разлика между средните с 80% мощност при ниво на съгласие 5%?

Б. Как се променя отговора в Ар ако увеличим мощността на 90%?

В. Каква е мощността, ако извадките не могат да бъдат по-големи от 10 мишки във всяка група? Заслужава ли си да направим такъв експеримент?

Най-силно въздействащ компонент при оценяване на големината на извадката е големината на ефекта. В медицински изследвания това е най-малката разлика, която е клинично значима.

Коен (Cohen) предлага конвенция за малки (small), средни (medium) и големи (large) ефекти:

Примери:

- Разлика между две средни: стандартизирана разлика между средни

“small”: d = 0.20, “medium”: d = 0.50, “large”: d = 0.80.

- Разлика между пропорции:

“small”: 40% vs 50%, “medium”: 40% vs 65%, “large”: 40% vs 78%.

- Тестове на основни и интеракционни ефекти в дисперсионен анализ:

“small”: f = 0.10, “medium”: f = 0.25, “large”: f = 0.40 { }

Връзка между размер на ефекта и големина на извадката при т-тест за две независими групи:

2. Сравнение на средните на две зависими групи въз основа на сдвоен т-тест (paired t-test)

Обща формула за двустранен тест:

r – корелация между наблюденията в двете извадки

Домашно: Ако в примера от домашното по-горе може да използваме едни и същи мишки, т. е. дизайн с повторни наблюдения над всяка мишка, колко мишки са ни необходими, за да намерим същия размер на ефекта, със същата мощност при същото ниво на съгласие като в точка А? Направете изчисленията при корелация между повторни наблюдения над едни и въщи мишки от 0, 0.3, 0.5 и 0.8. Какво можете да заключите за ефективността на двата дизайна?

Важни похвати при планиране на експерименти:

Редуциране на дисперсията на данните:

-  хомогенна популация;

-  стратификация (пропорционален брой хора във всяка група на лечение за всеки слой, определен от различните фактори);

-  стабилни и прецизни зависими променливи;

-  прецизни инструменти и мерки;

- повторни наблюдения.

Рандомизацията е изключително важен компонент при клинични изпитания и други експерименти. Рандомизацията е начинът на определяне кой индивид какво лечение ще получи по случаен признак.

Тя трябва да осигури баланс както на леченията (приблизително еднакъв брой пациенти получават всяко лечение – balance of treatment assignments), така и на характеристиките на индивидите между различните лечения (covariate balance). В рандомизирани изследвания може да се правят изводи за причинно-следствени връзки.

Видове рандомизации:

-  стационарни и адаптивни;

-  напълно неограничени и с ограничения.

Примери:

-  simple randomization (проста рандомизация);

-  block randomization (блокова рандомизация);

-  stratified randomization (стратифицирана рандомизация);

-  biased-coin randomization (рандомизация с „нечестна” монета);

-  urn randomization (урнова рандомизация);

...

Рандомизационна програма (безплатна!!!):

http://mahmoodsaghaei. /Softwares/randalloc. html