23.02.2025

Расчет мощности: Расчет мощности по току и напряжению

Содержание

Расчёт мощности по току и напряжению онлайн

Калькулятор расчёта мощности по току и напряжению

Данный калькулятор позволяет выполнить расчёт мощности по току и напряжению. Параметры необходимо вводить в базовых величинах, ток в амперах (А), напряжение в вольтах (В).

Формула расчёта мощности по току и напряжению

P = I*U ,

  1. P— мощность потребителя, Вт;
  2. I— cила тока, А;
  3. U— напряжение в сети, В;

Обращаем Ваше внимание, что приведённый выше онлайн калькулятор расчёта мощности, производит упрощённый расчёт мощности по току и напряжению, по упрощённой формуле. Онлайн расчёт данным способом позволяет, получить значения близкие к реальным.

Рекомендуем!

Формула расчёта мощности по току и напряжению для однофазной сети:

Однако, существуют формулы и для более точного расчёта. Если Вы обладаете, всеми необходимыми техническими характеристиками сети и устройства, то более точный расчёт мощности для однофазной сети, Вы можете произвести по формуле:

P = I*U*cosφ ,

  1. P— мощность потребителя, Вт;
  2. I— cила тока, А;
  3. U— напряжение в сети, В;
  4. cosφ -безразмерная величина, которая равна отношению активной мощности к полной (коэффициент мощности). По умолчанию значение cosφ равно 0,95 для бытовых электросетей и от 0,95 до 0,65 для промышленных.

Формула расчёта мощности по току и напряжению для трёхфазной сети:

P = 1,73*I*U*cosφ ,

  1. P— мощность потребителя, Вт;
  2. I— cила тока, А;
  3. U— напряжение в сети, В;
  4. cosφ -безразмерная величина, которая равна отношению активной мощности к полной (коэффициент мощности).
    По умолчанию значение cosφ равно 0,95 для бытовых электросетей и от 0,95 до 0,65 для промышленных.

Примерные значения cosφ для некоторых типов оборудования:


  • лампы накаливания — 1;
  • обогреватели, электропечи, электроплиты и т.п. — 0,95;
  • электродвигатели — 0,85 ..0,87;
  • дрели, отрезные машинки и т.п. — 0,85 ..0,9;
  • электродвигатели компрессоров, холодильников, стиральных машин и т.п. — 0,7…0,85
  • компьютеры, телевизоры, СВЧ печи, кондиционеры, вентиляторы, энергосберегающие лампы — 0,5 ..0,8

Более точные значения cosφ зачастую можно найти в паспорте прибора или на бирке.

Наши ресурсы в социальных сетях, присоединяйтесь:

[ratings]

Понравилась статья? Поделиться с друзьями:

Расчет примерной мощности электроприборов

Содержание

Простой способ расчёта мощности электроприборов


Мощность каждого электроприбора указана в техпаспорте и дублируется на прикрепленной к нему бирке или табличке. Самый простой способ расчёта — просуммировать мощности всех подключаемых к стабилизатору или ИБП потребителей.


Поправка: сейчас мы рассмотрели оборудование без электродвигателей. Оно обладает только активной составляющей мощности. К этой категории относятся электроплиты, кипятильники, лампы накаливания и др.


Холодильники, стиральные машины, дрели и прочее оборудование с электродвигателями обладает также реактивной составляющей мощности.


Для таких электроприборов необходимо вычислить полную мощность (измеряется в Вольт-Амперах (ВА)), которая, в отличие от описанного выше, не будет равна активной мощности. Соотношение между полной и активной мощностью выражается формулой:

  • Pполная = Pактивная / cos (ф).


Сos(φ) указывается в документации и на бирке электроприбора (встречается обозначение PF – Power Factor). При отсутствии данных допустимо принять cos(φ) в пределах 0,7-0,8.


Например, если P активная мощность электродрели составляет 700 Вт, то P полная рассчитывается как 700 / 0,7 = 1000 ВА.


Вывод: для точного расчета суммарной мощности нагрузки нужно сложить полную мощность всех выбранных приборов (в Вольт-Амперах). Для электроприборов без двигателей полная мощность будет равна активной.


Рекомендуется подбирать стабилизатор с мощностью, превышающей полученное суммированием значение на 20-30%, что обеспечит следующие преимущества:

  • избавит оборудование от перегрузки;
  • позволит подключать дополнительных потребителей.

Пусковые токи электроприборов с реактивной нагрузкой


Не следует забывать, что при запуске оборудования, содержащего электродвигатель (насос, компрессор), его «пусковой ток» в 3-5 раз превышает номинальное значение. Соответственно, в этот момент происходит пропорциональный пусковому току «скачок» нагрузки в 3-5 раз.


При выборе стабилизатора или ИБП следует обязательно учитывать пусковые токи защищаемого оборудования и подбирать аппарат по максимальному, пусковому значению мощности.


Например, если для электродрели с активной мощностью в 700 Вт купить стабилизатор на 1 кВт, то в момент запуска он будет отключаться по причине перегруза. В данном случае необходимо изделие минимум с трехкратным превышением по мощности:

  • 700 Вт × 3 = 2,1 кВт.


Узнать больше про ИБП с двойным преобразованием.

Калькулятор расчета мощности конвектора по площади помещения

Подобрать конвектор по параметрам

Стены

Общая длина внешних (холодных) стен помещения м

Высота стены м

Количество слоев материала наружних стен
1
2
3
4
5

Тип материала:

Слой 1
ЖелезобетонКерамзитобетонГазо и пенобетон, газо и пеносиликатПлиты из гипсаЛисты гипсовые обшивочные (сухая штукатурка)Кирпич глиняный обыкновенный (ГОСТ 530-80) на цементно песчаном раствореКирпич силикатный обыкновенный (ГОСТ 379-79) на цементно песчаном раствореКирпич керамический пустотныйКирпич, теплая керамикаГранит, гнейс и базальтМраморИзвестнякТуфСосна и ельДубФанера клеенаяКартон облицовочныйПлиты минераловатныеПенополистиролПенопласт ПХВ-1ПенополиуретанГравий керамзитовыйПеностекло или газостекло
Толщина слоя м

Слой 2
ЖелезобетонКерамзитобетонГазо и пенобетон, газо и пеносиликатПлиты из гипсаЛисты гипсовые обшивочные (сухая штукатурка)Кирпич глиняный обыкновенный (ГОСТ 530-80) на цементно песчаном раствореКирпич силикатный обыкновенный (ГОСТ 379-79) на цементно песчаном раствореКирпич керамический пустотныйКирпич, теплая керамикаГранит, гнейс и базальтМраморИзвестнякТуфСосна и ельДубФанера клеенаяКартон облицовочныйПлиты минераловатныеПенополистиролПенопласт ПХВ-1ПенополиуретанГравий керамзитовыйПеностекло или газостекло
Толщина слоя м

Слой 3
ЖелезобетонКерамзитобетонГазо и пенобетон, газо и пеносиликатПлиты из гипсаЛисты гипсовые обшивочные (сухая штукатурка)Кирпич глиняный обыкновенный (ГОСТ 530-80) на цементно песчаном раствореКирпич силикатный обыкновенный (ГОСТ 379-79) на цементно песчаном раствореКирпич керамический пустотныйКирпич, теплая керамикаГранит, гнейс и базальтМраморИзвестнякТуфСосна и ельДубФанера клеенаяКартон облицовочныйПлиты минераловатныеПенополистиролПенопласт ПХВ-1ПенополиуретанГравий керамзитовыйПеностекло или газостекло
Толщина слоя м

Слой 4
ЖелезобетонКерамзитобетонГазо и пенобетон, газо и пеносиликатПлиты из гипсаЛисты гипсовые обшивочные (сухая штукатурка)Кирпич глиняный обыкновенный (ГОСТ 530-80) на цементно песчаном раствореКирпич силикатный обыкновенный (ГОСТ 379-79) на цементно песчаном раствореКирпич керамический пустотныйКирпич, теплая керамикаГранит, гнейс и базальтМраморИзвестнякТуфСосна и ельДубФанера клеенаяКартон облицовочныйПлиты минераловатныеПенополистиролПенопласт ПХВ-1ПенополиуретанГравий керамзитовыйПеностекло или газостекло
Толщина слоя м

Слой 5
ЖелезобетонКерамзитобетонГазо и пенобетон, газо и пеносиликатПлиты из гипсаЛисты гипсовые обшивочные (сухая штукатурка)Кирпич глиняный обыкновенный (ГОСТ 530-80) на цементно песчаном раствореКирпич силикатный обыкновенный (ГОСТ 379-79) на цементно песчаном раствореКирпич керамический пустотныйКирпич, теплая керамикаГранит, гнейс и базальтМраморИзвестнякТуфСосна и ельДубФанера клеенаяКартон облицовочныйПлиты минераловатныеПенополистиролПенопласт ПХВ-1ПенополиуретанГравий керамзитовыйПеностекло или газостекло
Толщина слоя м

Остекление


Пол


Кровля




0 Вт
Тепловая мощность конвектора


Подберите модель

Расчет мощности конвектора: полезные таблицы и формулы

При проектировании системы отопления в квартире или доме важно определить необходимую мощность теплового оборудования. Для этого нужно знать площадь помещения, высоту потолков, количество внешних стен и окон для применения повышающего коэффициента. Если высота потолков в доме – около 2,7 м, вы легко произведете расчет мощности конвекторов по площади. Согласно нормам СНиП 41-01-2003, 1 кВт тепловой энергии достаточно для обогрева 10 кв. м помещения.

Как рассчитать мощность конвекторов по площади?

В соответствии со строительными нормами номинальная мощность конвектора для комнаты 25 кв. м составит:

(25 кв. м : 10 кв. м) * 1 кВт = 2,5 кВт

или

25 кв. м * 0,1 кВт = 2,5 кВт

Полученный результат приведен без учета особенностей помещения. Для повышения точности вычислений учтите следующие факторы:

  • расположение конвектора под окном снижает теплоотдачу, поэтому для компенсации тепловых потерь выбирайте оборудование на 5 – 10 % мощнее;
  • если окна занимают большую площадь стены (панорамные, французские), а также выходят на север и северо-восток, при расчетах увеличьте результат на 15 %;
  • угловое расположение помещения требует увеличения мощности на 20 %, а при наличии в такой комнате 2 окон полученный результат повышают на 30 %.

Сделать расчеты наиболее точными вам поможет таблица повышающих коэффициентов:









Особенность помещения
Коэффициент
Отсутствие утепления стен1,1
Установка конвектора под окном1,05
Монтаж конвектора в угловом помещении с 1 окном1,2
Монтаж конвектора в угловом помещении с 2 окнами1,3
Наличие однослойных стеклопакетов0,9
Высота потолков от 2,8 до 3 м1,05

Произведем расчет мощности электрического конвектора отопления для угловой комнаты с двумя внешними стенами и площадью 18 кв. м:

(18 кв. м * 0,1 кВт) * 1,2 = 2,16 кВт

В некоторых регионах при расчете учитывают климатические особенности, но в средней полосе России погодный коэффициент равен 1,0.

Расчет мощности конвектора по объему помещения

Согласно положениям СП 60.13330.2012, для обогрева помещений с очень высокими и низкими потолками необходимо 41 Вт на 1 куб. м объема. Зная длину, ширину комнаты и высоту потолка, вы сможете рассчитать мощность отопления на калькуляторе по формуле:

abc * 0,041 кВт,

где abc – формула расчета объема;

0,041 кВт – норматив тепловой энергии.

Рассчитаем мощность конвектора для комнаты 3х4 м с потолками 2 м:

(3*4*2) * 0,041 = 0,984 кВт

Для обогрева такой комнаты потребуется конвектор мощностью 1 кВт (без учета повышающих коэффициентов).

Калькулятор расчета мощности обогревателей для шкафа автоматики ОША

Основным критерием для оптимального подбора нагревательного оборудования для шкафа автоматики является мощность нагревательного элемента, которая необходима для прогрева объема шкафа и габариты шкафа управления. Основная формула расчета базируется на таких переменных, как площадь поверхности корпуса шкафа управления, разница температур между наружной и внутренней температурой. На расчет влияет также материал, из которого изготовлен шкаф управления, особенности его размещения, объем выделяемого тепла от электрических компонентов в шкафу. 

Также есть дополнительные факторы, которые не могут учитываться стандартной формулой, поэтому данный калькулятор размещается в качестве быстрого инструмента предварительного расчета. Для детального подробного расчета и консультации обращайтесь к нашим специалистам. Расчет и консультация предоставляются абсолютно бесплатно!

Расчет параметров нагревателей  шкафа автоматики

Современный мир развивается стремительными темпами, автоматизация всех процессов производства становится все более распространенной задачей. В связи с этим актуальным становится вопрос увеличения срока службы различного электротехнического оборудования.

Самым оптимальным решением задачи защиты электрооборудования является размещение его в защитных шкафах. Электротехнические шкафы защищают приборы внутри от воздействия пыли, влажности, капель воды и прочих негативных воздействий. Правильный подбор шкафа автоматики позволяет обеспечить вашему оборудованию максимальный уровень безопасности от негативного влияния окружающей среды.

Внутри самого шкафа автоматики также имеются различные факторы, которые могут отрицательно сказаться на функциональности оборудования.

Перегрев

Электроприборы, размещаемые в шкафу автоматики, выделяют определенное тепло. При высокой температуре окружающей среды они могут перегреваться, что в большинстве случаев приводит к выходу оборудования из строя. В данном случае необходимо обеспечить достаточную вентиляцию воздуха, помочь с чем могут вентиляторы для шкафов автоматики.

Низкие температуры

Вторым важным фактором, который отрицательно сказывается на работоспособности оборудования, является холод. Большинство приборов абсолютно не рассчитаны на работу при отрицательных температурах, поэтому очень важно установить дополнительные обогреватели в шкафу автоматики, если он расположен на улице или в помещении с недостаточным отоплением.

Низкие температуры воздуха приводят к еще одной проблеме внутри шкафов управления – выпадению конденсата. Конденсат будет появляться в том случае,  если температура внутри шкафа будет ниже точки росы.  Точка росы – это предельная температура, при которой частицы влаги в воздухе начинают конденсироваться. При использовании обогревателей ОША температура внутри шкафа будет нормализоваться, и конденсат выпадать не будет.

Точка росы зависит от влажности воздуха. В таблице ниже представлены данные о значениях точки росы для определенной влажности окружающей среды.

 

Относительная влажность среды, %

Температура окружающей среды, °C

20

25

30

35

40

45

50

55

40

6

11

15

19

24

28

33

37

50

9

14

19

23

28

32

37

41

60

12

17

21

26

31

36

40

45

70

14

19

24

29

34

38

43

48

80

16

21

26

31

36

41

46

51

90

18

23

28

33

38

43

48

53

100

20

25

30

35

40

45

50

55

Для нейтрализации всех негативных факторов, влияющих на работу электрооборудования в электротехнических шкафах управления, нужно произвести правильный расчет параметров обогрева и на их основе подобрать оптимальный набор обогревателей ОША. Для расчета нужно учитывать множество особенностей, которые мы рассмотрим подробнее.

Габариты шкафа автоматики и место расположения

Первым делом нужно измерить габариты шкафа управления и уточнить тип его расположения. На основе этих параметров производится вычисление таких величин:

  1. Эффективная площадь поверхности теплообмена

  2. Площадь поверхности, рассеивающей тепло в окружающую среду

Очевидно, что чем больше будет размер щита управления, тем большей будет площадь поверхности, рассеивающей тепло. Таким образом для охлаждения электроники в шкафу автоматики большего объема понадобится меньший объем охлажденного воздуха, чем для охлаждения того же оборудования в щите меньшего объема.

А в случае обогрева ситуация абсолютно противоположная. Нагреть воздух в шкафу меньшего объема намного проще, чем в большом, плюс  к этому, теплоотдача от стенок компактного шкафа будет меньше.

Для проведения расчета эффективной поверхности теплообмена можно воспользоваться данными из таблицы:

Расположение шкафа

Формула расчета

Отдельное размещение

A = 1,8 · В · (Ш + Г) + 1,4 · Ш · Г

Расположение на стене

A = 1,4 · Ш · (В + Г) + 1,8 · Г · В

Крайнее место в ряду шкафов

A = 1,4 · Г · (В + Г) + 1,8 · Ш · В

Крайнее место в ряду на стене

A = 1,4 · В · (Ш + Г) + 1,4 · Ш · Г

Расположение в середине ряда

A = 1,8 · Ш · В + 1,4 · Ш · Г + Г · В

В середине ряда на стене

A = 1,4 · Ш · (В + Г) + Г · В

Расположение на стене в середине ряда под козырьком

A = 1,4 · Ш · В + 0,7 · Ш · Г + Г · В

 

Как видно по данным таблицы, не только площадь поверхности шкафа важна, но и то, как он расположен. Если шкаф стоит отдельно, то тепло с поверхности будет отдаваться от всех стенок щита управления, а размещенный на стене в середине ряда будет отдавать тепло с намного меньшей площади.

Плотность теплового потока

От константы воздуха зависит еще один участвующий в расчетах параметр – плотность теплового потока. По сути это скорость рассеивания тепла внутри электротехнического щита управления. Данный параметр имеет обратно пропорциональную зависимость от значения атмосферного давления. Чем оно ниже, тем дольше будет происходить рассеивание тепла. Как всем известно из курса школьной физики, чем выше точка над уровнем моря, тем меньше будет атмосферное давление. Следовательно, чем выше над уровнем моря будет расположен шкаф управления, тем хуже будет рассеиваться тепло.

Для России в средней полосе высота над уровнем моря равна 170 м, следовательно, константа воздуха для средней полосы России равна 3,2 м3К/Втч.

Материал корпуса шкафа управления

Материал, использующийся при изготовлении корпуса электрощита, является также немаловажным параметром, ведь от него зависит коэффициент теплоотдачи.

Коэффициент теплоотдачи – это количество теплоты, которое за единицу времени переходит через  квадратный метр эффективной поверхности теплообмена от более нагретого к менее нагретому теплоносителю.

Для примера шкаф из листовой стали с окрашенной поверхностью будет иметь К=5,5, в случае с нержавейкой К=4,5, а для алюминия коэффициент будет равен 12. Таким образом, если сравнить два щита управления с равными габаритами, но один будет алюминиевый, а второй стальной, то снизить температуру алюминиевого щита управления будет намного проще, ведь его поверхности будут быстрее остывать и передавать тепло окружающей среде. Именно поэтому алюминий часто используется в качестве материала для радиаторов охлаждения.

Тепловыделение оборудования в шкафу управления

Немаловажным критерием для выбора корпуса шкафа управления и  климатического оборудования внутри является сами электроприборы. Различное оборудование выделяет различное количество тепла. Есть приборы, которые значительно нагреваются, например, блоки питания, трансформаторы, частотники, реле. Если в вашем шкафу автоматики присутствуют перечисленные или подобные приборы, обязательно включите в расчет суммарную теплоотдачу от них.

Расчет внутренней  температуры шкафа управления

Температура внутри шкафа вычисляется по формуле:

Твнут=Qv*k*A+Тнар

Где Твнут – температура внутри шкафа управления,

Тнар – температура окружающей среды

Qv – тепловыделение от установленных в шкафу приборов

k – коэффициент теплоотдачи материала корпуса

А – эффективная поверхность теплообмена

В случае, если вы не знаете точный показатель тепловыделения оборудования вашего ШУ, то подсчитать его самостоятельно вам поможет следующая таблица:

 

Устройство

Формула для расчета

Преобразователи частоты

Qпч = суммарная мощность * 0,05

Блоки питания

Qбп = суммарная мощность * 0,1

Автоматы

Qа = суммарный ток * 0,2

Пускатели

Qп = суммарный ток * 0,4

Трансформаторы

Qт = суммарная мощность * 0,1

Твердотельные реле

Qр = суммарный ток нагрузок по каждой фазе * 1,2

 

Тепловыделение суммарное Qv считается как сумма тепловыделения всех элементов.

Таким образом в результате расчетов мы получим внутреннюю температуру шкафа управления и поймем, является ли она достаточной для стабильного функционирования оборудования. Если вычисленная температура меньше, чем оптимальная, то в электрощите нужен дополнительный обогрев при помощи обогревателей ОША.

Расчет мощности обогрева шкафа автоматики

Мощность, необходимая для обогрева шкафа автоматики, рассчитывается по формуле:

Р=А* k*(Твнутр-Твнеш) — Qv

Где Р – мощность нагревателей

А – эффективная поверхность теплообмена

Твнеш-Твнутр – разница температур между температурой внутри шкафа и окружающей средой

k – коэффициент теплоотдачи материала корпуса шкафа

Qv – суммарное тепловыделение оборудования

На основе полученной мощности производится подбор обогревателей ОША и других климатических устройств. Вы можете произвести расчет самостоятельно, использовав калькулятор на данной странице, и выбрать необходимую модель нагревателя ОША исходя из полученного показателя мощности. Или же просто обращайтесь к нашим специалистам за бесплатной консультацией и расчетами по телефону или через форму заказа звонка прямо сейчас!   

Расчет мощности зарядной станции

Чтобы рассчитать зарядную мощность, вам необходимо знать количество фаз, напряжение (V вольты), силу тока (A амперы) и разъем питания Вашей зарядной станции. В трехфазном соединении также играет роль способ подключения зарядной станции к сети. В зависимости от схемы подключения напряжение составляет 230 или 380 вольт. Имея данную информацию вы можете произвести расчеты по формулам:

Мощность заряда (Однофазный переменный ток):

Мощность заряда (3,7 кВт) = фазы (1) * Напряжение (230 В) * сила тока (16 А)

Мощность заряда (Трехфазный переменный ток):

Мощность заряда (22 кВт) = фазы (3) * напряжение (230 В) * сила тока (32 А)

Пример:

Чтобы зарядная мощность составляла 22 кВт, ваша электрическая станция должна поддерживать трехфазную зарядку с напряжением 32 Ампер. Самое слабое звено в цепи определяет общую зарядную мощность станции. Однако все типы разъемов поддерживают максимальную мощность, об этом в нашей статье «Type 1 или Type 2». 

Время зарядки электромобилей

Чтобы вычислить время зарядки, достаточно разделить емкость аккумулятора на зарядную мощность. На примере электромобиля Тесла – делим 85 кВтч на 22 кВт и получаем время зарядки, равное 3,9 часа. Однако состояние батареи может ограничивать зарядную мощность, когда заряжается, в связи с чем зарядная мощность не может быть постоянной. И поэтому при расчетах мы добавляем как минимум полчаса.

Время Зарядки = емкость аккумулятора / Мощность зарядки

Пример: 3,9 ч = 85 кВтч / 22 кВт

Запас хода

Для расчета дальности пробега просто разделите емкость батареи на потребление энергии и умножьте ее на 100. Но при этом мы получим лишь примерные значения, так как реальная дальность зависит, кроме прочего, от стиля вождения, дорожного покрытия и использования электрических потребителей, таких как печка или кондиционер. Но вся доступная мощность зачастую не используется, чтобы защитить аккумулятор.

Дальность = емкость батареи / потребление энергии (на 100 км) * 100

Пример: 469 км = 85 кВтч / (18,1 кВтч / 100 км) * 100

Расчет мощности обогревателя от Климат в Доме : Полезная информация

Приблизительный расчет мощности обогревателя:

Прежде чем выбирать обогреватель, необходимо рассчитать минимальную тепловую мощность, необходимую для вашего конкретного помещения.

Обычно для приблизительного расчета достаточно объем помещения в кубических метрах разделить на 30. Таким способом обычно и пользуются менеджеры, консультируя покупателей по телефону. Такой расчет позволяет быстро приблизительно прикинуть какая совокупная тепловая мощность может понадобиться для прогрева помещения.

Например, для выбора тепловой пушки в комнату (или офис) площадью 50 м² и высотой потолков 3 м (150 м³) потребуется 5.0 кВт тепловой мощности. Наш расчет выглядит так: 150 / 30 = 5.0

Такой вариант расчетов в основном используется для расчетов дополнительного обогрева в те помещения, где уже есть какое-то отопление и необходимо просто догреть воздух до комфортной температуры.

Однако, такой способ расчета не подойдет для неотапливаемых помещений, а также если необходимо помимо объема помещения учесть разницу температур внутри-снаружи, и конструктивные особенности самого здания (стены, изоляцию и т. п.)

Точный расчет тепловой мощности обогревателя:

Для расчета тепловой мощности, учитывающего дополнительные условия помещения и температурные режимы, используется следующая формула:

V × ΔT × K = ккал/час, или

V × ΔT × K / 860 = кВт, где

V — Объем обогреваемого помещения в кубических метрах;

ΔT — Разница между температурами воздуха внутри и снаружи. Например, если температура воздуха снаружи -5 °C, а необходимая температура внутри помещения +18 °C, то разница температур составляет 23 градуса;

K — Коэффициент теплоизоляции помещения. Он зависит от типа конструкции и изоляции помещения.

K=3.0–4.0 — Упрощенная деревянная конструкция или конструкция из гофрированного металлического листа. Без теплоизоляции.

K=2.0–2.9 — Упрощенная конструкция здания, одинарная кирпичная кладка, упрощенная конструкция окон и крыши. Небольшая теплоизоляция.

K=1.0–1.9 — Стандартная конструкция, двойная кирпичная кладка, небольшое число окон, крыша со стандартной кровлей. Средняя теплоизоляция.

K=0.6–0.9 — Улучшенная конструкция здания, кирпичные стены с двойной изоляцией, небольшое число окон со сдвоенными рамами, толстое основание пола, крыша из высококачественного теплоизоляционного материала. Высокая теплоизоляция.

При выборе значения коэффициента теплоизоляции обязательно нужно учитывать старое это здание или новое, т. к. старые здания требуют большего количества тепла для прогрева (соответственно, значение коэффициента должно быть выше).

Для нашего примера, если учесть разницу температур (например, 23 °C) и уточнить коэффициент теплоизоляции (например, у нас старое здание с двойной кирпичной кладкой, возьмем значение 1.9), то расчет необходимой тепловой мощности обогревателя будет выглядеть так:

150 × 23 × 1.9 / 860 = 7.62

Т. е., как видите, уточненный расчет показал, что для прогрева данного конкретного помещения понадобится большая тепловая мощность обогрева, чем была рассчитана по упрощенной формуле.

Подобный способ расчета применим к любым видам теплового оборудования, за исключением, возможно, инфракрасных обогревателей, т. к. там используется принцип ощущаемого тепла. Для любых других видов обогревателей — водяных, электрических, газовых и жидкотопливных, он подходит.

После вычисления необходимой тепловой мощности можно приступать к выбору типа и модели обогревателя.

Расчет мощности кондиционера

Простой способ расчёта мощности охлаждения кондиционера

Для точного определения тепловых притоков в помещения разработано множество методик, учитывающих расход энергии через стены, перекрытия, оконные и дверные проёмы, инфильтрацию и естественный или принудительный обмен воздуха. Данные методики имеют один недостаток: сложность расчёта и, как следствие из этого, персонал, применяемый на практике эти методики, должен обладать соответствующим образованием и иметь  высокий уровень подготовки. Но что же делать, если необходимо быстро оценивать мощность охлаждения кондиционера, не производя сложных расчётов, не привлекая дорогостоящих специалистов?

Для этого существует упрощенный метод расчёта холодопроизводительности кондиционера, позволяющий за пять минут оценить мощность необходимой системы кондиционирования и предложить заказчику то или иное оборудование. Расчёт предусматривает несколько шагов, позволяющих в итоге получить ориентировочную, но достаточную для оценки помещения и предложения заказчику мощность охлаждения кондиционера.

Шаг первый. Расчёт теплопритоков, обусловленных разницей температур между температурами наружного воздуха  и внутри помещения, которую определяет, в основном, солнечная радиация.

 

Qпом. = Vпом.  х  K,

где

Qпом. — теплопритоки в помещение от солнечной радиации,

Vпом. — объём помещения  (Vпом. = S x h, где S — площадь помещения, h — его высота),

K — коэффициент, учитывающий количество солнечной радиации, проникаемой в помещение, и являющийся удельной тепловой нагрузкой.

Значение коэффициента K можно принимать, к примеру, в зависимости от стороны света, в которую направлены окна помещения:

К = (20 — 25) Вт/м3  — север,

К = (30 — 35) Вт/м3  — восток,

К = (35 — 40) Вт/м3  — юг, запад.

Коэффициент К необходимо корректировать в зависимости от размеров оконных проёмов и их прозрачности (энергосберегающие покрытия, жалюзи, шторы), от теплоизоляции стен, потолка, пола.

 

 Шаг второй. Расчёт теплопритоков от бытовой или промышленной техники Qт. Например, если в помещении находится обычный компьютер, в рассчитываемой мощности кондиционера необходимо учесть дополнительные 150 Вт охлаждения (в конце прошлого века эта цифра принималась  равной 300 Вт). Соответственно, для 100 компьютеров мощность охлаждения должна составлять не менее 15 кВт.

Шаг третий. Расчёт теплопритоков от людей, находящихся в помещении Qл. Человек, находящийся в состоянии покоя, выделяет 100-130 Вт тепла, но при активном движении эта цифра вырастает до 280-300 Вт (например, при занятии спортом или тяжёлой физической работой).

 

Шаг четвёртый. Остаётся сложить все полученные теплопритоки, и мы получаем мощность охлаждения кондиционера Qрасч., необходимого для помещения:

Qрасч. = Qпом.  +  Qт  +  Qл

 

Что такое BTU?

Британская тепловая единица (британская термическая единица, BTU, англ. British thermal unit) — единица измерения энергии, используемая в англоязычных странах. В настоящее время используется в основном для обозначения мощности тепловых установок, в других сферах её заменила единица СИ джоуль.

BTU определяется как количество тепла, необходимое для того, чтобы поднять температуру 1 фунта воды на 1 градус Фаренгейта, и, тем самым, тесно связан с калорией. Существует несколько альтернативных определений BTU, различающихся определениями калории; значение BTU в разных определениях может отличаться на величину до 0,5 %.

Наиболее известным примером использования данной единицы в России является использование связанной единицы BTU/час (BTU/h). Эта единица тепловой мощности используется в спецификациях техники, предназначенной для кондиционирования воздуха в помещениях.

Соотношения между BTU/час и другими единицами:

1 кВт ≈ 3412 BTU/ч

1000 BTU/ч ≈ 293 Вт

 



Определение мощности и размера выборки

Определение мощности и размера выборки

Определение мощности и размера выборки

Автор:

Лиза Салливан, доктор философии

Профессор биосатистики

Школа общественного здравоохранения Бостонского университета


Критически важным аспектом любого исследования является определение подходящего размера выборки для ответа на исследовательский вопрос.В этом модуле основное внимание уделяется формулам, которые можно использовать для оценки размера выборки, необходимого для получения оценки доверительного интервала с заданным пределом погрешности (точности) или для гарантии того, что проверка гипотезы имеет высокую вероятность обнаружения значимой разницы в параметр.

Исследования должны быть разработаны таким образом, чтобы включать достаточное количество участников для адекватного ответа на вопрос исследования. Исследования, в которых участвует либо недостаточное количество участников, либо чрезмерно большое количество участников, расточительны с точки зрения времени участников и исследователей, ресурсов для проведения оценок, аналитических усилий и т. Д.Эти ситуации также можно рассматривать как неэтичные, поскольку участники могли подвергнуться риску в рамках исследования, которое не смогло ответить на важный вопрос. Исследования, которые намного больше, чем они должны быть, чтобы ответить на вопросы исследования, также расточительны.

Представленные здесь формулы позволяют получить оценки необходимого размера выборки на основе статистических критериев. Однако во многих исследованиях размер выборки определяется финансовыми или логистическими ограничениями. Например, предположим, что предлагается исследование для оценки нового скринингового теста на синдром Дауна.Предположим, что скрининговый тест основан на анализе пробы крови, взятой у женщины на ранних сроках беременности. Чтобы оценить свойства скринингового теста (например, чувствительность и специфичность), каждой беременной женщине будет предложено сдать образец крови и в дополнение к ней пройти амниоцентез. Амниоцентез включен в качестве золотого стандарта, и его план состоит в том, чтобы сравнить результаты скринингового теста с результатами амниоцентеза. Предположим, что сбор и обработка образца крови стоит 250 долларов на участника, а амниоцентез — 900 долларов на участника.Одни только эти финансовые ограничения могут существенно ограничить число женщин, которые могут быть зачислены. Так же, как важно учитывать статистическую и клиническую значимость при интерпретации результатов статистического анализа, важно также взвесить как статистические, так и логистические вопросы при определении размера выборки для исследования.


После завершения этого модуля студент сможет:

  1. Приведите примеры, демонстрирующие, как предел погрешности, размер эффекта и изменчивость результата влияют на вычисления размера выборки.
  2. Вычислить размер выборки, необходимый для точной оценки параметров генеральной совокупности.
  3. Интерпретировать статистическую мощность при проверке гипотез.
  4. Рассчитайте размер выборки, необходимый для обеспечения высокой мощности при проверке гипотез.

Модуль доверительных интервалов предоставляет методы оценки доверительных интервалов для различных параметров (например, μ, p, (μ 1 — μ 2 ), μ d , (p 1 -p 2 ) )).Доверительные интервалы для каждого параметра имеют следующий общий вид:

Оценка

балла + Допустимая погрешность

В модуле доверительных интервалов мы вывели формулу доверительного интервала для μ как

На практике мы используем стандартное отклонение выборки для оценки стандартного отклонения генеральной совокупности. Обратите внимание, что существует альтернативная формула для оценки среднего значения непрерывного результата в одной генеральной совокупности, и она используется, когда размер выборки невелик (n <30).Он включает значение из распределения t, в отличие от значения из стандартного нормального распределения, чтобы отразить желаемый уровень достоверности. При вычислении размера выборки мы используем формулу для большой выборки, показанную здесь. [Примечание: размер результирующей выборки может быть небольшим, и на этапе анализа необходимо использовать соответствующую формулу доверительного интервала.]

Точечная оценка среднего генеральной совокупности является выборочным средним, а предел погрешности составляет

.

При планировании исследований мы хотим определить размер выборки, необходимый для обеспечения того, чтобы предел ошибки был достаточно малым, чтобы быть информативным.Например, предположим, что мы хотим оценить средний вес студенток колледжа. Мы проводим исследование и получаем 95% доверительный интервал следующим образом: 125 + 40 фунтов, или от 85 до 165 фунтов. Предел погрешности настолько велик, что доверительный интервал неинформативен. Чтобы быть информативным, исследователь может захотеть, чтобы предел погрешности составлял не более 5 или 10 фунтов (это означает, что 95% доверительный интервал будет иметь ширину (от нижнего предела до верхнего предела) 10 или 20 фунтов). Чтобы определить необходимый размер выборки , исследователь должен указать желаемую погрешность .Важно отметить, что это не статистическая проблема, а клиническая или практическая. Например, предположим, что мы хотим оценить средний вес при рождении младенцев, рожденных матерями, которые курят сигареты во время беременности. Вес при рождении у младенцев явно имеет гораздо более ограниченный диапазон, чем у студенток колледжа. Следовательно, мы, вероятно, захотим создать доверительный интервал для среднего веса при рождении, который имеет погрешность, не превышающую 1–2 фунта.

Предел погрешности в доверительном интервале одной выборки для μ можно записать следующим образом:

.

Наша цель — определить размер выборки n, который гарантирует, что предел погрешности « E » не превышает указанного значения. Мы можем взять приведенную выше формулу и с помощью некоторой алгебры найти n :

Сначала умножьте обе части уравнения на квадратный корень из n . Затем вычтите квадратный корень из n из числителя и знаменателя в правой части уравнения (поскольку любое число, деленное само на себя, равно 1). Остается:

Теперь разделите обе части на «E» и вычеркните «E» из числителя и знаменателя в левой части.Остается:

Наконец, возведите обе части уравнения в квадрат, чтобы получить:

Эта формула генерирует размер выборки n , необходимый для обеспечения того, чтобы предел погрешности E не превышал заданного значения. Чтобы найти n , мы должны ввести « Z », « σ», «» и « E ».

  • Z — значение из таблицы вероятностей стандартного нормального распределения для желаемого уровня достоверности (например,g., Z = 1,96 для 95% достоверности)
  • E — это предел погрешности, который исследователь определяет как важный с клинической или практической точки зрения.
  • σ — стандартное отклонение интересующего результата.

Иногда трудно оценить σ . Когда мы используем приведенную выше формулу размера выборки (или одну из других формул, которые мы представим в следующих разделах), мы планируем исследование для оценки неизвестного среднего значения конкретной переменной результата в генеральной совокупности.Маловероятно, что мы узнаем стандартное отклонение этой переменной. При вычислении размера выборки исследователи часто используют значение стандартного отклонения от предыдущего исследования или исследования, проведенного в другой, но сопоставимой совокупности. Расчет размера выборки не является применением статистических выводов, и поэтому разумно использовать соответствующую оценку стандартного отклонения. Оценка может быть получена из другого исследования, о котором сообщалось в литературе; некоторые исследователи проводят небольшое пилотное исследование для оценки стандартного отклонения.Пилотное исследование обычно включает небольшое количество участников (например, n = 10), которые выбираются по удобству, а не методом случайной выборки. Данные участников пилотного исследования можно использовать для вычисления стандартного отклонения выборки, которое служит хорошей оценкой для σ в формуле размера выборки. Независимо от того, как получается оценка изменчивости результата, она всегда должна быть консервативной (т.е. настолько большой, насколько это разумно), чтобы размер результирующей выборки не был слишком маленьким.

Формула дает минимальный размер выборки, чтобы гарантировать, что предел ошибки в доверительном интервале не превысит E . Планируя исследования, исследователи также должны учитывать выбытие или отказ от последующего наблюдения. Приведенная выше формула дает необходимое количество участников с полными данными, чтобы гарантировать, что предел ошибки в доверительном интервале не превышает E . Мы проиллюстрируем, как устраняется истощение при планировании исследований на примерах в следующих разделах.


В исследованиях, в которых план состоит в оценке среднего значения непрерывной переменной результата в одной популяции, формула для определения размера выборки приводится ниже:

, где Z — значение из стандартного нормального распределения, отражающее уровень достоверности, который будет использоваться (например, Z = 1,96 для 95%), σ — стандартное отклонение переменной результата, а E — желаемое погрешность.Приведенная выше формула генерирует минимальное количество субъектов, необходимое для обеспечения того, чтобы предел погрешности доверительного интервала для μ не превышал E .

Пример 1:

Исследователь хочет оценить среднее систолическое артериальное давление у детей с врожденным пороком сердца в возрасте от 3 до 5 лет. Сколько детей должно быть включено в исследование? Исследователь планирует использовать 95% доверительный интервал (так Z = 1,96) и хочет погрешность в 5 единиц.Стандартное отклонение систолического артериального давления неизвестно, но исследователи провели поиск литературы и обнаружили, что стандартное отклонение систолического артериального давления у детей с другими пороками сердца составляет от 15 до 20. Чтобы оценить размер выборки, мы рассматриваем больший стандарт отклонение, чтобы получить наиболее консервативный (самый большой) размер выборки.

Чтобы гарантировать, что 95% -ный доверительный интервал оценки среднего систолического артериального давления у детей в возрасте от 3 до 5 лет с врожденным пороком сердца находится в пределах 5 единиц от истинного среднего значения, необходима выборка размером 62.[ Примечание : Мы всегда округляем в большую сторону; формулы размера выборки всегда генерируют минимальное количество субъектов, необходимое для обеспечения указанной точности.] Если бы мы приняли стандартное отклонение, равное 15, размер выборки был бы n = 35. Поскольку оценки стандартного отклонения были получены из исследований детей с другими пороками сердца, было бы целесообразно использовать большее стандартное отклонение и запланировать исследование с 62 детьми. Выбор меньшего размера выборки потенциально может дать оценку доверительного интервала с большей погрешностью.

Исследователь хочет оценить средний вес при рождении доношенных детей (примерно 40 недель беременности) от матерей в возрасте 19 лет и младше. Средний вес новорожденных, рожденных доношенными от матерей в возрасте 20 лет и старше, составляет 3 510 граммов со стандартным отклонением 385 граммов. Сколько женщин в возрасте 19 лет и младше должны быть включены в исследование, чтобы гарантировать, что 95% -ный доверительный интервал оценки средней массы тела при рождении их младенцев имеет погрешность, не превышающую 100 граммов? Прежде чем смотреть на ответ, попробуйте выполнить расчет.

Ответ


В исследованиях, в которых план состоит в оценке доли успехов по дихотомической переменной результата (да / нет) в одной популяции, формула для определения размера выборки:

, где Z — значение из стандартного нормального распределения, отражающее уровень достоверности, который будет использоваться (например, Z = 1,96 для 95%), а E — желаемый предел погрешности. p — доля успехов в популяции.Здесь мы планируем исследование для получения 95% доверительного интервала для неизвестной доли населения, p . Уравнение для определения размера выборки для определения p, кажется, требует знания p, но, очевидно, это круговой аргумент, потому что, если бы мы знали долю успехов в популяции, то в исследовании не было бы необходимости! Что нам действительно нужно, так это приблизительное значение p или ожидаемое значение. Диапазон p составляет от 0 до 1, и, следовательно, диапазон p (1-p) составляет от 0 до 1.Значение p, которое максимизирует p (1-p), равно p = 0,5. Следовательно, если нет информации для приближения p, то p = 0,5 можно использовать для получения наиболее консервативного или наибольшего размера выборки.

Пример 2:

Исследователь хочет оценить долю первокурсников в его университете, которые в настоящее время курят сигареты (т. Е. Распространенность курения). Сколько первокурсников должно быть вовлечено в исследование, чтобы гарантировать, что оценка доли курящих первокурсников с доверительным интервалом 95% находится в пределах 5% от истинной доли?

Поскольку у нас нет информации о доле курящих первокурсников, мы используем 0.5 для оценки размера выборки следующим образом:

Чтобы гарантировать, что оценка 95% доверительного интервала доли курящих первокурсников находится в пределах 5% от истинной доли, необходима выборка размером 385.

Предположим, что подобное исследование было проведено 2 года назад и обнаружило, что распространенность курения среди первокурсников составляет 27%. Если исследователь считает, что это разумная оценка распространенности через 2 года, ее можно использовать для планирования следующего исследования.Используя эту оценку p, какой размер выборки необходим (при условии, что снова будет использоваться 95% доверительный интервал и нам нужен такой же уровень точности)?

Ответ

Пример 3:

Исследователь хочет оценить распространенность рака груди среди женщин в возрасте от 40 до 45 лет, проживающих в Бостоне. Сколько женщин должно быть вовлечено в исследование, чтобы оценка была точной? Национальные данные показывают, что к 40 годам у 1 из 235 женщин диагностируется рак груди.Это соответствует доле 0,0043 (0,43%) или 43 на 10 000 женщин. Предположим, исследователь хочет, чтобы оценка была в пределах 10 на 10 000 женщин с достоверностью 95%. Размер выборки рассчитывается следующим образом:

Выборка размером n = 16 448 гарантирует, что оценка распространенности рака груди с доверительным интервалом 95% находится в пределах 0,10 (или в пределах 10 женщин на 10 000) от его истинного значения. Это ситуация, когда исследователи могут решить, что выборка такого размера невозможна.Предположим, что исследователи думали, что выборка размером 5 000 будет разумной с практической точки зрения. Насколько точно мы можем оценить распространенность на выборке размером n = 5000? Напомним, что формула доверительного интервала для оценки распространенности:

.

Предполагая, что распространенность рака груди в выборке будет близка к той, которая основана на национальных данных, мы ожидаем, что предел погрешности будет примерно равен следующему:

Таким образом, при n = 5000 женщин можно ожидать, что 95% доверительный интервал будет иметь погрешность, равную 0.0018 (или 18 на 10 000). Исследователи должны решить, будет ли это достаточно точным, чтобы ответить на исследовательский вопрос. Обратите внимание, что вышеизложенное основано на предположении, что распространенность рака груди в Бостоне аналогична общенациональной. Это может быть, а может и не быть разумным предположением. Фактически, цель настоящего исследования — оценить распространенность в Бостоне. Исследовательская группа при участии клинических исследователей и биостатистов должна тщательно оценить последствия выбора выборки размером n = 5000, n = 16 448 или любого промежуточного размера.


В исследованиях, в которых планируется оценить разницу в средних значениях между двумя независимыми популяциями, формула для определения размеров выборки, требуемой в каждой группе сравнения, приведена ниже:

, где n i — это размер выборки, необходимый в каждой группе (i = 1,2), Z — значение из стандартного нормального распределения, отражающее уровень достоверности, который будет использоваться, а E — желаемый предел погрешности. σ снова отражает стандартное отклонение переменной результата.Вспомните из модуля по доверительным интервалам, что, когда мы генерировали оценку доверительного интервала для разницы в средних, мы использовали Sp, объединенную оценку общего стандартного отклонения, как меру изменчивости в результате (на основе объединения данных). , где Sp вычисляется следующим образом:

Если доступны данные о вариабельности результата в каждой группе сравнения, то Sp можно вычислить и использовать в формуле размера выборки. Однако чаще всего данные о вариабельности исходов доступны только по одной группе, часто не получавшей лечения (например,g., плацебо-контроль) или группу, не подвергавшуюся воздействию. При планировании клинического испытания нового препарата или процедуры часто доступны данные из других испытаний, в которых принимали участие плацебо или активная контрольная группа (т. Е. Стандартное лекарство или лечение, назначенное для исследуемого состояния). Стандартное отклонение переменной результата, измеренной у пациентов, отнесенных к группе плацебо, контрольной или неэкспонированной группе, можно использовать для планирования будущего исследования, как показано ниже.

Обратите внимание, что формула размера выборки генерирует оценки размера выборки для выборок равного размера.Если планируется исследование, в котором будет назначено разное количество пациентов или разное количество пациентов будет составлять группы сравнения, тогда можно использовать альтернативные формулы.

Пример 4:

Исследователь хочет запланировать клиническое испытание для оценки эффективности нового препарата, предназначенного для повышения холестерина ЛПВП («хорошего» холестерина). План состоит в том, чтобы зарегистрировать участников и случайным образом распределить их для приема нового препарата или плацебо. Холестерин ЛПВП будет измеряться у каждого участника через 12 недель назначенного лечения.Основываясь на предыдущем опыте проведения подобных исследований, исследователь ожидает, что 10% всех участников будут потеряны для последующего наблюдения или выбыли из исследования в течение 12 недель. Будет рассчитан 95% доверительный интервал для количественной оценки разницы в средних уровнях ЛПВП между пациентами, принимающими новый препарат, по сравнению с плацебо. Исследователь хотел бы, чтобы погрешность была не более 3 единиц. Сколько пациентов следует включить в исследование?

Размеры выборки рассчитываются следующим образом:

Основной проблемой является определение вариабельности интересующего результата (σ), в данном случае стандартного отклонения холестерина ЛПВП.Чтобы спланировать это исследование, мы можем использовать данные Фрамингемского исследования сердца. У участников, которые присутствовали на седьмом обследовании исследования потомства и не лечились от высокого холестерина, стандартное отклонение холестерина ЛПВП составляет 17,1. Мы будем использовать это значение и другие входные данные для вычисления размеров выборки следующим образом:

Образцы размера n 1 = 250 и n 2 = 250 гарантируют, что 95% доверительный интервал для разницы средних уровней ЛПВП будет иметь погрешность не более 3 единиц.Опять же, эти размеры выборки относятся к количеству участников с полными данными. Исследователи предположили, что процент отсева (или отсева) составляет 10% (в обеих группах). Чтобы гарантировать, что общий размер выборки 500 доступен через 12 недель, исследователь должен набрать больше участников, чтобы учесть их выбывание.

N (число для включения) * (% оставшихся) = желаемый размер выборки

Следовательно, N (число для включения) = желаемый размер выборки / (оставшийся%)

N = 500/0.90 = 556

Если они ожидают 10% отсева, исследователи должны зарегистрировать 556 участников. Это обеспечит N = 500 с полными данными в конце испытания.

Пример 5:

Исследователь хочет сравнить две диеты для детей, страдающих ожирением. Одна диета — это диета с низким содержанием жиров, а другая — с низким содержанием углеводов. План состоит в том, чтобы набрать детей и взвесить их в начале исследования. Затем каждому ребенку будет случайным образом назначена диета с низким содержанием жиров или углеводов.Каждый ребенок будет соблюдать назначенную диету в течение 8 недель, после чего они снова будут взвешиваться. Количество потерянных фунтов будет подсчитано для каждого ребенка. Основываясь на данных, полученных в результате испытаний диеты у взрослых, исследователь ожидает, что 20% всех детей не завершат исследование. Для количественной оценки разницы в потерянном весе между двумя диетами будет рассчитан 95% доверительный интервал, и исследователь хотел бы, чтобы погрешность составляла не более 3 фунтов. Сколько детей следует включить в исследование?

Размеры выборки рассчитываются следующим образом:

Опять же, проблема заключается в определении изменчивости интересующего результата (σ), здесь стандартное отклонение в фунтах, потерянных за 8 недель.Чтобы спланировать это исследование, исследователи используют данные опубликованного исследования взрослых. Предположим, что в одном таком исследовании сравнивали одни и те же диеты у взрослых и участвовали по 100 участников в каждой диетической группе. В исследовании сообщалось о стандартном отклонении потери веса за 8 недель на диете с низким содержанием жиров на 8,4 фунта и о стандартном отклонении веса, потерянном за 8 недель на диете с низким содержанием углеводов на 7,7 фунтов. Эти данные можно использовать для оценки общего стандартного отклонения потери веса следующим образом:

Теперь мы используем это значение и другие входные данные для вычисления размеров выборки:

Образцы размера n 1 = 56 и n 2 = 56 гарантируют, что 95% доверительный интервал для разницы в потерянном весе между диетами будет иметь погрешность не более 3 фунтов.Опять же, эти размеры выборки относятся к количеству детей с полными данными. Исследователи ожидают 20% отсева. Чтобы гарантировать, что общий размер выборки 112 будет доступен через 8 недель, исследователь должен набрать больше участников, чтобы учесть их выбытие.

N (число для включения) * (% оставшихся) = желаемый размер выборки

Следовательно, N (число для включения) = желаемый размер выборки / (оставшийся%)

N = 112 / 0,80 = 140


В исследованиях, в которых планируется оценить среднюю разницу непрерывного результата на основе сопоставленных данных, ниже приводится формула для определения размера выборки:

, где Z — значение стандартного нормального распределения, отражающее уровень достоверности, который будет использоваться (например,g., Z = 1,96 для 95%), E — желаемый предел погрешности, а σ d — стандартное отклонение разницы оценок. Чрезвычайно важно, чтобы стандартное отклонение разницы баллов (например, разница, основанная на измерениях с течением времени или разница между согласованными парами) использовалось здесь для надлежащей оценки размера выборки.


В исследованиях, в которых планируется оценить разницу в пропорциях между двумя независимыми популяциями (т.д., для оценки разницы рисков) формула для определения размеров выборки, требуемой в каждой группе сравнения:

, где n i — размер выборки, необходимый в каждой группе (i = 1,2), Z — значение из стандартного нормального распределения, отражающее уровень достоверности, который будет использоваться (например, Z = 1,96 для 95%), и E — желаемая погрешность. p 1 и p 2 — это доли успехов в каждой группе сравнения. Опять же, здесь мы планируем исследование для получения 95% доверительного интервала для разницы в неизвестных пропорциях, а формула для оценки необходимых размеров выборки требует p 1 и p 2 .Чтобы оценить размер выборки, нам нужны приблизительные значения p 1 и p 2 . Значения p 1 и p 2 , которые максимизируют размер выборки, равны p 1 = p 2 = 0,5. Таким образом, если нет информации для приблизительного определения p 1 и p 2 , то можно использовать 0,5 для получения наиболее консервативных или наибольших размеров выборки.

Подобно ситуации для двух независимых выборок и непрерывного результата в верхней части этой страницы, может быть случай, когда доступны данные о доле успешных результатов в одной группе, обычно необработанной (например.g., плацебо-контроль) или группу, не подвергавшуюся воздействию. В таком случае известная пропорция может использоваться как для p 1 , так и для p 2 в приведенной выше формуле. Приведенная выше формула генерирует оценки размера выборки для выборок равного размера. Если планируется исследование, в котором будет назначено разное количество пациентов или разное количество пациентов будет составлять группы сравнения, тогда можно использовать альтернативные формулы. Заинтересованные читатели могут увидеть Флейсс для более подробной информации. 4

Пример 6:

Исследователь хочет оценить влияние курения во время беременности на преждевременные роды.Нормальная беременность длится примерно 40 недель, а преждевременные роды происходят до 37 недель. В отчете Национальной статистики естественного движения населения за 2005 год указывается, что примерно 12% младенцев рождаются преждевременно в Соединенных Штатах. 5 Исследователь планирует собрать данные посредством обзора медицинских карт и создать 95% доверительный интервал для разницы в долях детей, рожденных недоношенными женщинами, которые курили во время беременности, по сравнению с теми, кто этого не сделал. Сколько женщин должно быть включено в исследование, чтобы гарантировать, что 95% доверительный интервал для разницы в пропорциях имеет погрешность не более 4%?

Размеры выборки (т.е., количество женщин, которые курили и не курили во время беременности), можно вычислить по формуле, показанной выше. Национальные данные показывают, что 12% младенцев рождаются преждевременно. Мы будем использовать эту оценку для обеих групп при вычислении размера выборки.

Выборки размера n 1 = 508 женщин, которые курили во время беременности, и n 2 = 508 женщин, которые не курили во время беременности, обеспечат 95% -ный доверительный интервал для разницы в пропорциях преждевременных родов. погрешность не более 4%.

Здесь проблема истощения?

Ответ


В модуле проверки гипотез для средних и пропорций мы представили методы для средних, пропорций, различий в средних и различий в пропорциях. Хотя каждый тест включал детали, которые были специфичны для интересующего результата (например, непрерывный или дихотомический) и для количества групп сравнения (одна, две, более двух), для каждого теста были общие элементы.Например, в каждой проверке гипотезы можно совершить две ошибки. Первая называется ошибкой типа I и относится к ситуации, когда мы ошибочно отклоняем H 0 , хотя на самом деле это правда. На первом этапе любой проверки гипотезы мы выбираем уровень значимости, α, и α = P (ошибка типа I) = P (отклонить H 0 | H 0 верно). Поскольку мы намеренно выбираем небольшое значение для α, мы контролируем вероятность совершения ошибки типа I. Второй тип ошибок называется ошибкой типа II и определяется как вероятность того, что мы не отклоним H 0 , когда оно ложно.Вероятность ошибки типа II обозначается β, а β = P (ошибка типа II) = P (Не отклонять H 0 | H 0 ложно). При проверке гипотез мы обычно сосредотачиваемся на мощности, которая определяется как вероятность того, что мы отклоним H 0 , когда оно ложно, т. Е. Мощность = 1- β = P (Отклонить H 0 | H 0 ложно ). Мощность — это вероятность того, что тест правильно отвергнет ложную нулевую гипотезу. Хороший тест — это тест с низкой вероятностью совершения ошибки типа I (т.е., малое α) и высокое увеличение (то есть малое β, высокое увеличение).

Здесь мы представляем формулы для определения размера выборки, необходимого для обеспечения высокой мощности теста. Вычисления размера выборки зависят от уровня значимости, aα, желаемой мощности теста (эквивалентно 1-β), изменчивости результата и величины эффекта. Величина эффекта — это разница в интересующем параметре, которая представляет собой клинически значимое различие. Подобно пределу погрешности в приложениях с доверительным интервалом, величина эффекта определяется на основе клинических или практических критериев, а не статистических критериев.

Понятие статистической мощности может быть трудным для понимания. Прежде чем представить формулы для определения размеров выборки, необходимых для обеспечения высокой мощности в тесте, мы сначала обсудим мощность с концептуальной точки зрения.

Предположим, мы хотим проверить следующие гипотезы при aα = 0,05: H 0 : μ = 90 по сравнению с H 1 : μ ≠ 90. Чтобы проверить гипотезы, предположим, что мы выбрали выборку размером n = 100. В этом примере предположим, что стандартное отклонение результата составляет σ = 20.Мы вычисляем выборочное среднее, а затем должны решить, предоставляет ли выборочное среднее доказательства в поддержку альтернативной гипотезы или нет. Это делается путем вычисления статистики теста и сравнения статистики теста с соответствующим критическим значением. Если нулевая гипотеза верна (μ = 90), то мы, вероятно, выберем образец, среднее значение которого близко к значению 90. Однако также можно выбрать образец, среднее значение которого намного больше или намного меньше 90. Напомним из Центральной предельной теоремы (см. Стр. 11 в модуле Вероятность), что для больших n (здесь n = 100 достаточно велико) распределение выборочных средних приблизительно нормально со средним значением

.

и

Если нулевая гипотеза верна, можно наблюдать любое среднее значение выборки, показанное на рисунке ниже; все это возможно при H 0 : μ = 90.

Когда мы устанавливаем правило принятия решения для нашей проверки гипотезы, мы определяем критические значения на основе α = 0,05 и двустороннего теста. Когда мы запускаем проверку гипотез, мы обычно стандартизируем данные (например, конвертируем в Z или t), а критические значения — это соответствующие значения из распределения вероятностей, используемого в тесте. Чтобы облегчить интерпретацию, мы продолжим это обсуждение вместо Z. Критические значения для двустороннего теста с α = 0,05 равны 86.06 и 93,92 (эти значения соответствуют -1,96 и 1,96 соответственно по шкале Z), поэтому правило принятия решения следующее: Отклонить H 0 , если < 86,06 или если > 93,92. Область отклонения показана в хвостах рисунка ниже.

Область отклонения для теста H 0 : μ = 90 по сравнению с H 1 : μ ≠ 90 при α = 0,05

.

Области в двух хвостах кривой представляют вероятность ошибки типа I, α = 0.05. Эта концепция обсуждалась в модуле по проверке гипотез.

Теперь предположим, что альтернативная гипотеза H 1 верна (т. Е. Μ μ 90) и что истинное среднее на самом деле составляет 94. На рисунке ниже показаны распределения выборочного среднего при нулевой и альтернативной гипотезах. значения выборочного среднего показаны по горизонтальной оси.

Распределение ниже H 0 : μ = 90 и ниже H 1 : μ = 94

Если истинное среднее значение равно 94, то альтернативная гипотеза верна.В нашем тесте мы выбрали α = 0,05 и отклонили H 0 , если наблюдаемое среднее значение выборки превышает 93,92 (на данный момент фокусируясь на верхнем хвосте области отклонения). Критическое значение (93,92) указано вертикальной линией. Вероятность ошибки типа II обозначается β, а β = P (Do not Reject H 0 | H 0 ложно), то есть вероятность не отклонить нулевую гипотезу, если нулевая гипотеза верна. β показано на рисунке выше как область под крайней правой кривой (H 1 ) слева от вертикальной линии (где мы не отклоняем H 0 ).Мощность определяется как 1- β = P (отклонение H 0 | H 0 неверно) и показано на рисунке как площадь под крайней правой кривой (H 1 ) справа от вертикальной линии ( где мы отклоняем H 0 ).

Обратите внимание, что β и мощность связаны с α, изменчивостью результата и величиной эффекта. Из рисунка выше мы можем видеть, что произойдет с β и мощностью, если мы увеличим α. Предположим, например, что мы увеличиваем α до α = 0,10. Верхнее критическое значение будет 92.56 вместо 93.92. Вертикальная линия сместится влево, увеличивая α, уменьшая β и увеличивая мощность. Хотя лучший тест — это тест с более высокой мощностью, не рекомендуется увеличивать α как средство увеличения мощности. Тем не менее, существует прямая зависимость между α и мощностью (с увеличением α увеличивается и мощность).

β и мощность также связаны с изменчивостью результата и величиной эффекта. Величина эффекта — это разница в интересующем параметре (например, μ), которая представляет собой клинически значимое различие.На приведенном выше рисунке графически отображаются α, β и степень, когда разница в среднем под нулевым значением по сравнению с альтернативной гипотезой составляет 4 единицы (то есть 90 против 94). На рисунке ниже показаны те же компоненты для ситуации, когда среднее значение согласно альтернативной гипотезе равно 98.

Рисунок — Распределение ниже H 0 : μ = 90 и ниже H 1 : μ = 98.

Обратите внимание, что мощность намного выше, когда разница между средним значением H 0 больше по сравнению с H 1 (т.е.э., 90 против 98). Статистический тест с гораздо большей вероятностью отклонит нулевую гипотезу в пользу альтернативы, если истинное среднее значение равно 98, чем если истинное среднее значение равно 94. Также обратите внимание на то, что в этом случае существует небольшое перекрытие в распределениях при нулевой и альтернативной гипотезах. . Если наблюдается выборочное среднее значение 97 или выше, очень маловероятно, что оно получено из распределения, среднее значение которого равно 90. На предыдущем рисунке для H 0 : μ = 90 и H 1 : μ = 94, если мы Наблюдая, например, выборочное среднее значение 93, было бы не так ясно, было ли оно получено из распределения, среднее значение которого равно 90, или того, которое имеет среднее значение 94.


При разработке исследований большинство людей рассматривают степень вероятности 80% или 90% (точно так же, как мы обычно используем 95% в качестве уровня достоверности для оценок доверительного интервала). Входные данные для формул размера выборки включают желаемую мощность, уровень значимости и размер эффекта. Величина эффекта выбрана так, чтобы представить клинически значимой или практически важной разницы в интересующем параметре, как мы проиллюстрируем.

Формулы, которые мы представляем ниже, определяют минимальный размер выборки, чтобы гарантировать, что проверка гипотезы будет иметь указанную вероятность отклонения нулевой гипотезы, когда она ложна (т.е., указанная мощность). Планируя исследования, исследователи снова должны учитывать выбывание или потерю для последующего наблюдения. Формулы, показанные ниже, определяют необходимое количество участников с полными данными, и мы проиллюстрируем, как отсев участников решается при планировании исследований.


В исследованиях, в которых планируется провести проверку гипотезы, сравнивая среднее значение переменной непрерывного результата в одной популяции с известным средним значением, представляют интерес гипотезы:

H 0 : μ = μ 0 и H 1 : μ ≠ μ 0 где μ 0 — известное среднее значение (например,г., исторический контроль). Формула для определения размера выборки, чтобы гарантировать, что тест имеет заданную мощность, приведена ниже:

, где α — выбранный уровень значимости, а Z 1-α / 2 — значение из стандартного нормального распределения, удерживающего 1- α / 2 ниже него. Например, если α = 0,05, то 1- α / 2 = 0,975 и Z = 1,960. 1- β — это выбранная мощность, а Z 1-β — значение из стандартного нормального распределения, при котором 1- β ниже. Оценка размера выборки для проверки гипотез часто основана на достижении 80% или 90% мощности.Значения Z 1-β для этих популярных сценариев приведены ниже:

  • Для мощности 80% Z 0,80 = 0,84
  • Для мощности 90% Z 0,90 = 1,282

ES — это размер эффекта , определяемый следующим образом:

, где μ 0 — среднее значение для H 0 , μ 1 — среднее значение для H 1 , а σ — стандартное отклонение интересующего результата.Числитель величины эффекта, абсолютное значение разницы средних | μ 1 — μ 0 |, представляет собой то, что считается клинически значимым или практически важным различием в средствах. Подобно проблеме, с которой мы столкнулись при планировании исследований для оценки доверительных интервалов, иногда бывает трудно оценить стандартное отклонение. При вычислении размера выборки исследователи часто используют значение стандартного отклонения от предыдущего исследования или исследования, выполненного в другой, но сопоставимой совокупности.Независимо от того, как получается оценка изменчивости результата, она всегда должна быть консервативной (т.е. настолько большой, насколько это разумно), чтобы размер результирующей выборки не был слишком маленьким.

Пример 7:

Исследователь предполагает, что у людей, не страдающих диабетом, уровень глюкозы в крови натощак, фактор риска ишемической болезни сердца, выше у тех, кто пьет не менее 2 чашек кофе в день. Планируется перекрестное исследование для оценки среднего уровня глюкозы в крови натощак у людей, которые пьют не менее двух чашек кофе в день.Средний уровень глюкозы в крови натощак у людей, не страдающих диабетом, составляет 95,0 мг / дл со стандартным отклонением 9,8 мг / дл. 7 Если средний уровень глюкозы в крови у людей, выпивающих не менее 2 чашек кофе в день, составляет 100 мг / дл, это будет иметь клиническое значение. Сколько пациентов следует включить в исследование, чтобы убедиться, что мощность теста составляет 80% для выявления этой разницы? Будет использоваться двусторонний тест с уровнем значимости 5%.

Размер эффекта рассчитывается как:

.

Размер эффекта представляет собой значимую разницу в среднем генеральной совокупности — здесь 95 против 100 или 0,51 единицы стандартного отклонения. Теперь мы заменим размер эффекта и соответствующие значения Z для выбранного α и мощности, чтобы вычислить размер выборки.

Таким образом, выборка размером n = 31 гарантирует, что двусторонний тест с α = 0,05 будет иметь 80% мощность для обнаружения разницы в 5 мг / дл в средних уровнях глюкозы в крови натощак.

В запланированном исследовании участников попросят голодать в течение ночи и сдать образец крови для анализа уровня глюкозы.Основываясь на предыдущем опыте, исследователи предполагают, что 10% участников не будут голодать или откажутся соблюдать протокол исследования. Таким образом, в исследование будут включены в общей сложности 35 участников, чтобы обеспечить доступность 31 для анализа (см. Ниже).

N (число для включения) * (%, соблюдающие протокол) = желаемый размер выборки

Следовательно, N (число для включения) = желаемый размер выборки / (оставшийся%)

N = 31 / 0,90 = 35.


В исследованиях, в которых планируется провести проверку гипотезы, сравнивая долю успехов в переменной дихотомического результата в одной популяции с известной долей, представляют интерес гипотезы:

против

, где p 0 — известная пропорция (т.е.г., исторический контроль). Формула для определения размера выборки, чтобы гарантировать, что тест имеет заданную мощность, приведена ниже:

, где α — выбранный уровень значимости, а Z 1-α / 2 — значение из стандартного нормального распределения, удерживающего 1- α / 2 ниже него. 1- β — выбранная мощность, а Z 1-β — значение из стандартного нормального распределения, удерживающее 1- β ниже него, а ES — величина эффекта, определяемая следующим образом:

, где p 0 — это пропорция согласно H 0 , а p 1 — пропорция согласно H 1 .Числитель величины эффекта, абсолютное значение разницы в пропорциях | p 1 -p 0 |, снова представляет собой то, что считается клинически значимым или практически важным различием в пропорциях.

Пример 8:

Недавний отчет Фрамингемского исследования сердца показал, что 26% людей, не страдающих сердечно-сосудистыми заболеваниями, имели повышенный уровень холестерина ЛПНП, определяемый как ЛПНП> 159 мг / дл. 9 Исследователь предполагает, что более высокая доля пациентов с сердечно-сосудистыми заболеваниями в анамнезе будет иметь повышенный холестерин ЛПНП.Сколько пациентов следует обследовать, чтобы убедиться, что мощность теста составляет 90%, чтобы обнаружить разницу в 5% в пропорции с повышенным холестерином ЛПНП? Будет использоваться двусторонний тест с уровнем значимости 5%.

Сначала вычисляем размер эффекта:

Теперь мы подставляем размер эффекта и соответствующие значения Z для выбранного α и мощности, чтобы вычислить размер выборки.

Выборка размером n = 869 обеспечит двусторонний тест с α = 0.05 имеет 90% -ную мощность для обнаружения 5% -ной разницы в доле пациентов с сердечно-сосудистыми заболеваниями в анамнезе, которые имеют повышенный уровень холестерина ЛПНП.

Производитель медицинского оборудования производит имплантируемые стенты. В процессе производства приблизительно 10% стентов считаются дефектными. Производитель хочет проверить, не превышает ли доля дефектных стентов 10%. Если в результате процесса образуется более 15% дефектных стентов, необходимо предпринять корректирующие действия.Поэтому производитель хочет, чтобы тест имел мощность 90%, чтобы обнаруживать разницу в пропорциях такой величины. Сколько стентов необходимо оценить? Для расчетов используйте двусторонний тест с уровнем значимости 5%. (Проведите вычисления самостоятельно, прежде чем смотреть ответ.)

Ответ


В исследованиях, в которых планируется выполнить проверку гипотезы, сравнивая средние значения непрерывной переменной результата в двух независимых популяциях, интересными гипотезами являются:

против

, где μ 1 и μ 2 — средние значения в двух сравниваемых популяциях.Формула для определения размеров выборки для обеспечения заданной мощности теста:

, где n i — размер выборки, необходимый в каждой группе (i = 1,2), α — выбранный уровень значимости, а Z 1-α / 2 — значение из стандартного нормального распределения, содержащего 1- α / 2 под ним, и 1- β — выбранная мощность, а Z 1-β — значение из стандартного нормального распределения, удерживающего 1- β под ним. ES — размер эффекта, определяемый как:

где | μ 1 — μ 2 | — абсолютное значение разницы средних значений между двумя группами, ожидаемая согласно альтернативной гипотезе, H 1 .σ — стандартное отклонение интересующего результата. Напомним из модуля по проверке гипотез, когда мы выполняли тесты гипотез, сравнивая средние значения двух независимых групп, мы использовали Sp, объединенную оценку общего стандартного отклонения, как меру изменчивости результата.

Sp рассчитывается следующим образом:

Если доступны данные о вариабельности результата в каждой группе сравнения, то Sp можно вычислить и использовать для генерации размеров выборки.Однако чаще всего данные о вариабельности исходов доступны только по одной группе, обычно необработанной (например, контрольная группа плацебо) или группе, не подвергавшейся воздействию. При планировании клинического испытания нового препарата или процедуры часто доступны данные из других испытаний, которые могли включать плацебо или активную контрольную группу (т. Е. Стандартное лекарство или лечение, назначенное для исследуемого состояния). Стандартное отклонение переменной результата, измеренное у пациентов, отнесенных к группе плацебо, контрольной или неэкспонированной группе, можно использовать для планирования будущего исследования, как показано.

Также обратите внимание, что приведенная выше формула генерирует оценки размера выборки для выборок равного размера. Если планируется исследование, в котором будет назначено разное количество пациентов или разное количество пациентов будет составлять группы сравнения, тогда можно использовать альтернативные формулы (более подробную информацию см. В Howell 3 ).

Пример 9:

Исследователь планирует клиническое испытание для оценки эффективности нового препарата, предназначенного для снижения систолического артериального давления.План состоит в том, чтобы зарегистрировать участников и случайным образом распределить их для приема нового препарата или плацебо. Систолическое артериальное давление будет измеряться у каждого участника через 12 недель назначенного лечения. Основываясь на предыдущем опыте проведения подобных исследований, исследователь ожидает, что 10% всех участников будут потеряны для последующего наблюдения или выбыли из исследования. Если новый препарат показывает снижение среднего систолического артериального давления на 5 единиц, это будет представлять собой клинически значимое снижение. Сколько пациентов следует включить в исследование, чтобы убедиться, что мощность теста составляет 80% для выявления этой разницы? Будет использоваться двусторонний тест с уровнем значимости 5%.

Чтобы вычислить величину эффекта, необходима оценка вариабельности систолического артериального давления. Анализ данных Framingham Heart Study показал, что стандартное отклонение систолического артериального давления составило 19,0. Это значение можно использовать для планирования испытания.

Размер эффекта:

Теперь мы подставляем размер эффекта и соответствующие значения Z для выбранного α и мощности, чтобы вычислить размер выборки.

Образцы размером n 1 = 232 и n 2 = 232 гарантируют, что проверка гипотезы будет иметь мощность 80% для обнаружения разницы в 5 единиц среднего систолического артериального давления у пациентов, принимающих новый препарат, по сравнению с пациентами. получение плацебо.Однако исследователи выдвинули гипотезу о 10% отсеве (в обеих группах) и, чтобы обеспечить общий размер выборки 232, они должны учитывать отсев.

N (число для включения) * (% оставшихся) = желаемый размер выборки

Следовательно, N (число для включения) = желаемый размер выборки / (оставшийся%)

N = 232 / 0,90 = 258.

Исследователь должен набрать 258 участников, которые будут случайным образом распределены для приема нового препарата или плацебо.

Исследователь планирует исследование для оценки связи между потреблением алкоголя и средним баллом среди выпускников колледжа.План состоит в том, чтобы классифицировать студентов как сильно пьющих или не употребляющих 5 или более напитков в обычный день выпивки в качестве критерия алкоголя. Средние средние баллы будут сравниваться между учащимися, отнесенными к категории сильно пьющих, и не использующими две независимые выборки проверки средних значений. Предполагается, что стандартное отклонение средних баллов составляет 0,42, а значимая разница в средних баллах (относительно статуса потребления алкоголя) составляет 0,25 единицы. Сколько выпускников колледжа должны быть включены в исследование, чтобы убедиться, что мощность теста составляет 80% для определения 0.25 единиц разницы в среднем среднем балле? Используйте двусторонний тест с уровнем значимости 5%.

Ответ


В исследованиях, в которых планируется выполнить проверку гипотезы о средней разнице в непрерывной переменной результата на основе сопоставленных данных, представляют интерес гипотезы:

против

, где μ d — средняя разница в генеральной совокупности. Формула для определения размера выборки, чтобы гарантировать, что тест имеет заданную мощность, приведена ниже:

, где α — выбранный уровень значимости, а Z 1-α / 2 — значение из стандартного нормального распределения, удерживающего 1- α / 2 ниже него, 1- β — выбранная степень, а Z 1-β — значение стандартного нормального распределения, удерживающее 1- β ниже него, а ES — величина эффекта, определяемая следующим образом:

, где μ d — средняя разность, ожидаемая согласно альтернативной гипотезе, H 1 , а σ d — стандартное отклонение разницы d в результате (например,g., разница, основанная на измерениях с течением времени или разница между согласованными парами).

Пример 10:

Исследователь хочет оценить эффективность лечения иглоукалыванием для уменьшения боли у пациентов с хронической мигренью. Планируется набор пациентов, страдающих мигренью. Каждого перед тем, как назначить какое-либо лечение, попросят оценить серьезность боли, которую он испытывает при следующей мигрени.Боль будет регистрироваться по шкале от 1 до 100, причем более высокие баллы указывают на более сильную боль. Затем каждый пациент будет проходить курс лечения иглоукалыванием. При следующей мигрени (после лечения) каждого пациента снова попросят оценить степень тяжести боли. Разница в боли будет рассчитана для каждого пациента. Будет проведена двусторонняя проверка гипотезы при α = 0,05, чтобы оценить, существует ли статистически значимая разница в оценке боли до и после лечения. Сколько пациентов должно быть вовлечено в исследование, чтобы убедиться, что тест имеет мощность 80% для определения разницы в 10 единиц по шкале боли? Предположим, что стандартное отклонение разницы оценок составляет примерно 20 единиц.

Сначала вычислите размер эффекта:

Затем подставьте размер эффекта и соответствующие значения Z для выбранного α и мощности, чтобы вычислить размер выборки.

Выборка размером n = 32 пациента с мигренью гарантирует, что двухсторонний тест с α = 0,05 имеет 80% мощности для определения средней разницы в 10 баллов боли до и после лечения, при условии, что все 32 пациента завершили лечение. .


В исследованиях, в которых планируется провести проверку гипотезы, сравнивая пропорции успехов в двух независимых популяциях, представляют интерес гипотезы:

H 0 : p 1 = p 2 в сравнении с H 1 : p 1 ≠ p 2

, где p 1 и p 2 — пропорции в двух сравниваемых совокупностях.Формула для определения размеров выборки, чтобы гарантировать, что тест имеет заданную мощность, приведена ниже:

, где n i — размер выборки, необходимый в каждой группе (i = 1,2), α — выбранный уровень значимости, а Z 1-α / 2 — значение из стандартного нормального распределения, содержащего 1- α. / 2 под ним, и 1- β — выбранная мощность, а Z 1-β — значение из стандартного нормального распределения, удерживающего 1- β под ним. ES — величина эффекта, определяемая следующим образом:

,

где | p 1 — p 2 | — абсолютное значение разницы в пропорциях между двумя группами, ожидаемых в соответствии с альтернативной гипотезой, H 1 , а p — общая пропорция, основанная на объединении данных из двух групп сравнения (p можно вычислить, взяв среднее значение пропорций в двух группах сравнения, предполагая, что группы будут примерно одинакового размера).

Пример 11:

Исследователь выдвинул гипотезу о более высокой заболеваемости гриппом среди студентов, регулярно пользующихся спортивными сооружениями, чем среди их сверстников, которые этого не делают. Исследование будет проведено весной. Каждого ученика спросят, пользовались ли они спортивным сооружением регулярно в течение последних 6 месяцев и не болели ли они гриппом. Будет проведена проверка гипотезы для сравнения доли студентов, которые регулярно использовали спортивные сооружения и заболели гриппом, с долей студентов, которые этого не сделали и заболели гриппом.В течение обычного года примерно 35% студентов болеют гриппом. Исследователи считают, что увеличение заболеваемости гриппом на 30% среди тех, кто регулярно пользовался спортивным сооружением, было бы клинически значимым. Сколько студентов должно быть привлечено к исследованию, чтобы убедиться, что мощность теста составляет 80%, чтобы обнаружить эту разницу в пропорциях? Будет использоваться двусторонний тест с уровнем значимости 5%.

Сначала мы вычисляем величину эффекта, подставляя доли учащихся в каждой группе, у которых ожидается развитие гриппа, p 1 = 0.46 (т.е. 0,35 * 1,30 = 0,46) и p 2 = 0,35, а общая пропорция, p = 0,41 (т.е. (0,46 + 0,35) / 2):

Теперь мы подставляем размер эффекта и соответствующие значения Z для выбранного α и мощности, чтобы вычислить размер выборки.

Выборки размера n 1 = 324 и n 2 = 324 гарантируют, что проверка гипотезы будет иметь 80% -ную мощность для выявления 30% -ной разницы в пропорциях учащихся, заболевших гриппом, между теми, кто болеет, и не заболевает. регулярно пользоваться спортивными сооружениями.

Донорские фекалии? Действительно? Clostridium difficile (также называемая «C. difficile» или «C. diff.») Представляет собой бактериальный вид, который можно найти в толстой кишке человека, хотя его численность контролируется другой нормальной флорой толстой кишки. Антибактериальная терапия иногда снижает нормальную флору в толстой кишке до такой степени, что процветает C. difficile и вызывает инфекцию с симптомами, варьирующимися от диареи до опасного для жизни воспаления толстой кишки. Болезнь от C.difficile чаще всего поражает пожилых людей в больницах или учреждениях длительного ухода и обычно возникает после приема антибиотиков. В последние годы инфекции, вызванные C. difficile, стали более частыми, тяжелыми и трудно поддающимися лечению. По иронии судьбы, C. difficile сначала лечится путем прекращения приема антибиотиков, если они все еще назначаются. Если это не помогло, инфекцию вылечили путем перехода на другой антибиотик. Однако лечение другим антибиотиком часто не излечивает C.difficile. Были спорадические сообщения об успешном лечении путем вливания фекалий здоровых доноров в двенадцатиперстную кишку пациентов, страдающих C. difficile. (Юк!) Это восстанавливает нормальную микробиоту в толстой кишке и противодействует чрезмерному росту C. diff. Эффективность этого подхода была проверена в рандомизированном клиническом исследовании, опубликованном в Медицинском журнале Новой Англии (январь 2013 г.). Исследователи планировали случайным образом распределить пациентов с рецидивирующей инфекцией C. difficile либо на антибактериальную терапию, либо на дуоденальную инфузию донорских фекалий.Чтобы оценить размер необходимой пробы, исследователи предположили, что инфузия кала будет успешной в 90% случаев, а терапия антибиотиками будет успешной в 60% случаев. Сколько субъектов потребуется в каждой группе, чтобы гарантировать, что мощность исследования составляет 80% с уровнем значимости α = 0,05?

Ответ


Определение подходящего дизайна исследования более важно, чем статистический анализ; плохо спланированное исследование никогда нельзя спасти, тогда как плохо проанализированное исследование можно повторно проанализировать.Важнейшим компонентом дизайна исследования является определение подходящего размера выборки. Размер выборки должен быть достаточно большим, чтобы адекватно ответить на вопрос исследования, но не слишком большим, чтобы охватить слишком много пациентов, когда было бы достаточно меньшего. Определение подходящего размера выборки включает статистические критерии, а также клинические или практические соображения. Определение размера выборки требует совместной работы; Биостатисты должны работать в тесном сотрудничестве с клиническими исследователями, чтобы определить размер выборки, которая позволит решить интересующий вопрос исследования с достаточной точностью или мощностью для получения клинически значимых результатов.

В следующей таблице приведены формулы размера выборки для каждого описанного здесь сценария. Формулы организованы по предлагаемому анализу, оценке доверительного интервала или проверке гипотез.

Ситуация

Размер выборки до

Оценка доверительного интервала

Размер выборки для проверки гипотезы

Непрерывный результат,

Один образец:

CI для μ, H 0 : μ = μ 0

Непрерывный результат,

Два независимых образца:

CI для (μ 1 2 ), H 0 : μ 1 = μ 2

Непрерывный результат,

Два совпадающих образца:

CI для μ d , H 0 : μ d = 0

Дихотомический результат,

Один образец:

CI для p, H 0 : p = p 0

Дихотомический результат,

Два независимых образца:

CI для (p 1 -p 2 ), H 0 : p 1 = p 2


  1. Бушман Н.А., Фостер Дж., Викерс П.Девочки-подростки и их дети: достижение оптимальной массы тела при рождении. Гестационная прибавка в весе и исход беременности с точки зрения гестации при родах и массы тела при рождении: сравнение между подростками до 16 лет и взрослыми женщинами. Ребенок: уход, здоровье и развитие. 2001; 27 (2): 163-171.
  2. Feuer EJ, Wun LM. ДЕВКАН: Вероятность развития или смерти от рака. Версия 4.0 .Bethesda, MD: Национальный институт рака, 1999.
  3. Хауэлл, округ Колумбия. Статистические методы психологии.Бостон, Массачусетс: Duxbury Press, 1982.
  4. Fleiss JL. Статистические методы расчета ставок и пропорций. Нью-Йорк, штат Нью-Йорк: John Wiley and Sons, Inc., 1981.
  5. Национальный центр статистики здравоохранения. Здоровье, США, 2005 г., с диаграммой тенденций в области здоровья американцев. Хяттсвилл, Мэриленд: Типография правительства США; 2005.
  6. Пласкон Л.А., Пенсон Д.Ф., Воган Т.Л., Стэнфорд Дж.Л. Курение сигарет и риск рака простаты у мужчин среднего возраста. Биомаркеры и профилактика эпидемиологии рака.2003; 12: 604-609.
  7. Rutter MK, Meigs JB, Sullivan LM, D’Agostino RB, Wilson PW. С-реактивный белок, метаболический синдром и прогноз сердечно-сосудистых событий в исследовании Framingham Offspring Study. Тираж. 2004; 110: 380-385.
  8. Рамачандран В., Салливан Л.М., Уилсон П.В., Семпос, Т.Т., Сандстрем Дж., Каннел В.Б., Леви Д., Д’Агостино, РБ. Относительное значение пограничных и повышенных уровней факторов риска ишемической болезни сердца. Анналы внутренней медицины. 2005; 142: 393-402.
  9. Векслер Х., Ли Дж. Э., Куо М., Ли Х. Выпивка в колледже в 1990-е годы: постоянная проблема Результаты Гарвардской школы общественного здравоохранения, 1999, Здоровье колледжей, 2000; 48: 199-210.

Ответ на вопрос о массе тела при рождении — стр. 3

Исследователь хочет оценить средний вес при рождении доношенных детей (примерно 40 недель беременности) от матерей в возрасте 19 лет и младше. Средний вес новорожденных, рожденных доношенными от матерей в возрасте 20 лет и старше, составляет 3 510 граммов со стандартным отклонением 385 граммов.Сколько женщин в возрасте 19 лет и младше должны быть включены в исследование, чтобы гарантировать, что 95% -ный доверительный интервал оценки средней массы тела при рождении их младенцев имеет погрешность, не превышающую 100 граммов?

Чтобы гарантировать, что оценка среднего веса при рождении с доверительным интервалом 95% находится в пределах 100 граммов от истинного среднего, необходима выборка размером 57. При планировании исследования исследователь должен учитывать тот факт, что у некоторых женщин могут возникать преждевременные роды.Если женщины будут включены в исследование во время беременности, то необходимо будет включить в исследование более 57 женщин, чтобы после исключения преждевременных родов 57 женщин с информацией о результатах были доступны для анализа. Например, если ожидается, что 5% женщин родят преждевременно (т. Е. 95% родят доношенными), то необходимо включить 60 женщин, чтобы у 57 роды были доношенными. Количество женщин, которые должны быть зачислены, N, рассчитывается следующим образом:

N (количество участников) * (% оставшихся) = желаемый размер выборки

N (0.95) = 57

N = 57 / 0,95 = 60,

Ответ Курение первокурсников — Страница 4

Предположим, что подобное исследование было проведено 2 года назад и обнаружило, что распространенность курения среди первокурсников составляет 27%. Если исследователь считает, что это разумная оценка распространенности через 2 года, ее можно использовать для планирования следующего исследования. Используя эту оценку p, какой размер выборки необходим (при условии, что снова будет использоваться 95% доверительный интервал и нам нужен такой же уровень точности)?

Чтобы гарантировать, что оценка 95% доверительного интервала доли курящих первокурсников находится в пределах 5% от истинной доли, необходима выборка размером 303.Обратите внимание, что этот размер выборки существенно меньше, чем рассчитанный выше. Наличие некоторой информации о величине доли в генеральной совокупности всегда дает размер выборки, который меньше или равен тому, который основан на доле генеральной совокупности 0,5. Однако оценка должна быть реалистичной.

Ответ на проблему с медицинским устройством — страница 7

Производитель медицинского оборудования производит имплантируемые стенты. В процессе производства приблизительно 10% стентов считаются дефектными.Производитель хочет проверить, не превышает ли доля дефектных стентов 10%. Если в результате процесса образуется более 15% дефектных стентов, необходимо предпринять корректирующие действия. Поэтому производитель хочет, чтобы тест имел мощность 90%, чтобы обнаруживать разницу в пропорциях такой величины. Сколько стентов необходимо оценить? Для расчетов используйте двусторонний тест с уровнем значимости 5%.

Затем подставьте размер эффекта и соответствующие значения z для выбранных альфа и мощности, чтобы вычислить размер выборки.

Размер выборки из 364 стентов гарантирует, что двусторонний тест с α = 0,05 будет иметь мощность 90% для обнаружения 0,05 или 5% разницы в пропорции произведенных дефектных стентов.

Ответ на алкоголь и средний балл — страница 8

Исследователь планирует исследование для оценки связи между потреблением алкоголя и средним баллом среди выпускников колледжа. План состоит в том, чтобы классифицировать студентов как сильно пьющих или не употребляющих 5 или более напитков в обычный день выпивки в качестве критерия алкоголя.Средние средние баллы будут сравниваться между учащимися, отнесенными к категории сильно пьющих, и не использующими две независимые выборки проверки средних значений. Предполагается, что стандартное отклонение средних баллов составляет 0,42, а значимая разница в средних баллах (относительно статуса потребления алкоголя) составляет 0,25 единицы. Сколько выпускников колледжа должны быть включены в исследование, чтобы убедиться, что мощность теста составляет 80%, чтобы обнаружить разницу в 0,25 единицы в средних средних баллах? Используйте двусторонний тест с уровнем значимости 5%.

Сначала вычислите размер эффекта.

Теперь замените размер эффекта и соответствующие значения z на альфа и мощность, чтобы вычислить размер выборки.

Размер выборки n i = 44 сильно пьющих и 44, которые выпивают менее пяти напитков за обычный день, гарантирует, что проверка гипотезы будет иметь 80% -ную мощность для обнаружения разницы в 0,25 единицы средних средних баллов.

Ответ на донорские фекалии — страница 8

Сначала мы вычисляем величину эффекта, подставляя доли пациентов, которые, как ожидается, будут излечены при каждом лечении, p 1 = 0.6 и p 2 = 0,9, а общая пропорция p = 0,75:

Теперь мы заменяем размер эффекта и соответствующие значения Z на выбранные a и мощность, чтобы вычислить размер выборки.

Образцы размера n 1 = 33 и n 2 = 33 гарантируют, что проверка гипотезы будет иметь 80% -ную мощность для обнаружения этой разницы в долях пациентов, излечившихся от C. diff. инфузией кала по сравнению с терапией антибиотиками.

Фактически, исследователи включили по 38 в каждую группу, чтобы учесть отсев. Тем не менее, после промежуточного анализа исследование было остановлено. Из 16 пациентов в группе инфузии у 13 (81%) отмечалось исчезновение диареи, связанной с C. difficile, после первой инфузии. Остальным 3 пациентам была проведена вторая инфузия с фекалиями от другого донора с разрешением у 2 пациентов. Излечение C. difficile произошло только у 4 из 13 пациентов (31%), получавших антибиотик ванкомицин.

Оценка хорошего размера выборки для вашего исследования с помощью Power Analysis

Определение хорошего размера выборки для исследования всегда является важным вопросом. В конце концов, использование неправильного размера выборки может с самого начала обречь ваше исследование. К счастью, анализ мощности может найти ответ за вас. Анализ мощности сочетает в себе статистический анализ, знание предметной области и ваши требования, чтобы помочь вам получить оптимальный размер выборки для вашего исследования.

Статистическая мощность в проверке гипотез — это вероятность того, что проверка обнаружит эффект, который действительно существует. Как вы увидите в этом посте, исследования как с недостаточной, так и с избыточной мощностью являются проблематичными. Давайте узнаем, как найти подходящий размер выборки для вашего исследования!

Когда вы выполняете проверку гипотез, вы должны выполнить много предварительных планов, прежде чем собирать какие-либо данные. Это планирование включает определение данных, которые вы будете собирать, способы их сбора и способы измерения, а также многие другие детали.Важнейшей частью планирования является определение того, сколько данных вам нужно собрать. Я покажу вам, как оценить размер выборки для вашего исследования.

Прежде чем мы перейдем к оценке требований к размеру выборки, давайте рассмотрим факторы, влияющие на статистическую значимость. Этот процесс поможет вам увидеть ценность формального анализа мощности и размера выборки, а не гадания.

Связанное сообщение : 5 шагов для проведения научных исследований со статистическим анализом

Факторы, имеющие статистическую значимость

Посмотрите на таблицу ниже и определите, какое исследование показало реальный лечебный эффект, а какое нет.В каждом исследовании разница между экспериментальной группой и контрольной группой является выборочной оценкой величины эффекта.

Дало ли какое-либо исследование значимые результаты? Предполагаемые эффекты в обоих исследованиях могут представлять либо реальный эффект, либо случайную ошибку выборки. У вас недостаточно информации, чтобы принять такое решение. Эти соображения учитываются при проверке гипотез, чтобы определить, являются ли результаты статистически значимыми.

  • Размер эффекта : Чем больше размер эффекта, тем меньше вероятность того, что это случайная ошибка.Ясно, что исследование A демонстрирует более существенный эффект в выборке, но этого недостаточно.
  • Размер выборки : большие размеры выборки позволяют проверкам гипотез обнаруживать меньшие эффекты. Если размер выборки исследования B достаточно велик, его более скромный эффект может быть статистически значимым.
  • Вариабельность : Когда данные вашей выборки имеют большую изменчивость, случайная ошибка выборки с большей вероятностью приведет к значительным различиям между экспериментальными группами, даже если нет реального эффекта.Если выборочные данные в исследовании A имеют достаточную изменчивость, случайная ошибка может быть причиной большой разницы.

Проверка гипотез берет всю эту информацию и использует ее для вычисления p-значения, которое вы используете для определения статистической значимости. Ключевой вывод состоит в том, что статистическая значимость любого эффекта в совокупности зависит от размера эффекта, размера выборки и изменчивости, присутствующей в данных выборки. Следовательно, вы не можете определить хороший размер выборки в вакууме, потому что три фактора взаимосвязаны.

Связанное сообщение : Как работают проверки гипотез

Статистическая мощность проверки гипотез

Поскольку мы говорим об определении размера выборки для исследования, которое еще не проводилось, вам необходимо узнать о четвертом соображении — статистической мощности. Статистическая мощность — это вероятность того, что проверка гипотезы правильно сделает вывод о существовании эффекта выборки в популяции. Другими словами, тест правильно отвергает ложную нулевую гипотезу. Следовательно, мощность обратно пропорциональна ошибке типа II.Мощность = 1 — β. Мощность теста зависит от трех других факторов.

Например, если у вашего исследования 80% мощности, у него есть 80% шанс обнаружить существующий эффект. Пусть этот момент станет напоминанием о том, что при работе с семплами ничего не гарантируется! Когда эффект действительно существует в популяции, ваше исследование может не обнаружить его, потому что вы работаете с выборкой. Выборки содержат ошибку выборки, которая иногда может приводить к искажению генеральной совокупности случайной выборкой.

Связанное сообщение : Типы ошибок при проверке гипотез

Цели анализа мощности и размера выборки

Анализ мощности включает в себя учет этих трех соображений, добавление знаний в предметной области и управление компромиссами для определения размера выборки.Во время этого процесса вы должны в значительной степени полагаться на свой опыт, чтобы предоставить разумные оценки входных значений.

Power Analysis помогает найти важный компромисс. По мере увеличения размера выборки проверка гипотез приобретает большую способность обнаруживать небольшие эффекты. Эта ситуация звучит великолепно. Однако большие размеры выборки стоят больше денег. И есть момент, когда эффект становится настолько незначительным, что становится бессмысленным в практическом смысле.

Вы не хотите собирать большие и дорогие образцы только для того, чтобы иметь возможность обнаружить эффект, который слишком мал, чтобы быть полезным! Вы также не хотите недостаточно мощного исследования, которое имеет низкую вероятность обнаружения важного эффекта.Ваша цель — собрать достаточно большой образец, чтобы иметь достаточную мощность для обнаружения значимого эффекта, но не слишком большой, чтобы быть расточительным.

Как вы увидите в следующих примерах, аналитик предоставляет числовые значения, которые соответствуют «хорошей вероятности» и «значимому эффекту». Эти значения позволяют адаптировать анализ к вашим потребностям.

Все эти детали могут показаться сложными, но статистический анализ мощности помогает вам управлять ими. Фактически, выполнение этой процедуры заставляет вас сосредоточиться на соответствующей информации.Обычно вы указываете три из четырех факторов, описанных выше, а ваше статистическое программное обеспечение вычисляет оставшееся значение. Например, если вы укажете наименьший размер практически значимого эффекта, вариабельность и мощность, программа вычислит требуемый размер выборки.

Давайте рассмотрим несколько примеров в различных сценариях, чтобы воплотить это в жизнь.

Анализ мощности t-критерия для двух выборок для размера выборки

Предположим, мы проводим t-тест с двумя выборками, чтобы определить, какой из двух материалов прочнее.Если один тип материала значительно прочнее другого, мы будем использовать этот материал в нашем процессе. Кроме того, мы проверили эти материалы в пилотном исследовании, которое дает базовые знания для оценок.

При анализе мощности и размера выборки статистическое программное обеспечение представляет диалоговое окно примерно следующего вида:

Мы рассмотрим эти поля одно за другим. Во-первых, мы оставим поле Sample sizes пустым, потому что мы хотим, чтобы программа вычисляла это значение.

Отличия

Значение

«Различия» часто сбивает с толку. Не пытайтесь угадать разницу между двумя типами материала. Вместо этого используйте свой опыт, чтобы определить наименьшее отличие, которое все еще имеет значение для вашего приложения. Другими словами, вы считаете меньшие различия несущественными. Не стоит тратить ресурсы на их обнаружение.

Тщательно выбирая это значение, вы адаптируете эксперимент так, чтобы он имел разумные шансы обнаружить полезные различия, позволяя при этом более мелкие, бесполезные различия оставаться потенциально необнаруженными.Это значение помогает предотвратить сбор излишне большой выборки.

В нашем примере мы введем 5, потому что меньшие различия не важны для нашего процесса.

Значения мощности

Значения мощности — это то место, где мы указываем вероятность того, что проверка статистической гипотезы обнаружит различие в выборке, если это различие существует в генеральной совокупности. В этом поле вы определяете «разумный шанс», о котором я упоминал ранее. Если вы сохраните другие входные значения постоянными и увеличите мощность теста, требуемый размер выборки также увеличится.Правильное значение для ввода в это поле зависит от норм в изучаемой области или отрасли. Общие значения мощности 0,8 и 0,9.

Мы введем степень 0,9, чтобы t-критерий с двумя выборками имел 90% -ную вероятность обнаружения разницы, равной 5.

Стандартное отклонение

Стандартное отклонение — это поле, в которое мы вводим изменчивость данных. Нам нужно ввести оценку стандартного отклонения прочности материала. Аналитики часто основывают эти оценки на пилотных исследованиях и данных исторических исследований.Ввод более точных оценок изменчивости даст более надежные результаты анализа мощности. Следовательно, вы должны стремиться улучшать эти оценки с течением времени по мере выполнения дополнительных исследований и тестирования. Обеспечение хороших оценок стандартного отклонения часто является самой сложной частью анализа мощности и размера выборки.

В нашем примере мы предположим, что два типа материала имеют стандартное отклонение в 4 единицы прочности. После того, как мы нажимаем ОК, мы видим результат

Связанное сообщение : Меры изменчивости

Интерпретация результатов статистического анализа мощности и размера выборки

Анализ статистической мощности и размера выборки обеспечивает числовые и графические результаты, как показано ниже.

Текстовый вывод указывает, что нам нужно 15 образцов на группу (всего 30), чтобы иметь 90% шанс обнаружения разницы в 5 единиц.

Точка на кривой мощности соответствует информации в текстовом выводе. Однако, изучая весь график, мы можем узнать дополнительную информацию о том, как статистическая мощность зависит от разницы. Если мы начнем с точки и спустимся вниз по кривой до разницы 2,5, мы узнаем, что тест имеет мощность примерно 0.4 (40%). Эта мощность слишком мала. Однако мы указали, что различия менее 5 практически не имеют значения для нашего процесса. Следовательно, наличие низкой мощности для обнаружения разницы в 2,5 не является проблемой.

И наоборот, проследите кривую вверх от точки и обратите внимание, как мощность быстро увеличивается почти до 100%, прежде чем мы достигнем разницы в 6. Эта конструкция удовлетворяет требованиям процесса при использовании управляемого размера выборки 15 на группу.

Другие варианты анализа мощности

Теперь давайте рассмотрим еще несколько вариантов, доступных для анализа мощности.На этот раз мы воспользуемся односторонним тестом, и программа рассчитает значение, отличное от размера выборки.

Предположим, мы снова сравниваем прочность двух типов материала. Однако в этом сценарии мы в настоящее время используем один вид материала и рассматриваем возможность перехода на другой. Мы перейдем на новый материал только в том случае, если он будет прочнее нашего текущего материала. Опять же, самая маленькая разница в силе, которая имеет значение для нашего процесса, составляет 5 единиц. Стандартное отклонение в этом исследовании теперь составляет 7.Далее, предположим, что наша компания использует стандартный размер выборки, равный 20, и нам необходимо одобрение, чтобы увеличить его до 40. Поскольку стандартное отклонение (7) больше, чем наименьшее значимое различие (5), нам может потребоваться более крупная выборка.

В этом сценарии тест должен только определить, прочнее ли новый материал, чем текущий. Следовательно, мы можем использовать односторонний тест. Этот тип теста обеспечивает большую статистическую мощность, чтобы определить, прочнее ли новый материал, чем старый, но не дает возможности определить, прочнее ли текущий материал, чем новый, что приемлемо с учетом требований нового сценария.

В этом анализе мы введем два возможных значения для размеров выборки и оставим поля «Значения мощности» пустыми. Программное обеспечение оценит мощность теста для обнаружения разницы в 5 для дизайнов с 20 и 40 образцами на группу.

Заполняем диалоговое окно следующим образом:

И в Опции мы выбираем следующий односторонний тест:

Интерпретация результатов мощности и размера выборки

Выходные статистические данные показывают, что план с 20 образцами на группу (всего 40) имеет ~ 72% шанс обнаружения разницы, равный 5.Обычно эта мощность считается слишком низкой. Однако схема с 40 образцами на группу (всего 80) дает мощность ~ 94%, что почти всегда приемлемо. Будем надеяться, что анализ мощности убедит руководство одобрить больший размер выборки.

Оцените график кривой мощности, чтобы увидеть, как мощность изменяется в зависимости от разницы. Например, кривая для размера выборки, равного 20, показывает, что меньшая конструкция не обеспечивает 90% мощности, пока разница не составит примерно 6,5. Если увеличение размера выборки действительно непозволительно с точки зрения затрат, возможно, можно принять 90% -ную мощность для разницы в 6.5, а не 5, является приемлемым. Используйте свои знания о процессе, чтобы принять такое решение.

Использование анализа мощности для оценки размера выборки для всех исследований

На протяжении всего поста мы рассматривали непрерывные данные и, в частности, использовали двухвыборочный t-критерий. Для непрерывных данных вы также можете использовать анализ мощности для оценки размеров выборки для планов ANOVA и DOE. Кроме того, существуют тесты гипотез для других типов данных, например, тесты пропорций (биномиальные данные) и частоты встречаемости (данные Пуассона).У этих тестов есть собственная соответствующая мощность и анализ образцов.

В целом, когда вы переходите от непрерывных данных к этим другим типам данных, ваши требования к размеру выборки возрастают. И в каждом есть свои уникальные нюансы. Например, в тесте пропорций вам нужен относительно больший размер выборки, чтобы обнаружить разницу, когда ваша доля ближе 0 или 1, чем если она находится в середине (0,5). Многие факторы могут повлиять на оптимальный размер выборки. Анализ мощности поможет вам справиться с этими проблемами.

После прочтения этого поста, я надеюсь, вы увидите, как анализ мощности объединяет статистический анализ, знания предметной области и ваши требования, чтобы помочь вам получить оптимальный размер выборки для ваших конкретных нужд. Если вы не проведете этот анализ, вы рискуете провести исследование, которое либо упустит важный эффект, либо будет иметь непомерно большой размер выборки. Я написал сообщение об эксперименте «Разрушители легенд», в котором не было возможности обнаружить эффект, потому что они угадывали размер выборки вместо проведения анализа мощности.

В этом посте я сосредоточился на том, как мощность влияет на способность вашего теста обнаруживать реальный эффект. Однако тесты с низким энергопотреблением также преувеличивают величину эффекта!

Наконец, экспериментирование — это итеративный процесс. По мере того, как вы проводите больше исследований в той или иной области, вы получите более точные оценки, которые будут использоваться при анализе мощности и размера выборки, и получите более четкое представление о том, как действовать дальше.

Связанные

Проведение энергетических расчетов | Лаборатория действий Абдул Латифа Джамиля по борьбе с бедностью

С учетом этих ключевых принципов мы теперь предоставляем более подробную информацию о каждом этапе процесса, включая сбор необходимой информации, знакомство с концепцией статистической власти для партнеров, выполнение расчетов «на заднем плане», принятие решения о том, следует ли продолжать, уточнение расчетов. и, в конечном итоге, решить, проводить ли исследование.

Сбор данных для расчета мощности

Партнер-исполнитель может быть ключевым источником исходных данных для расчетов мощности. Некоторые исходные данные, такие как максимальный размер выборки, относящаяся к политике или программе MDE и возможная единица наблюдения, могут быть получены только путем обсуждения этих параметров с партнером. Приблизительные оценки других исходных данных, таких как среднее значение и дисперсия ключевых результатов, коэффициент использования и внутрикластерная корреляция, можно найти в предыдущих исследованиях или общедоступных данных.Если они доступны, данные или сводная статистика по текущим операциям партнера или из источников данных, которые будут использоваться в окончательном анализе, могут быть предпочтительнее.

Первоначальные расчеты

  • Выполняйте вычисления с наилучшими легкодоступными данными . На ранних этапах избегайте увязаний в поисках доступа к закрытым данным. После того, как предложенный проект пройдет базовую проверку выполнимости, можно будет искать механизмы доступа к данным и обновлять расчеты мощности с учетом новых данных.Перед этим рассмотрите возможность использования:
    • Сводная статистика из существующей литературы — экспериментальные и неэкспериментальные академические исследования или отчеты государственных или некоммерческих организаций могут быть полезны для оценки того, какой размер эффекта будет реалистичным.
    • Опубликованные данные, например:
  • Выполните анализ чувствительности для ключевых допущений — например, как это будет выглядеть, если размер выборки увеличится или уменьшится на порядок. Что, если результативность вдвое меньше, чем вы ожидали? Или если внутрикластерная корреляция существенно выше или ниже? Проверьте, как мощность изменяется при изменении любых критических предположений.Но остерегайтесь убывающей отдачи — расчеты мощности наиболее полезны для оценки порядка величины.
  • Возможно, вам не потребуется искать данные для каждого «ингредиента» для выполнения расчетов мощности . Из анализа чувствительности вы узнаете, какие входы имеют наибольшее влияние на мощность. Сосредоточьте усилия команды на поиске точных оценок наиболее важных входных данных.
  • Рассмотрим как аналитические методы, так и методы моделирования . Моделированные расчеты особенно полезны для более сложных планов исследований (McConnell and Vera-Hernandez 2015).Имея хорошие данные об исследуемой популяции, их также можно использовать для расчета смоделированных доверительных интервалов вокруг нулевых эффектов или в расчетах мощности для небольшой выборки, где некоторые параметрические предположения о распределениях вероятностей могут не выполняться.
  • Использовать существующий код . J-PAL создал шаблон кода Stata и обучающее упражнение как для аналитических, так и для симуляционных методов, которые можно скачать здесь в виде zip-файла, а EGAP предоставляет код для проведения симуляций на R (Coppock 2013).В блоге Stata есть полезный пост о вычислении мощности с использованием моделирования Монте-Карло (Huber 2019).
  • Рассмотрите программное обеспечение, которое поможет вам визуализировать взаимосвязь между размером выборки и минимальным обнаруживаемым эффектом . Это может быть полезно для передачи расчетов партнерам. См., Например:

Принятие решения

После выполнения начальных расчетов выделите время для звонка или встречи с партнером по исследованию, чтобы обсудить результаты расчетов и вместе решить, имеет ли смысл продолжать исследование.

  • Просмотрите числа, которые входят в оценку . Уточните, какие исходные данные являются вашими предположениями, а какие основаны на программной информации. Поскольку партнеры-исполнители досконально знают программу и контекст, они могут использовать эту информацию, чтобы предлагать творческие способы усиления власти.
  • Убедитесь, что вы и ваш партнер понимаете издержки и преимущества продолжения исследования, если исследование будет недостаточно эффективным. . Риски недостаточной оценки значительно превышают риск потратить время и ресурсы на исследование, которое может не принести полезной информации.Недостаточно эффективные оценки несут серьезные риски для партнеров-исполнителей. Недостаточно мощное исследование, которое не обнаруживает значительного эффекта, может быть неверно истолковано как программа, не имеющая никакого эффекта, что может привести к (возможно, ошибочным) выводам организаций-исполнителей или спонсоров, что программа неэффективна и ее следует прекратить. 2
  • Принимаем решение вместе . В конце разговора или встречи обсудите дальнейшие действия. Вы можете совместно решить:
    • Для прекращения дальнейших дискуссий — возможно, потенциальный размер выборки на несколько порядков слишком мал, чтобы можно было определить значимый эффект, или изменения в дизайне исследования, которые потребуются для достижения достаточной мощности, неосуществимы с эксплуатационной точки зрения или слишком дороги.Это трудное решение, но в конечном итоге для всех сторон лучше начать этот разговор заранее, чем тратить время на разработку исследования, которое вряд ли будет продолжено. Это может быть возможностью обсудить, есть ли другие потенциальные вопросы, которые вы и ваш партнер могли бы изучить.
    • Продолжить обсуждение — возможно, исследование выглядит многообещающим, но, исходя из первоначальных расчетов, все еще не ясно, будет ли оно достаточно мощным. Вы можете решить продолжить итерацию дизайна исследования и / или расчетов мощности, прежде чем принимать решение о продолжении.
    • Чтобы продолжить исследование — вы можете совместно решить, что, основываясь на ваших предположениях и расчетах, исследование, вероятно, будет иметь достаточную мощность. Если предположения или план исследования значительно изменятся, вы все равно можете продолжить уточнение расчетов мощности.

Уточнить вычисления

Если исследование выглядит многообещающим, но на основе первоначальных расчетов все еще не ясно, будет ли оно достаточно мощным, исследовательские группы могут обсудить детали дизайна исследования с партнером по исследованию. 3 На этом этапе есть две ключевые ситуации, в которых уточнения могут быть особенно полезными.

  1. Оценка влияния проектных решений на мощность . Существенные изменения в дизайне по сравнению с тем, что предполагалось в первоначальных расчетах — например, изменение количества лечебных групп, изменение процессов приема (которые могут повлиять на прием), изменение единицы рандомизации или решение, что вам необходимо выявить влияние на определенные подгруппы — должны информировать и получать информацию об оценках статистической мощности.
  2. Получение более точных оценок ключевых входных данных . Если исследование прошло базовое технико-экономическое обоснование, но были исходные данные первого порядка, для которых вы не смогли найти удовлетворительные оценки для начальных расчетов мощности, возможно, стоит поискать дополнительные данные для уточнения оценок мощности. Рассмотрите возможность запроса подробных операционных данных у партнера или запроса закрытых опросов или административных данных у третьей стороны.

Имеется убывающая предельная отдача от расчетов мощности нефтепереработки.Если первоначальные расчеты были удовлетворительными, уточнения могут быть минимальными или вообще не потребоваться. Однако, если следующие моменты не были учтены при первоначальных расчетах, их следует учесть перед принятием окончательных проектных решений:

  • Определите первичные и вторичные исходы, которые необходимо выявить в исследовании, и проведите расчеты по всем исходам.
  • Если план исследования включает несколько рук, сделайте каждое попарное сравнение. Если, например, контрольная группа будет сравниваться с двумя разными видами лечения, убедитесь, что контрольная группа достаточно велика, чтобы иметь мощность для наименьшего MDE среди двух сравнений, и, при желании, чтобы исследование было мощным, чтобы различать значимые различия. между двумя группами лечения.
  • Если рандомизация будет кластеризованной, убедитесь, что вычисления мощности включают оценки внутрикластерной и межкластерной дисперсии выходной переменной.

После уточнения расчетов мощности вы можете совместно решить, что исследование нецелесообразно, и прекратить обсуждение. В качестве альтернативы, если исследовательская группа удовлетворена тем, что исследование будет иметь достаточную мощность, а партнер по исследованию удовлетворен тем, что выбранный MDE имеет для него значение, вы можете совместно решить сделать шаг и начать исследование. 4

Видео с расчетами анализа мощности

| Калькулятор анализа мощности

Описание:

Здесь мы наглядно продемонстрируем, как рассчитывается мощность для одностороннего T-теста с одной выборкой. Мы предположим, что данные следуют нормальному распределению со стандартным отклонением сигмы для этой демонстрации.
Начнем с нулевой и альтернативной гипотез.

Если нулевая гипотеза верна, распределение значений выглядит следующим образом.Если альтернативная гипотеза верна, распределение значений зависит от истинного среднего.

Если берется выборка размера n, распределение возможных средних из выборки может быть построено, предполагая, что либо нулевая гипотеза верна, либо предполагая, что среднее значение является ненулевым значением.

Статистикой теста для этого теста является T-статистика, которая основана на среднем значении и имеет известное распределение, которое, в свою очередь, позволяет присваивать вероятности, соответствующие его различным значениям.

При нулевой гипотезе t-статистика следует центральному t-распределению.

Для этого одностороннего теста конкретное значение t отсечки соответствует желаемому альфа-уровню. Значения t-статистики, которые больше этого значения, приводят к p-значениям, которые меньше альфа. Это значение t отсечки определяет область отклонения. Вероятность ошибки 1-го типа, то есть отклонения нулевой гипотезы, если она верна, равна альфа. Это пороговое значение t остается неизменным, независимо от истинного значения среднего.Согласно альтернативной гипотезе t-статистика следует нецентральному t-распределению с параметром нецентральности, который основан на разнице истинного среднего от нулевого среднего, стандартном отклонении и размере выборки.

Видно, что параметр нецентральности увеличивается по мере увеличения разницы средних, увеличения размера выборки или уменьшения стандартного отклонения.

Если мы наложим конкретное нецентральное t-распределение на центральное t-распределение с его определенной областью отклонения, мы можем увидеть вероятность отклонения нулевой гипотезы, когда она ложна, для данного среднего значения, стандартного отклонения и размера выборки.Эта вероятность и есть сила теста.
С увеличением параметра нецентральности мощность увеличивается.

Опять же, параметр нецентральности становится больше по мере увеличения размера выборки, уменьшения стандартного отклонения или увеличения разницы между истинным средним и нулевым средним. Поскольку исследователи редко могут контролировать истинное среднее значение или стандартное отклонение, они могут только увеличивать или уменьшать мощность, увеличивая или уменьшая размер выборки. Используя соответствующие формулы, можно найти соответствующий размер выборки для любой желаемой мощности.

Расчет мощности — методы @ манчестер — Манчестерский университет

Стив Робертс, Центр биостатистики

Что такое расчеты мощности и размера выборки?

Выбор подходящего размера для экспериментального исследования является одним из основных компонентов в дизайне любого исследования. Исследование должно быть достаточно большим, чтобы иметь приемлемый шанс ответить на вопрос исследования, но не больше, чем необходимо.

Для исследований с явными заранее заданными гипотезами в принципе возможно оценить вероятность того, что исследование заданного размера ответит на вопрос — мощность исследования — и многие рецензенты, спонсоры и комитеты по этике просят такие расчеты.

Хотя расчеты мощности могут быть полезны, они не являются панацеей. Параметры, необходимые для оценки мощности исследования, редко известны с большой точностью. Любой дизайн исследования — это компромисс между получением информации и практическими ограничениями во времени, доступностью участников или образцов и финансированием.

Расчет мощности

становится частью итеративного диалога, который приводит в конечном итоге к компромиссному плану исследования, а рассмотрение неопределенности допущений и их влияния способствует пониманию устойчивости проекта. Для эксперимента не существует подходящего размера.

Расчеты мощности часто не подходят — может не быть простой гипотезы (например, в исследовании распространенности или пилотном исследовании), или для ранней стадии работы может не быть информации, на которой можно было бы основывать расчет мощности.

После того, как вы согласовали свой компромисс, вам необходимо сообщить свои рассуждения и обосновать свой выбор, и расчеты мощности являются частью (но только частью) этого обоснования.

Ресурсы

Люди

Ваш дружелюбный местный статистик — это тот человек, с которым можно поговорить. Для сложных проектов вам необходимо найти хорошего сотрудника по статистике, который разбирается в вашем конкретном приложении.

PDF слайды

Скачать слайды презентации «Что такое расчет мощности?» В формате PDF.

Как определить размер вашей выборки, когда вычислить мощность непросто

Д-р Саймон Бейт из отдела статистических наук, GSK, является экспертом в области экспериментального планирования и автором книги Дизайн и статистический анализ экспериментов на животных .Недавно он был удостоен награды 2018 за выдающиеся достижения в фармацевтической промышленности за «Повышение качества и надежности исследований на животных за счет использования InVivoStat: пакета статистического программного обеспечения для исследователей животных». В этом сообщении в блоге доктор Бейт отвечает на несколько назойливых вопросов о статистике и 3Р, с которыми он регулярно сталкивается.

Мне чаще всего задают вопрос (не считая этих надоедливых выбросов): «Какой размер выборки подходит для моего эксперимента?».Это извечный вопрос, который является основополагающим при применении 3R в исследованиях на животных. Если используется слишком мало животных, научная обоснованность эксперимента и надежность результатов будут поставлены под сомнение. Если используется слишком много животных, увеличивается риск получения ложноположительного заключения (декларируются статистически значимые эффекты, не имеющие практического значения), не говоря уже об этических вопросах. Многие спонсоры и журналы теперь требуют информации о том, как были выбраны размеры выборки, что является действительно важным шагом.

Выделив вопросы, которые мне часто задают, я рассмотрю несколько вариантов, доступных исследователю на животных.

Как описано на информационных страницах EDA, следующие параметры принимаются во внимание при выполнении расчета мощности для определения размера выборки:

  • Размер интересующего вас эффекта (или «сигнала», который исследователь должен определить).
  • Риск ложного срабатывания (или порог значимости, обычно установленный на уровне 5%).
  • Статистическая мощность (или способность обнаружить истинный эффект).
  • Вариабельность ваших данных — чем больше вариативность ваших данных, тем больше животных вам понадобится, поэтому стоит потратить время на то, чтобы подумать о своем эксперименте / статистическом анализе, чтобы увидеть, сможете ли вы определить способы уменьшения вариабельности.
1. В моей области исследований мы всегда использовали n = 6. Зачем мне вообще нужно делать расчет мощности?

Я часто слышу «мы всегда используем n = 6» или «другие исследователи используют n = 6, и мы тоже».Излишне говорить, что это не рекомендуемый подход. Вы не можете просто скопировать чужие размеры выборки; вам необходимо оценить изменчивость данных, полученных в вашей лаборатории, в условиях ваших экспериментов и с использованием ваших протоколов. Даже если ваш руководитель или менеджер говорит «используйте n = 6», не забудьте задать им вопросы и убедитесь, что это подходит!

Тем не менее, предыдущие эксперименты из других лабораторий с использованием той же модели животных могут предоставить полезные данные, на которых можно основывать оценку изменчивости. В идеальном мире у вас будет представление об изменчивости ваших данных, возможно, из пилотного исследования или другой работы, недавно проделанной в вашей лаборатории, а также представление о величине эффекта, который вы считаете биологически значимым.Если у вас нет никаких данных, то, возможно, вы сможете получить общее представление из литературы. Недавно авторы начали описывать свои аргументы в пользу используемых размеров выборки, и я думаю, что это придает больше уверенности читателю, просматривающему их работы. При цитировании результатов оценки размера выборки всегда следует указывать использованную оценку изменчивости.

Кривые мощности — полезный визуальный инструмент для оценки размера выборки и мощности для различных биологически значимых эффектов.Их можно легко создать в модуле анализа мощности InVivoStat. На рисунке ниже видно, что для достижения статистической мощности 80% (ось Y), где величина эффекта представляет собой абсолютное изменение размера 3 (зеленая линия), потребуется n = 8 животных ( чтение до оси X).

Если размер эффекта, который вы хотите обнаружить, представляет собой абсолютное изменение менее 2 (синяя линия), невозможно будет правильно провести эксперимент. В этом случае вам не следует проводить эксперимент, а следует изучить способы уменьшения вариабельности модели на животных.

Помните, что эти кривые мощности основаны на оценке изменчивости, которая может быть или не быть надежной. Я всегда советую исследователям заново генерировать этот график, используя более свежую оценку изменчивости, полученную на основе данных завершенных ими исследований. Эти новые графики не следует использовать для проведения «апостериорного анализа мощности», но сравнение исходных кривых мощности с новыми даст вам представление о том, насколько надежным был исходный анализ мощности. Теоретически, если кривые мощности надежны, то всякий раз, когда вы получаете новые данные, вы всегда должны получать похожий график.

2. Хорошо, как мне выбрать размер эффекта?

Мне часто задают этот вопрос при исследовании размера выборки. На этот вопрос сложно ответить, но я думаю, вы должны иметь некоторое представление о масштабе ожидаемого эффекта, прежде чем начать! Вам не нужно останавливаться на одном значении (как показано на графике выше), но вам нужен подходящий диапазон. Я начинаю с вопроса:

a) Какой наименьший эффект может иметь биологическое значение?

b) Какого наибольшего эффекта ожидается при тестировании положительного контроля на животной модели?

Это дает нам рабочий диапазон, который можно уменьшить и настроить.

При принятии решения о величине эффекта, который будет иметь биологическое значение, необходимо задать один ключевой вопрос: какой минимальный эффект мне нужно увидеть, чтобы считать его целесообразным продолжить в дальнейших исследованиях?

Например, если вы исследуете лекарство, улучшающее симптомы, на модели инсульта, вас может заинтересовать только изменение, по крайней мере, на 30%, потому что это уровень защиты, обеспечиваемый лекарствами в клинике, поэтому как исследователь вы заинтересованы только в в процедурах, которые имеют больший эффект.

Или, скажем, вы планируете заглушить ген с помощью РНКи — сначала вам нужно решить, какая эффективность будет удовлетворительной. Будет ли нокдауна, скажем, 50% достаточно для получения биологического эффекта, или вам нужно стремиться к эффективности 90%? Полезно иметь справочную информацию о гене и его распространенности, функции, времени оборота продукта гена, других генных продуктах, которые могут иметь перекрывающиеся функции, и т. Д.

3. Что делать, если у меня нет

каких-либо оценок изменчивости из предыдущего эксперимента?

Приведенные выше подходы полагаются на то, что вы имеете представление об изменчивости ваших данных.Если исторические данные недоступны, можно использовать литературу для оценки изменчивости на основе аналогичных экспериментов или моделей. Однако вы должны проявлять особую осторожность, поскольку небольшие изменения в экспериментальных процедурах могут вызвать неожиданно большие изменения в вариабельности. Если нет информации для обоснования вашего экспериментального плана, то есть альтернативы, например d Коэна — стандартизированный размер эффекта, который можно использовать вместо него. Существуют определенные правила использования метода d Коэна, который обычно не так точен, как использование данных измерений.Для получения дополнительной информации об этом см. Этот раздел, посвященный изменчивости.

4. Что, если в моем эксперименте есть 20 критериев результата?

Многие эксперименты на животных дают несколько ответов, поскольку мы хотим получить максимум информации из одного эксперимента. Например, мы могли бы измерять маркеры воспаления, такие как хемокины, цитокины, CRP, IL-1, IL-4, IL-6, IL-10, TNF-α, TGFb, ICAM-1, IFN-γ и т. Д. . в то же время. Однако каждый ответ, вероятно, будет иметь разные размеры биологически значимого эффекта и разные уровни вариабельности.Таким образом, статистическая мощность неизбежно будет варьироваться между ответами для данного размера выборки. Здесь нам нужно взять листок из книги клинических испытаний и решить, какие критерии результатов необходимы для проверки гипотезы, а какие являются желательными, а затем выбрать критерий первичного результата для расчета размера выборки. Если второстепенные показатели результатов считаются важными, для каждого из этих показателей следует проводить расчеты мощности, чтобы гарантировать, что выбранный размер выборки обеспечит адекватную мощность для всех основных показателей результатов.

5. Мои результаты интересны, но не статистически значимы. Могу ли я тестировать больше животных / партии клеток, пока я не достигну p

<0,05?

Этот сценарий, который я встречал в in vitro, чаще, чем в исследованиях in vivo , разыгрывается примерно так: исследователь проводит серию экспериментов и анализирует результаты. Если они видят в результатах что-то «интересное», но не статистически значимое, они затем тестируют другую партию ячеек (и, возможно, продолжают работу, пока не достигнут «земли обетованной» с p <0.05).

Это известно как P-hacking и на самом деле не рекомендуется, так как значительно увеличивает риск получения ложноположительного результата. Это также показывает отсутствие понимания экспериментального дизайна и рандомизации. Дизайн должен быть спланирован заранее, (например, с использованием EDA), включая выбор размера выборки, и этот план должен соблюдаться, чтобы весь процесс выполнялся контролируемым и беспристрастным образом.

6. Я планирую повторить свой эксперимент трижды.Мне действительно нужно использовать расчет мощности?

Мне иногда задают этот вопрос, и я думаю, что это, возможно, связано с неправильным пониманием концепций независимости и блокирования. Логика заключается в том, что если исследователь повторяет (потенциально небольшой) эксперимент три раза и наблюдает одни и те же тенденции во всех трех экспериментах, то имеется «убедительное» свидетельство эффекта. В этом случае предполагается, что расчет мощности не требуется.

Есть несколько проблем с этой логикой.Во-первых, если отдельные эксперименты недостаточно мощны, тогда все три могут выявить одну и ту же ложноположительную тенденцию, поскольку ни один из экспериментов не является надежным по отдельности. В качестве альтернативы, возможно, отдельные эксперименты с недостаточной мощностью не могут определить истинный эффект из-за изменчивости. Ситуация усугубляется тем, что сами тесты не могут быть по-настоящему независимыми: эксперименты могли проводиться одними и теми же исследователями по одному и тому же протоколу в одной лаборатории, только в разные дни (обеспечивая близкое согласие между экспериментами).В результате доказательства, собранные в ходе трех исследований, могут быть не столь убедительными, как думает исследователь.

Один из вариантов — анализировать данные трех экспериментов как один (более крупный) набор данных. Статистическая мощность будет выше (а результаты более надежными), поскольку размер выборки теперь в три раза больше. Однако это все еще не идеально, и более эффективным подходом является использование блочного дизайна (каждый небольшой эксперимент является блоком) и вычисление размера выборки, необходимого для всего эксперимента, с расчетом мощности.В этом сценарии может оказаться возможным использовать меньше животных, чем в трех отдельных экспериментах, при одновременном увеличении статистической мощности.

7. Могу ли я уменьшить количество животных, используемых в моем эксперименте, без потери мощности?

Если у вас есть оценка изменчивости, то альтернативной стратегией, которая может увеличить статистическую мощность, является использование последовательного группового дизайна. При групповом последовательном дизайне промежуточные анализы, обычно два или три, заранее запланированы в план исследования, и эксперименты могут быть прекращены досрочно, если был достигнут статистически значимый эффект (или эффект не наблюдался), тем самым спасая животных.При проведении множественных анализов увеличивается риск обнаружения ложноположительных результатов, поэтому для этого необходимо снизить уровень значимости с 5%: для этого доступны различные методы. Neumann et al. (2017) описывают сценарий, в котором сравниваются две группы (размер эффекта = 1), используя либо традиционный дизайн (n = 18 на группу), либо групповой последовательный дизайн. В последнем случае промежуточные анализы выполняются, когда было оценено n = 6 животных, а затем, возможно, когда были протестированы n = 12 и n = 18 (в зависимости от результатов предыдущих промежуточных анализов).Использование этого подхода привело к средней экономии 20% использованных животных без снижения статистической мощности.

8. На какой вопрос вы пытаетесь ответить?

Напоследок вопрос от меня до доработки.

Принимая решение о размере выборки, стоит сначала подумать, на какой вопрос вы пытаетесь ответить. Многие традиционные подходы к анализу мощности предполагают, что целью эксперимента является сравнение средних значений двух (или более) экспериментальных групп с использованием дисперсионного анализа или t-критериев.Для таких оценок требуется подходящее количество животных в каждой группе. Но вы действительно просто пытаетесь сравнить одну экспериментальную группу с контрольной? Возможно, вы действительно заинтересованы в оценке / понимании самой лежащей в основе зависимости «доза-реакция». Если это так, то выбор плана эксперимента и, следовательно, размер выборки для каждой группы может быть другим.

Например, оказывается, что если вы заинтересованы в понимании взаимосвязи доза-реакция и хотите идентифицировать ED 50 , тогда используйте план с большим количеством дозовых групп и меньшим количеством животных на группу, возможно, всего по три на каждую. группа, это лучший дизайн для использования, чем более ортодоксальные планы / размеры выборки.Бейт и Кларк (2014, раздел 3.6.2.2) приводят такой пример. В качестве другого примера, если целью исследования является скрининг общего воздействия нескольких факторов, то подходящим дизайном может быть использование факторного плана (с n = 1 или 2 животными на комбинацию уровней факторов) — см. Shaw et al. al. (2002).

В общем, вопросы, на которые пытаются ответить исследователи, часто бывают сложными. В этом случае может потребоваться помощь статистика, например, для запуска моделирования для определения наилучшего плана / размера выборки.Как бы то ни было, в принципе, мы всегда должны пытаться согласовать выбор экспериментального дизайна с вопросами, на которые мы пытаемся ответить.

Сводка

В заключение, есть видео на YouTube, которое поначалу выглядит немного странно, но дает хорошее представление о том, что происходит, когда два человека говорят на разных языках исследования. Ученый приходит к статистику и спрашивает совета по обоснованию размера выборки. Статистик задает много уместных вопросов, и исследователь пытается предоставить некоторую дополнительную информацию, которая ему полезна, но в то же время исследователь всегда отвечает: «Мне нужно использовать n = 3».Надеюсь, в будущем такие разговоры станут реже!

Список литературы

Нойман К., Гриттнер Ю., Пайпер С.К., Рекс А., Флорез-Варгас О., Каристианис Г. и др. (2017) Повышение эффективности доклинических исследований с помощью групповых последовательных дизайнов. PLoS Biology 15 (3): e2001307. DOI: 10.1371 / journal.pbio.2001307

Шоу Р., Фестинг М.Ф., Пирс И., Ферлонг Л. (2002) Использование факторных планов для оптимизации экспериментов на животных и сокращения использования животных. ILAR J 43 (4) : 223-32.DOI: 10.1093 / ilar.43.4.223

Бейт С.Т., Кларк Р.А. (2014) Дизайн и статистический анализ экспериментов на животных . Издательство Кембриджского университета.

Расчет размера экспериментальной выборки с использованием анализа мощности | Стэн Нски

Если вы используете эксперименты для оценки функции продукта, а я надеюсь, что вы это делаете, часто возникает вопрос о минимально необходимом размере выборки для получения статистически значимых результатов. В этой статье мы объясняем, как мы применяем математическую статистику и анализ мощности для расчета размера выборки AB-тестирования.

Перед запуском эксперимента важно рассчитать рентабельность инвестиций и оценить время, необходимое для получения статистической значимости. Тест AB не может длиться вечно. Однако, если мы не соберем достаточно данных, наш эксперимент получит небольшую статистическую мощность, что не позволяет нам определить победителя и принять правильное решение.

Начнем с терминологии. Статистическая мощность — это вероятность того, что тот или иной статистический критерий сможет правильно отклонить нулевую гипотезу H0 в случае, когда альтернативная гипотеза h2 верна.Чем выше мощность статистического теста, тем меньше вероятность того, что вы допустите ошибку II типа.

Ошибка типа II тесно связана с

  1. Величина разницы между выборками — Размер эффекта
  2. количество наблюдений
  3. разброс данных

Анализ мощности позволяет определить размер выборки с определенным уровнем достоверности что требуется для определения величины эффекта. Кроме того, этот анализ позволяет оценить вероятность обнаружения различия при заданном размере выборки.

При «достаточно» больших выборках даже небольшие различия являются статистически значимыми, и наоборот, с небольшими выборками даже большие различия трудно идентифицировать.

Наиболее важным является количество наблюдений: чем больше размер выборки, тем выше статистическая мощность. С «достаточно» большими выборками даже небольшие различия являются статистически значимыми, и наоборот, с небольшими выборками даже большие различия трудно идентифицировать.Зная эти закономерности, мы можем заранее определить минимальный размер выборки, необходимый для получения статистически значимого результата. На практике обычно приемлемой считается испытательная мощность, равная или превышающая 80% (что соответствует β-риску 20%). Этот уровень является следствием так называемого соотношения «один к четырем компромиссам» между уровнями α-риска и β-риска: если мы примем уровень значимости α = 0,05, тогда β = 0,05 × 4 = 0,20, а мощность критерия P = 1–0,20 = 0.80.

Теперь посмотрим на размер эффекта. Существует два подхода к вычислению требуемой выборки

  1. Расчет с использованием уровня достоверности, размера эффекта и уровня мощности
  2. Применение последовательного анализа, позволяющего рассчитать требуемый размер выборки во время эксперимента

Предположим, мы проверяем гипотезу нацелен на повышение коэффициента конверсии «товар в список желаний». Delta, которая покрывает расходы на эксперимент с шестимесячной прибылью> = 5% от указанного коэффициента конверсии.Прирост> = 5% дает дополнительную прибыль, которая покрывает все ресурсы, вложенные в эксперимент. В дополнение к этому вы должны быть на 90% уверены, что найдете различия, если они существуют, и на 95% — что вы не принимаете различия, которые представляют собой случайные колебания.

 pwr.t.test (d = .05, sig.level = .05, power = .9, alternate = "two.sided") ## Расчет мощности t-теста по двум выборкам 
##
## n = 8406,896
## d = 0,05
## sig.level = 0,05
## power = 0.9
## alternate = two.sided
##
## ПРИМЕЧАНИЕ: n - номер в * каждой * группе

Давайте рассмотрим другой случай, когда заинтересованные стороны хотят получить результаты через пару недель. В этом случае у нас примерный размер выборки 4000 посетителей и дельта> = 5%. Мы хотим знать вероятность получения статистически значимых результатов при указанных обстоятельствах.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *