Прежде всего следует обсудить понятия "заболеваемость" и "болезненность".
Заболеваемостью (incidence — в зарубежной литературе) принято называть число новых случаев болезни, возникших в данной группе населения в единицу времени, чаще всего — в год. Показатель заболеваемости выражается числом таких случаев на 100, 1000, 10 000 или на 100 000 населения.
Болезненность (или распространенность, prevalence — в зарубежной литературе) — это число больных с изучаемым заболеванием, которое имеется в определенном населении в данное время. Как и показатель заболеваемости, показатель болезненности рассчитывается на 100, 1000, 10 000 или 100 000 населения.
Поскольку число имеющихся среди населения больных гораздо больше, чем число вновь заболевших (во всяком случае с психическими заболеваниями), показатель распространенности чаще всего рассчитывается на 1000, а показатель заболеваемости — на 100 000 населения.
При расчете показателя болезненности, как уже говорилось, речь идет о числе больных среди населения. В последние годы предпринимаются попытки уточнить понятие "больной": ведь у одних психическое расстройство может наблюдаться сейчас, у других — в прошлом. Поэтому в современной литературе различают распространенность в момент обследования (point prevalence), т.е. показатель, отражающий число лиц, имеющих изучаемое психическое расстройство в данное время; годичную распространенность (year prevalence) — показатель, отражающий число лиц, имевших данное расстройство в любой период продолжительностью год, предшествовавшего моменту обследования; распространенность в течение жизни (life prevalence)1 — показатель, отражающий число лиц, имевших отмечаемое расстройство когда-либо в жизни.
Для того чтобы проиллюстрировать различие этих показателей, воспользуемся данными В.П.Морозовой (1983), которая подробно исследовала распространенность психозов, развивающихся в виде монополярных депрессивных расстройств. Материал исследования составляли соответствующие наблюдения в 4 районных психоневрологических диспансерах (ПНД) Москвы (1703 больных). Автор обнаружила 932 случая, соответствовавших названному диагностическому критерию, что составило 1,3 на 1000 населения. Данный показатель отражает число больных, у которых депрессивное расстройство было в течение жизни (независимо от того, когда именно) — life prevalence. Если нужно установить, у какого числа больных последняя депрессия отмечалась в течение последнего года (year prevalence), показатель составит 1,03 на 1000, т.е. уменьшится почти на 1/4. Наконец, если желательно знать point prevalence (в данном случае — число больных, состояние которых определялось депрессией в момент осмотра), то показатель составит только 0,36 на 1000.
Существует обстоятельство, которое необходимо принимать во внимание, работая с показателями распространенности и заболеваемости. Если распространенность шизофрении в одном городе составляет 10 на 1000 населения, а в другом — 3 на 1000, то это отнюдь не означает, что в последнем люди реже болеют шизофренией; это может означать и то, что во втором случае психиатрическая служба выявляет меньше больных. Возможно, что психиатры в этих городах придерживаются разных диагностических критериев. Последняя трудность преодолевается с помощью стандартизованных инструментов диагностики, сводящих к минимуму влияние личных диагностических позиций исследователя. В любом случае обозначение критериев диагностики (как и всех других критериев отбора случаев, вошедших в исследование) является обязательным методическим требованием, которое следует учитывать при эпидемиологическом исследовании.
Известно, что разные психиатрические службы выявляют разное число больных. Это объективный и при современном уровне знаний непреодолимый факт, с которым приходится считаться. Сколько-то больных всегда остаются не выявленными и, по-видимому, не существует метода, который помог бы их всех выявить. Было много попыток выяснить показатель "истинной", "полной", "исчерпанной" болезненности. Успех всех этих попыток относителен. В большинстве эпидемиологических работ, говоря о распространенности болезни, авторы имеют в виду число больных, обратившихся за помощью. Существуют работы, авторы которых опираются на данные, полученные при поголовных осмотрах выборочных групп населения; такие показатели обычно бывают большими. Есть работы, отражающие попытки теоретически вычислить показатель распространенности эндогенных психозов (видимо, это единственный способ получить представление об их "истинной" распространенности).
Все эти замечания относятся и к показателю заболеваемости. При расчете этого показателя приходится обращать внимание и на то, кого считать заболевшим в данном году. Часто признают заболевшими тех, кто впервые обратился за помощью. Если речь идет об общем показателе заболеваемости, то это может быть допустимо, потому что число новых случаев большинства психических расстройств (в частности, эндогенных заболеваний) из года в год более или менее постоянно. Но очень часто заболеваемость рассчитывается не в целом, а, например, по отношению к определенному возрасту. В таком случае судить о ней по обращаемости опасно, потому что, как известно, многие больные обращаются к врачу не сразу. Клинико-эпидемиологический метод позволяет справиться с этой трудностью, потому что при обследовании больного врач старается (насколько это возможно) выяснить, когда возникли первые признаки болезни. При других методах сбора данных за начало заболевания нередко приходится принимать дату первого обращения, и поэтому показатели получаются гораздо менее надежными.
Эпидемиолог очень часто сталкивается с понятиями "риск" и "вероятность". Они очень близки и в большинстве случаев означают почти одно и то же. "Вероятность", однако, — понятие более общее. Это количественное выражение меры оправданности ожидания какого-либо события. Как известно, бывают события, ожидание которых абсолютно оправдано (их вероятность принято обозначать единицей), и события, ожидание которых абсолютно не оправдано (их вероятность обозначают нулем). Подавляющее число ожиданий в большей или меньшей степени оправдано. Вероятность того, что ожидаемое событие произойдет, в этих случаях выражается числом, лежащим между нулем и единицей (для равновероятных ожиданий вероятность составляет 0,5). Сумма вероятностей всех возможных вариантов ожидаемого события всегда составляет единицу.
Оценка вероятности того или иного события составляет значительную часть работы эпидемиолога. Базой для этого служит частота изучаемого явления в репрезентативной выборке. Это дает представление о величине риска (или просто о риске) возникновения болезни, развития нового приступа и т.д.
Особого внимания заслуживает термин "популяция". Он, пожалуй, наиболее часто встречается в статьях по эпидемиологии психических заболеваний. Говорят просто о популяции, о популяции больных, о популяции больных с определенным расстройством, о популяционных исследованиях и популяционных закономерностях.
Популяция — это совокупность особей одного вида, длительно занимающая определенное пространство и воспроизводящая себя в течение большого числа поколений. Из этого определения следует, что вполне позволительно говорить о популяционных исследованиях или о популяционных закономерностях, если речь идет о том или другом применительно к населению данной территории. Но, очевидно, не следует говорить о "популяции больных".
Выборка. На этом понятии необходимо остановиться более подробно. В идеале в исследование должны были бы быть включены все случаи данного заболевания. Подобная группа называется генеральной совокупностью. Поскольку исследование генеральной совокупности или невозможно, или требует неоправданно большого труда, лучше обойтись более ограниченным материалом, который и называют выборкой. Очевидно, что она должна быть такой, чтобы полученные при ее изучении результаты можно было распространить на любую другую группу аналогичных случаев (входящих в генеральную совокупность). Это, возможно, если в выборку попали все разновидности случаев, имеющихся в генеральной совокупности, причем в таком же количественном соотношении. Такая выборка представляет генеральную совокупность и поэтому называется репрезентативной (от англ. represent — представлять).
Поскольку исследователь имеет дело с выборкой, а не с генеральной совокупностью (в сущности так обстоит дело и при невыборочных обследованиях), результаты не могут быть абсолютно точными. Иными словами, в каждом результате эпидемиологического исследования имеется статистическая ошибка. Величина ошибки находится в обратных отношениях с численностью выборки: чем выборка больше, тем ошибка меньше. От величины ошибки зависит приемлемость результатов: если возможные колебания показателя невелики, то результаты, очевидно, приемлемы; если они слишком большие, то ценность результата чаще бывает сомнительной.
Статистическая ошибка связана с величиной, которая называется уровнем надежности результатов исследования. Если работа выполнена грамотно, то другие исследователи, повторяя ее на других выборках, скорее всего получат примерно такие же показатели. Но в принципе может встретиться выборка, в которой результат будет резко отличаться от остальных (на гораздо большую величину, чем статистическая ошибка). Необходимо знать, сколько может быть таких исключений. Показатель, характеризующий последнее, называется уровнем надежности (или просто надежностью) полученных результатов. Уровень надежности задается исследователем при планировании работы. Каков он должен быть, зависит от той области, в которой осуществляется исследование. В биологии и медицине принято считать, что достаточным является уровень надежности, равный 95 %, или 0,95 (именно это означает часто встречающаяся в статьях статистическая формула р<0,05), т.е. из каждых 100 выборок резко отличающийся результат может получиться не более чем в 5. Большая надежность требует значительного увеличения материала и затрат труда, которые в медицине чаще всего не оправданы (хотя и в медицинском исследовании надежность, равная 95 %, может быть недостаточной).
Поскольку характеристики генеральной совокупности заранее неизвестны, то нужно каким-то приемом добиться, чтобы в выборку попали те больные и в том соотношении, которое нужно, а также следует правильно определить ее численность. Первое достигается с помощью случайного отбора, т.е. выбор наблюдений организуют так, чтобы все случаи имели равные шансы попасть в создаваемую группу. Конкретных способов добиться этого достаточно много. Можно, например, составить картотеку из всех проживающих на данной территории больных, перетасовать ее и взять нужное число карточек. Существуют "алфавитные" способы, базирующиеся на том, что известна частота фамилий, начинающихся на ту или иную букву. В группу отбирают нужное число лиц с соответствующими фамилиями. Этот способ применяют при выборке из очень больших совокупностей (например, из населения региона). Наилучшим для выбора наблюдений из сравнительно небольших совокупностей (например, пациенты больницы или диспансера) представляется использование случайных чисел. По произвольному и независимому от изучаемых характеристик принципу составляют список всех больных (например, по алфавиту), нумеруют их фамилии по порядку, и далее с помощью компьютера (или из таблиц случайных чисел, имеющихся в большинстве руководств по статистике) получают столько случайных чисел, сколько больных предполагается включить в выборку; потом отбирают соответствующие номера из списка.
Определение численности выборки — отдельная и достаточно трудная задача. Именно из-за ее трудности многие предпочитают брать заведомо очень большие выборки, чтобы обеспечить репрезентативность наверняка. Крайний пример — невыборочное обследование, когда в список включают всех имеющихся больных, хотя 50 % или даже 25 % больных тоже может быть достаточно. Если генеральная совокупность невелика (например, выборы должны касаться только пациентов данного отделения), то такой способ может оказаться наиболее приемлемым. Но если выводы должны быть распространены на город или регион, то затраты труда на обследование тысяч больных могут быть невозможными или неоправданными. Целесообразнее затратить некоторое время на определение разумной численности выборки.
Для того чтобы объяснить, как это делается, придется вернуться к понятиям статистической ошибки и уровня надежности результатов.
Ошибка относительных показателей (выраженных в процентах) рассчитывается по формуле:
Из формулы видно, что величина ошибки находится в обратной зависимости от численности выборки. С одной стороны, чем меньше численность выборки, тем ошибка больше, с другой — чем больше показатель р (т.е. чем больше доля случаев с изучаемой особенностью), тем больше выборка. Иными словами, при планировании работы необходимо, исходя из некоторой рабочей гипотезы, представлять себе обе величины. Если о них нет никакого представления, приходится провести небольшое пробное обследование, чтобы установить их порядок (доли процента, целые проценты, десятки процентов).