Сравнение различных систем количественного анализа полиграмм с помощью алгоритма ChanceCalc

А.П. Сошников, А.Б. Пеленицын, Москва

Важнейшими требованиями на заключительном этапе обследования с применением полиграфа (обработка результатов тестирования, их анализ и вынесение заключения) являются:

  1. максимально возможная объективность оценки полиграмм;
  2. личная ответственность эксперта-полиграфолога за выводы по результатам проведенного им анализа.

При правильно организованной процедуре обследования с использованием полиграфа, построенной в соответствии с существующими профессиональными стандартами, выполнение этих требований обеспечивается:

  • высоким уровнем стандартизации основного этапа проведения обследования (структуры, содержания и порядка предъявления вопросников), что позволяет осуществлять анализ и оценку результатов обследования независимыми экспертами, лично не принимавшими участия в обследовании, но благодаря стандартизации процедуры точно знающими, как именно оно проводилось;
  • высоким уровнем стандартизации самой процедуры анализа и интерпретации полиграмм на основе количественной оценки величины зарегистрированных психофизиологических реакций, которые в обязательном порядке осуществляет эксперт, лично проводивший обследование, используя для этого один из общепринятых стандартизированных методов числового (балльного) обсчета физиологических реакций;
  • перепроверка (подтверждение) полученных результатов оценки полиграмм и сделанных выводов независимым экспертом (работающим "вслепую", т.е не обладающим никакими данными об испытуемом, помимо зарегистрированных полиграмм) и / или с помощью специализированного компьютерного алгоритма , эффективность которого доказана практикой.

Следует отметить, что именно таким образом обеспечивается объективность и надежность анализа и оценки результатов обследований на полиграфе, выполняемых специалистами-полиграфологами во всех федеральных ведомствах США - наиболее крупного и серьезного потребителя обследований с использованием полиграфа в мире. Указанные требования соответствуют профессиональному стандарту деятельности, установленному Американской ассоциацией полиграфологов (АРА) [1] , и в обязательном порядке должны выполняться в случае предъявления результатов тестирования на полиграфе в качестве доказательств в судах.

Все сказанное прежде всего относится к наиболее часто используемому формату обследования на полиграфе, известному как "Метод вопросов сравнения" (Comparative Question Test – CQT), который по устаревшей традиции в нашей стране продолжают называть МКВ – «метод контрольных вопросов» или иногда еще проще - «прямой метод». В данной статье рассматриваются особенности количественной оценки результатов, полученных с помощью именно этого метода тестирования на полиграфе. Вопросы количественной обработки других форматов полиграфных обследований, которая может осуществляться с использованием алгоритма ChanceCalc , будут рассмотрены в последующих публикациях.

Самый популярный, общепринятый, ставший стандартным метод количественной (числовой, балльной) оценки полиграмм, полученных с помощью процедуры МКВ, который применяется абсолютным большинством экспертов-полиграфологов во всем мире, первоначально был предложен Кливом Бакстером в 1961 году [2] . Разработанные им идеология и система приемов объективной количественной обработки психофизиологических реакций, а также основанное на них универсальное правило принятия решения об искренности или лжи в то время выглядели революционными и считаются одним из крупнейших достижений прикладной психофизиологии в XX веке. На основе системы Бакстера несколько позже возникли еще два подхода к количественной оценке полиграмм: "армейский" ("федеральный"), который преподается в настоящее время в Институте полиграфа Миноборны США (DoDPI) [3] , и "академический", разработанный в Университете штата Юта под руководством д-ра Дэвида Раскина [4] . Кроме того, можно упомянуть некоторые системы количественной оценки российского происхождения, но они, как правило, применяются локально, в основном только самими разработчиками.

Все три указанные выше наиболее распространенные американские системы количественной оценки содержат три группы правил:

  1. правила оценки реакций (присвоения баллов), а именно:
    • выбор оцениваемых параметров сигналов,
    • выявление артефактов и действия с ними,
    • выбор вопросов для сравнения,
    • собственно присвоение баллов (числовая оценка реакций);
  2. правила обсчета всего теста, определяющие порядок объединения полученных оценок индивидуальных реакций в единый результат;
  3. правила принятия решения, устанавливающие связь между полученным итоговым числовым результатом и диагностическим решением:
    • "ложь обнаружена" (deception indicated – DI).
    • "ложь не обнаружена" (no deception indicated – NDI).
    • "неопределенный результат" (inconclusive – INC).

Вообще говоря, указанные системы оценки трудно непосредственно сравнивать между собой ввиду разной терминологии и отсутствия достаточного объема опубликованных деталей. Но краткую характеристику им все же дать необходимо.

Система оценки К. Бакстера [2] , которая преподается только в его собственной школе в Сан Диего (Калифорния), с момента создания была очень сложной и под действием критики со стороны полиграфологов несколько раз модифицировалась (в 1979, 1984 и 1996 г.). О самой последней модификации своей системы К. Бакстер лично докладывал совсем недавно на 40-м Конгрессе АРА в Лас-Вегасе летом 2006 года. Система Бакстера предписывает учитывать всего 8 - 10 отчетливых типов физиологических реакций, однако ее правила ( 21 правило! ) присвоения числовых оценок являются самыми сложными и до конца понимаются только самим К. Бакстером и его учениками. В частности, в системе оценки используются 9 правил так называемого 1-го уровня, 4 правила 2-го уровня, 4 дополнительных правила и 4 правила учета "особенностей динамики показателей". Кроме того, отличительной особенностью системы Бакстера являются асимметричные пороги принятия решения (+6 и -12). Следует отметить, что К. Бакстер никогда открыто не публиковал описание своей системы оценки полиграмм, и в литературе практически нет серьезных исследований ее эффективности и точности.

"Армейская", или, иначе, "федеральная", система количественного анализа результатов обследований на полиграфе [3] была создана примерно через год после появления системы Бакстера и в значительной степени базируется на ней. Первоначально она преподавалась в Школе полиграфологов Военной полиции Армии США, а затем в ее преемнике – Институте полиграфа Минобороны США. В настоящее время эта система использует для анализа 20 основных типов физиологических реакций и 3 "дополнительные" реакции, а также ряд достаточно простых правил присвоения им числовых оценок. Однако исследования показывают, что федеральные полиграфологи в повседневной практической работе используют для анализа только 10 основных типов реакций.

Система экспертной количественной обработки результатов обследований на полиграфе, созданная в Университете штата Юта [4] , является самой простой. Она использует 10 типов реакций, причем 2 из них относятся к плетизмограмме, которая никогда не учитывается в система Бакстера и лишь иногда принимается во внимание в "федеральной" системе. Правила присвоения реакциям числовых оценок (баллов) в этой системе простые и ясные, что, как показывают последние исследования [5], обеспечивает ей наивысшую степень точности диагностики и взаимного согласия независимых экспертов – до 95%. Именно эта система применялась в описываемом в данной статье исследовании особенностей использования различных шкал ранжирования психофизиологических реакций.

В настоящее время применение всех трех систем количественной оценки полиграмм жестко регламентирует количество проверочных вопросов в вопроснике, количество предъявлений вопросника в процессе теста и величины пороговых значений, относительно которых принимаются решения об искренности ответов на проверочные вопросы или лжи. Во всех этих системах оценки много общего, но есть и определенные различия, главное из которых заключается в том, какой именно контрольный вопрос используется для сравнения с реакцией на интересующий проверочный вопрос.

Так, в системе, предлагаемой Университетом штата Юта, каждый проверочный вопрос сравнивается с контрольным, который непосредственно предшествует ему. Кроме того, в этой системе в последовательных предъявлениях вопросника взаимоположение проверочных и контрольных вопросов постоянно меняется. В системе, преподаваемой в Институте полиграфа Минобороны США, реакция на проверочный вопрос сравнивается с наиболее сильной реакцией на один из двух контрольных вопросов, окружающих его, если подобная ситуация имеет место. В противном случае реакция на проверочный вопрос сравнивается с реакцией на ближайший контрольный вопрос. В системе, используемой в школе Бакстера, вопрос для сравнения выбирается в зависимости от того, насколько сильную реакцию обследуемый дал на интересующий проверочный вопрос. Если эта реакция сильная, для сравнения выбирается один из двух соседних контрольных вопросов, сопровождавшийся наименьшей реакцией. Если же проверочный вопрос не вызвал заметной реакции, то он сравнивается с тем из двух соседствующих контрольных вопросов, который вызвал наибольшую реакцию.

Описанное различие между тремя указанными подходами имеет одну принципиальную особенность. В системах Бакстера и Института полиграфа контрольные вопросы, используемые для сравнения с проверочным, выбираются экспертом-полиграфологом на основе его субъективной оценки силы (величины, интенсивности) реакции на проверочный вопрос.

В то же самое время система Университета штата Юта уходит от этого потенциального источника субъективности и снижения надежности диагностики и использует для сравнения только те контрольные вопросы, которые предшествуют проверочным. Кроме того, в данном методе вероятность возможных случайных искажений результатов уменьшается путем систематического изменения взаимного расположения проверочных и контрольных вопросов в процессе их последовательных предъявлений. При этом перемещение проверочных вопросов в последовательных предъявлениях осуществляется в одном направлении, а контрольных – в противоположном (метод двойной ротации). В результате реакция на каждый проверочный вопрос все время сравнивается с реакциями на разные контрольные вопросы, что является одним из способов противодействия такому нежелательному явлению, как физиологическое привыкание (адаптация) обследуемого к вопросам теста в процессе его проведения. Очевидно, именно этот подход следует признать наиболее научно обоснованным.

К числу очевидных недостатков описанных числовых систем оценки следует отнести жестко фиксированное количество стимулов (проверочных вопросов), необходимых для получения окончательных выводов по результатам обследования, а также использование фиксированных пороговых значений (обычно ±6) принятия решения, которые не позволяют в полной мере учитывать цену ошибки в разных ситуациях. Выполнение этих жестких требований часто бывает затруднительным в условиях реальной практической работы в связи с наличием артефактов и других ситуативных ограничений.

Все три рассмотренные выше системы числовой оценки результатов обследований на полиграфе, как правило, используют 7= балльную (7= ранговую) шкалу со значениями оценки реакций в интервале от -3 (очень сильный признак неискренности в реакции) до +3 (очень сильный признак искренности в реакции). Однако некоторые школы предлагают проводить числовую оценку реакций с использованием суженной 3=балльной шкалы и оценивать различия в реакциях на проверочный и контрольный вопросы в диапазоне от -1 до +1. Существует мнение, что, поскольку, как показывает практика, полиграфологи, проводя числовую оценку полиграмм по 7= балльной шкале, в 80 - 90% случаев все равно присваивают реакциям значения от -1 до +1 [6, 7] , метод 3=балльной оценки представляется вполне допустимым, особенно, если принимать во внимание его простоту. Однако, как показывают результаты наших исследований, описанных ниже, это не всегда бывает так, или, по крайней мере, требует соблюдения дополнительных условий. Тем не менее несомненное преимущество 3= балльной оценки состоит в том, что она способствует уменьшению субъективизма, с одной стороны, и ускорению процедуры визуального анализа полиграмм - с другой. В то же время из-за сужения диапазона измерения реакций эта система порождает больше неопределенных заключений (inconclusives), если перед ее применением соответствующим образом заранее не были скорректированы (уменьшены) границы этой зоны.

Существует определенный интерес и к 5-балльной шкале оценки реакций, поскольку фактически именно с этой шкалой в основном работает система Бакстера, так как ее правила в основном ориентированы на присвоение реакциям рангов от -2 до +2, а повышение ранга реакции до ±3 возможно только в исключительных случаях (правила 15, 16 и 17 системы Бакстера).

Необходимо отметить два сравнительных исследования 7= и 3= балльных шкал, которые были проведены в Институте полиграфа Минобороны США. Одно из них основывалось исключительно на лабораторных исследованиях [6], другое – на результатах реальных обследований [7]. Основное внимание в них уделялось эмпирическому определению величины порога принятии решения при использовании 3= балльной шкалы, которое бы соответствовало величине стандартного порога принятия решения (±6) для 7=балльной системы. По результатам этих исследований оптимальным оказался порог ±4. Никаких других выводов из этих исследований в отношении применимости различных шкал ранжирования сделано не было. Каких-либо других исследований этого вопроса не проводилось. Поэтому многие методические аспекты оставались открытыми и требовали дополнительного исследования.

Целью исследования, описываемого в настоящей статье, являлось сравнение эффективности (точности и надежности) использования различных шкал (7=, 5= и 3= балльной) оценки реакций для объективного количественного анализа результатов полиграфных обследований, выполненных методом контрольных вопросов. В качестве инструмента балльной оценки реакций использовался вариант системы оценки, разработанный в Университете штата Юта. Для исследования были взяты материалы 35 обследований, проведенных в реальных условиях. Каждая полиграмма обсчитывалась с использованием 7=, 5= и 3= балльных шкал.

Данная система была разработана на полиграфе «Диана-01».

Формат настоящей статьи не позволяет подробно описывать все результаты, полученные в ходе исследования сравнительной эффективности использования шкал разной размерности для оценки результатов обследования на полиграфе. Поэтому остановимся только на основных выводах этой работы. Принимая во внимание существование все еще пока достаточно узкого круга полиграфологов в России и хорошо налаженные внутренние коммуникации между ними, заинтересовавшиеся могут получить более детальную информацию об этих исследованиях и их результатах, обратившись непосредственно к авторам статьи.

Итак, основные, наиболее существенные выводы проведенного исследования таковы:

  1. Рассматриваемые три шкалы количественной оценки реакций (7=, 5= и 3= балльная) не всегда являются взаимозаменяемыми. Каждая из них имеет свои плюсы и минусы. Вопреки существующему представлению, между этими системами существуют гораздо большие различия, чем кажется. Анализ с использованием алгоритма ChanceCalc позволил обнаружить суть этих различий, описываемых ниже.
  2. Если визуальная экспертная оценка показывает заметные различия между реакциями на проверочные и контрольные вопросы, свидетельствующие об искренности или неискренности, то для количественной оценки этих реакций можно использовать любую шкалу, поскольку они будут приводить к практически идентичным результатам, в частности, выражаемым в виде вероятности неслучайности реакций на вопросы того или иного типа.
  3. Если же различия в реакциях на контрольные и проверочные вопросы не столь очевидны, то использование разных шкал ранжирования может приводить к отличающимся результатам. При этом наибольшую точность обеспечивает 7= балльная шкала. Она является более чувствительной, позволяет точнее отслеживать вероятность неслучайности реакций на вопросы того или иного типа и менее склонна к ошибкам в выводах по сравнению с 5= и 3=балльной шкалами. Различия становятся особенно заметными при приближении к области, традиционно называемой "неопределенной" (inconclusive). Именно здесь с помощью 7= балльной шкалы получаются более взвешенные и осторожные оценки. Поэтому для ситуаций с неясным исходом лучше рекомендовать обсчет полиграмм с использованием 7= балльной шкалы. Для более очевидных случаев, тяготеющих к однозначным выводам, вполне возможно использовать 5= балльную и даже 3= балльную шкалы оценки.
  4. Использование 3= балльной шкалы фактически фиксирует только факт наличия дифференциальной (разностной) реакции в паре "проверочный - контрольный вопрос, но никак не измеряет силу этой реакции. В этом и кроется причина возможных ошибок, которую удалось обнаружить в основном благодаря использованию в исследовании алгоритма ChanceCalc . Как показали исследования, 7= балльная оценка является более сбалансированной, более точной, и, если выражаться образно, она работает, как рычажные весы с длинным коромыслом. В свою очередь 3=балльная оценка – это более грубые весы с коротким коромыслом, которые при незначительном измеряемом весе имеют склонность к искажению результата.
    Приведем пример. Предположим, в процессе исследования получено 5 сильных дифференциальных реакций на проверочные вопросы, которые в 7= балльной шкале получили оценку -2 или -3, и 5 слабых дифференциальных реакций на контрольные вопросы с оценками +1. Итоговая количественная оценка такого теста будет отрицательной (от -10 до -15) и будет указывать на неискренность (с вероятностью, вычисленной с помощью алгоритма ChanceCalc, 0,76 и 0,93 соответственно). В то же время при использовании 3= балльной системы оценки того же эксперимента мы будем иметь 5 отрицательных и 5 положительных оценок. Суммарный балл оценки теста окажется равным нулю, и результат такого теста будет указывать на неопределенность исхода (вероятность реакций на проверочные и контрольные вопросы составит примерно по 0,5, что указывает на случайный характер наблюдаемых реакций). Обратите внимание, что в случае этого модельного эксперимента мы находились в области, близкой к зоне "неопределенности" (inconclusive). Таким образом, подтверждается вывод о том, что 3= балльная система при всей своей простоте оказывается не всегда применимой, грубоватой и пригодной только для общих оценок в условиях выраженных реакций на вопросы преимущественно одного типа.

С учетом всего сказанного выше можно сделать следующий вывод : поскольку 7= балльная шкала оценки реакций не только позволяет учитывать факт (наличие) реакции, но и обеспечивает возможность измерять в определенной степени ее величины (силу), мы рекомендуем в большинстве ситуаций пользоваться для экспертной количественной оценки психофизиологических исследований именно этой шкалой, которая почти 50 лет назад впервые была предложена К. Бакстером.

ЛИТЕРАТУРА

  1. The Website of American Polygraph Association – www.polygraph.org.
  2. J.A. Matte (1996). Forensic Psychophysiology Using the Polygraph: Scientific Truth Verification – Lie detection, Williamsville, NY: J.A.M. Publications, 398 - 417
  3. J. Swinford (1999). Manually Scoring Polygraph Charts Utilizing the Seven-Position Numerical Analysis Scale at the Department of Defense Polygraph Institute. Polygraph, 28 (1) 10 - 27
  4. J.C. Kircher, D.C. Raskin (1988). Human versus Computerized evaluations of polygraph Data in a Laboratory Setting. Journal of Applied Psychology, 73 (2), 291- 302
  5. S.T. Senter, A.B. Dollins, D.J. Krapohl (2001). A Comparison of Polygraph Data Evaluation Conventions Used at the University of Utah and the Department of Defense Polygraph Institute. Polygraph, 33 (4) 214 - 222
  6. D.J. Krapohl (1998). A Comparison of 3- and 7- Position Scoring Scales with Laboratory Data. Polygraph, 27 (3) 210-218
  7. E.M. Harwell (2000). A comparison of 3 - and 7- Position Scoring Scales with Field Examinations, Polygraph, 29 (2) 195 - 197
  8. А. П., Сошников А. Б. Пеленицын (2006). Универсальная комбинаторно-вероятностная модель оценки значимости психофизиологических стимулов и ее использование в полиграфе «Диана-01», Материалы VII международной научно-практической конференции, Краснодар, 2006 г., 133 - 139