Интеллектуальный полиграф.
А.Н.Зибатова; А.М.Петров; З.И.Сичинава; А.П.Сошников; Л.Н.Ясницкий
1. ВВЕДЕНИЕ
В профилактике, раскрытии и расследовании преступлений в системе органов МВД России традиционно применяются компьютерные полиграфы, регистрирующие от четырех до семи параллельно протекающих физиологических процессов человека: дыхания, кровяного давления, сопротивления кожи, биотоков (мозга, сердца, скелетной мускулатуры и т.п.), тремора и пр. Регистрируемые физиологические реакции в реальном времени отображаются на экране монитора в виде пульсирующих кривых. Оценка ответа опрашиваемого человека на компьютерных полиграфах анализируется с учетом исследований психологов, физиологов и специалистов в области инструментальной детекции лжи. Однако, существующие компьютерные программы, анализирующие такие полиграммы, не всегда отличаются высокой надежностью их обсчета. Поэтому результаты компьютерных обсчетов, как правило, вручную перепроверяются специалистами-полиграфологами, и их достоверность оценки во многом зависит от компетентности, опытности и моральных качеств, т.е. от так называемого «человеческого фактора».
Итоги обследования зависят не только от специалиста, проводящего опрос, но и от опрашиваемого лица. Дело в том, что формы проявления выраженности реакций, при ложном ответе опрашиваемого лица, наряду с общими правилами, зачастую имеют для каждого человека индивидуальные, только ему присущие признаки. Например, у одних людей при ложном ответе дыхание учащается, у других — наоборот замедляется, аналогично, увеличивается или уменьшается кровяное давление, частота сердечных сокращений и т.д. [1].
Эти индивидуальные особенности изменения физиологических реакций конкретного обследуемого человека, представляют определенную сложность при проведении обсчета полиграмм компьютерными полиграфами. В силу своего принципа действия, они не всегда обладают механизмом индивидуальной настройки на опрашиваемого человека. Обсчитывающие программы, как правило, применяют заложенные в них алгоритмы одинаково ко всем обследуемым лицам, не учитывают индивидуальные физиологические особенности человека на момент тестирования.
В последнее время в некоторых компаниях появились новые полиграфные системы, в которых сделана попытка учесть особенности индивидуальных физиологических реакций опрашиваемого лица, т.е. с предварительной настройкой системы на каждого исследуемого. Однако, это занимает много времени, и требует определенной квалификации оператора (опять «человеческий фактор»), поэтому практикующие полиграфологи к таким системам относятся неоднозначно.
«Человеческий фактор» проявляется и при неизбежном возникновении непредвиденных помех в регистрируемых сигналах. Такие помехи могут появиться вследствие всякого рода внешних раздражителей. Например, постороннего звука, случайного движения опрашиваемого, изменения в голосе полиграфолога. Искажения сигналов могут появиться и по многим другим причинам. Например, вследствие переутомления опрашиваемого, в случае попыток его сознательного противодействия и т.д. По наблюдениям пермских полиграфологов, существующие у них обсчитывающие программы не имеют эффективных автоматически работающих механизмов фильтрации артефактов. Поэтому в обязанность специалиста-полиграфолога, проводящего психофизиологическое тестирование, входит исключение, или, по крайней мере, их минимизация в процессе проведения опроса. Но на сколько это ему удается, опять же зависит от уровня квалификации, опыта, настроения полиграфолога. Таким образом, мы опять вынуждены констатировать факт влияния «человеческого фактора» на объективность результатов обследования.
Итак, мы указали на три, на наш взгляд, недостатка существующих систем инструментальной детекции лжи:
- Обсчитывающие компьютерные программы, работающие по жестко детерминированным алгоритмам, не всегда учитывают индивидуальные физиологические особенности, проявляющиеся в физиологических реакциях на предъявляемые стимулы;
- Новые полиграфные системы, в которых сделана попытка учесть индивидуальные особенности опрашиваемого, требуют трудоемкой настройки на каждого испытуемого, что в определенной степени осложняет их практическое применение.
- Различные артефакты, неизбежно присутствующие в регистрируемых сигналах, практически редко выявляются существующими обсчитывающими компьютерными программами и могут влиять на объективность выводов.
Группой пермских ученых совместно с работниками ГУВД Пермского края предпринята попытка создания интеллектуальной программы обсчета полиграмм с использованием принципиально нового подхода, основанного на применении современных нейросетевых технологий и социальных генетических алгоритмов. Применение нового подхода позволило бы устранить все отмеченные недостатки существующих полиграфов, уменьшить влияние человеческого фактора и, таким образом, значительно повысить надежность работы полиграфа.
Принципиальное отличие нового подхода состоит в том, что разработчики применили современные методы искусственного интеллекта. Они максимально отказались от использования известных закономерностей и правил, традиционно закладываемых в обсчитывающие программы. Эти правила в неявном виде автоматически формируются самой компьютерной программой в ходе обмена информацией между прибором и обследуемым человеком. Компьютерная программа, являясь системой искусственного интеллекта, сама извлекает и формализует в виде правил закономерности организма опрашиваемого человека, автоматически настраивается на его индивидуальные физиологические особенности, отсеивает возможные артефакты. В конечном итоге сокращается объем и время работы полиграфолога, уменьшается влияние «человеческого фактора», увеличивается компьютерная достоверность обсчетов.
Эффективность нового подхода и положительные результаты исследований явились следствием солидных наработок ученых пермской научной школы, объединенных Пермским отделением Научного совета РАН по методологии искусственного интеллекта. В активе этой научной школы имеется успешный опыт создания систем нейросетевой диагностики сложных технических устройств, диагностики сердечно-сосудистых заболеваний человека, нейросетевое прогнозирование энергопотребления, решение практически важных краевых задач и других проблем, по сложности не уступающих проблеме создания интеллектуального полграфа и имеющих с этой проблемой много общего в математическом и алгоритмическом аспектах [2-5].
2. КРАТКИЕ СВЕДЕНИЯ О НЕЙРОСЕТЕВЫХ ТЕХНОЛОГИЯХ
Теоретические основы нейронных сетей и нейрокомпьютеров были разработаны в 1943 г. американскими учеными Уорреном Мак-Каллоком и Вальтером Питтсем [6]. Ими была выдвинута идея математических нейронов, моделирующих биологические нейроны – нервные клетки, из которых состоит мозг человека. Так же как в мозге, математические нейроны соединяются между собой связями – нервными волокнами, через которые они обмениваются электрическими сигналами. Каждый нейрон имеет несколько (до 10000) входов, называемых синапсами, и один выход – аксон . На рис. 1 каждый нейрон изображен кружочком, а стрелками показаны направления передачи электрических сигналов. Если нейрон получает много мощных входных сигналов, то он переходит в возбужденное состояние. Это означает, что он сам вырабатывает и передает в свой аксон электрический сигнал, который затем разветвляется по нервным волокнам и поступает на входы других нейронов.
Мак-Каллок и Питтс предложили моделировать работу каждого нейрона с помощью следующей математической формулы. Сначала нейрон суммирует поступающие сигналы , каждый из которых предварительно умножая на некоторый коэффициент :
(1)
Величина характеризует мощность поступающего по -му нервному волокну электрического сигнала, а коэффициент является аналогом электропроводности -го нервного волокна, соединяющего биологические нейроны мозга.
Рис.1. Фрагмент искусственной нейронной сети, моделирующей мозг
По данным нейробиологов электропроводности нервных волокон , которые они называют силами межнейронных синаптических связей , в течение жизни человека могут изменяться. Существует гипотеза, что вся информация, хранящаяся в мозге человека, закодирована в виде чисел, характеризующих силы межнейронных синаптических связей. Именно эта гипотеза используется в модели мозга Мак-Каллока – Питтса.
После выполнения операции суммирования каждый математический нейрон сравнивает полученную сумму с некоторой величиной , называемой порогом чувствительности нейрона. Если сумма превысит порог , то нейрон перейдет в возбужденное состояние и на его выходе образуется выходной сигнал . В противном случае нейрон не возбужден и его выходной сигнал . Математически это записывается так:
(2)
Сеть, собранная из математических нейронов (см. рис.1), работающих по формулам (1) – (2), в упрощенной форме отражает структуру и процессы, происходящие в реальном мозге человека. На этом основании Мак-Каллок и Питтс высказали предположение о том, что нейронная сеть может выполнять функции, свойственные для человеческого мозга, в частности – решать интеллектуальные задачи.
Первой интеллектуальной задачей, с которой справилась искусственная нейронная сеть, была задача распознавания букв алфавита. На табло из фотоэлементов накладывалась буква, которую компьютер должен был узнать. На рис. 2 табло состоит из 3 фотоэлементов-квадратиков, на которые наложена буква «А». Фотоэлементы вырабатывали сигнал , если фрагмент буквы попадал на -й квадратик, и , если квадратик оставался пустым. На рис. 2: , и т.д. Таким образом, на вход нейросети поступала матрица чисел (обозначим ее за ), состоящая из множества нулей и единиц. Причем для каждой накладываемой на фотоэлементы буквы формировалась своя матрица , которую в дальнейшем будем называть входным вектором нейросети. На рис. 2 табло состоит из двенадцати фотоэлементов, поэтому каждый входной вектор имеет размерность 12, т.е. . Всего же букв русского алфавита тридцать три, поэтому . Задача нейросети состояла в том, чтобы уметь определять, какой именно букве алфавита соответствует подаваемый на ее вход входной вектор .
Для решения этой задачи нейросеть снабдили тридцатью тремя выходными нейронами, изображенными на рис. 2 в виде кружочков. Договорились, что первый выходной нейрон соответствует букве «А», т.е. он должен выдавать сигнал , если на фотоэлементы наложена буква «А» и , если на фотоэлементах оказалась любая другая бука. Второй выходной нейрон, соответствующий букве «Б», должен выдавать сигнал , если на фотоэлементах окажется буква «Б», и при появлении любой другой буквы. И так далее до 33-го выходного нейрона, которому соответствует буква «Я». Таким образом, для буквы «А», характеризуемой входным вектором , нейросеть должна сформировать выходной вектор , принимающий значения: (1, 0, 0, …, 0). Для буквы «Б», характеризуемой входным вектором , нейросеть должна сформировать выходной вектор , принимающий значения: (0, 1, 0, …, 0). И так далее до буквы «Я», для которой нейросеть должна сформировать выходной вектор , принимающий значения: (0, 0, 0, …, 1).
Итак, множеству заданных входных векторов ( нейросеть должна поставить в соответствие вполне определенное множество выходных векторов . Создатели первой нейросети добились этого результата путем последовательного подбора сил синаптических связей . Обратим внимание, что здесь используются два индекса, которые означают, что речь идет о связи, соединяющей -й выходной нейрон с -м входом нейросети.
Подбор сил синаптических связей осуществляли следующим образом. Сначала матрице присваивались случайные числа. Затем на вход подавалась буква «А», фотоэлементы вырабатывали входной вектор , а нейроны по формулам (1)-(2) вычисляли выходной вектор . Поскольку в вычислениях участвовали числа, заданные случайным образом, естественно, что нейросеть ошибалась и выдавала не тот вектор, который от нее требовался. Тогда коэффициенты корректировались из того расчета, чтобы ошибка нейросети стала меньше. Затем подавалась буква «Б», и коэффициенты снова корректировались в сторону уменьшения ошибки. И так по нескольку раз перебирались все буквы до тех пор, пока нейросеть не начинала выдавать правильные ответы.
Процесс подбора коэффициентов был алгоритмизирован и назван обучением нейросети. Это название было использовано потому, что алгоритм подбора коэффициентов удивительным образом напоминал процесс обучения ребенка методом поощрения – наказания. В процессе подбора коэффициенты увеличивались, т.е. «поощрялись», если это способствовало улучшению качества ответа нейросети, и уменьшались «в наказание», если они были «виновны» в неправильном ответе.
Вектора и , на которых нейросеть обучалась, стали называть выборкой обучающих примеров , а нейросети подобного рис. 2 типа – персептронами .
Рис. 2. Персептрон, распознающий буквы
В 1958 г. [7] персептрон, построенный «по образу и подобию» человеческого мозга и обученный с помощью алгоритма, напоминающего обучение детей, научился решать серьезную интеллектуальную задачу – распознавать буквы алфавита. Но на этом чудеса не кончились. Когда персептрону попробовали предъявить букву, нарисованную с искажениями (с помехами), он ее успешно узнал. Это означало, что знания, приобретенные в результате обучения на выборке обучающих примеров, персептрон смог применить в ситуации, которая в процессе обучения не встречалась. Т.е. он распознал образ, который раньше «не видел». Оказалось, что персептрон обладает фундаментальным свойством мозга, называемым обобщением . Благодаря этому свойству персептрон находит и продолжает находить успешное применение для решения многих интеллектуальных проблем, с которыми сталкивается человек. Именно это свойство оказалось весьма полезным в экспериментах по анализу реакций на вопросы, ответы на которые были ложные или истинные в процессе тестирования на полиграфе.
3. ПРИНЦИП ДЕЙСТВИЯ ИНТЕЛЛЕКТУАЛЬНОГО ПОЛИГРАФА
Принципиально задача распознавания признаков лжи в психофизиологических реакциях мало, чем отличается от задачи распознавания букв. Задача распознавания признаков лжи с помощью персептрона может быть решена следующим образом. В качестве входного вектора персептрона можно использовать тот же набор параметров, что и в традиционном контактном полиграфе [1]. Выходной вектор целесообразно принять, состоящим всего из двух параметров: , , если опрашиваемый человек сказал правду и , , если он лжет. Это значит, что персептрону достаточно всего два выходных нейрона, как изображено на рис. 3.
Рис.3. Персептрон, распознающий признаки лжи
Выборка обучающих примеров формируется в результате предъявления обследуемому стимуляционных тестов. В этом случае полиграфолог задает вопросы, ответы на которые ему известны. С опрашиваемого во время ответов снимаются физиологические показатели, параметры которых формируют входной вектор . Выходной вектор формирует сам полиграфолог, сопоставляя ответы опрашиваемого с тем, что ему заранее об этом известно. Накопив достаточное количество примеров и обучив на них персептрон, можно задать опрашиваемому вопрос, ответ на который заранее не известен. Персептрон сделает заключение о степени истинности ответа, данного опрашиваемым. Причем, поскольку персептрон был обучен на физиологических реакциях, формируемых самим опрашиваемым, то его заключение будет объективно учитывать индивидуальные особенности этого организма. Если обучающая выборка достаточно велика, то программа, в силу своей нейросетевой базы, будет обладать свойством автоматического отсеивания артефактов [3].
Приведенный способ создания настраиваемого полиграфа обладает недостатком, состоящим в повышенной трудоемкости. Дело в том, что для каждого обследуемого приходится заново формировать выборку обучающих примеров (порядка 70-100 вопросов-ответов), а затем обучать персептрон на каждой такой выборке. После этого персептрон пригоден для тестирования только одного человека, на которого он был настроен.
Таким образом, предлагаемый способ, с одной стороны, позволяет проводить обследование с автоматическим отсеиванием помех и с учетом индивидуальных особенностей организма опрашиваемого, что существенно повышает степень объективности и качества выяснения истины, а с другой – этот способ требует больших трудозатрат. Поэтому его можно рекомендовать только для сложных случаев, когда затраты на длительное обучение оправданы. Назовем эту разработку полиграфом 1-й очереди.
Предварительные эксперименты, проведенные совместно с ГУВД Пермского края на реальном материале показали, что полиграф 1-й очереди обеспечивает правильные заключения более чем в 97 случаях из ста.
Полиграфом 2-й очереди мы назвали нейросетевой полиграф, обученный на большом количестве обследуемых – порядка ста человек. Как показали эксперименты, такой полиграф может применяться вообще без предъявления специальных стимуляционных тестов (без обучения персептрона на каждом обследуемом). Опрашиваемому человеку сразу предъявляются рабочие тесты и снимаемые с обследуемого данные передаются на вход персептрона. Предварительные эксперименты показали, что полиграф второй очереди способен делать до 85 правильных заключений из ста. Зафиксированное снижение процента правильных заключений объясняется тем, что полиграф 2-й очереди, предварительно обученный на большом количестве людей, получился ориентированным на некоторого «среднего» человека и, естественно, перестал учитывать индивидуальные особенности обследуемого. Таким образом, полиграф 2-й очереди можно рекомендовать в тех случаях, когда требуется быстро обследовать большое количество людей, например, выполнить скрининговое тестирование сотрудников крупной фирмы.
В настоящее время ведутся разработки полиграфа 3-й очереди, который обеспечивает высокую степень надежности заключений (не менее 99%) при минимальном количестве стимуляционных тестов. В основу разработки по-прежнему кладется нейронная сеть, однако, дополненная нейронными каскадами, реализующими нестандартные нейросетевые парадигмы. Эти парадигмы являются «ноу-хау» коллектива разработчиков, и их суть пока не раскрывается. Они позволяют еще в большей степени учитывать реальные процессы, происходящие в человеческом мозге, и благодаря им нейросеть наследует от своего прототипа – человеческого мозга, еще одно важное свойство – способность к самообучению . Именно это свойство и позволяет минимизировать необходимое количество обучающего материала при сохранении высокой надежности заключений полиграфа.
В течение первого полугодия 2006 года алгоритм, реализующий функции полиграфа 3-й очереди проходит апробацию в г. Москве (компания «Поликониус-Центр») на базе профессионального компьютерного полиграфа «Диана-01» и мы надеемся, что уже к концу года искусственный интеллект станет неотъемлемой частью этого полиграфа. Авторы считают, что совместное использование нового интеллектуального полиграфа с уже хорошо зарекомендовавшей себя комбинаторно-вероятностной моделью ( ChanceCalc ) в полиграфе «Диана-01» даст возможность практически исключить элемент субъективности при вынесении заключения по результатам тестирования.
СПИСОК ЛИТЕРАТУРЫ
- 1. Петров А.М., Мягких С.Г. Из записной книжки полиграфолога. – Пермь: Издательский дом «Компаньон», 2003. – 202с.
- 2. Петров А.М., Ясницкий Л.Н. Возможности создания нейросетевого полиграфа // Вестник Пермского университета. Математика. Информатика. Механика. Вып.2. – Пермь: Изд. Пермского университета, 2005. – С.23-27.
- 3. Ясницкий Л.Н. Введение в искусственный интеллект. – М.: Издательский центр «Академия», 2005. – 176с.
- 4. Гладкий С.Л., Ясницкий Л.Н. Интеллектуальное моделирование физических проблем. – Москва-Ижевск: НИЦ «Регулярная и хаотическая динамика», 2006. – 200с.
- 5. Интеллектуальное компьютерное математическое моделирование / С.Л.Гладкий, Н.А.Степанов, Л.Н.Ясницкий; Под ред. Л . Н . Ясницкого ; Перм . Ун - т . – Пермь, 2005. – 119с.
- 6. McCulloch W.S., Pitts W. A Logical Calculus of Ideas Immanent in Nervous Activity // Bull. Mathematical Biophysics. Vol.5. – 1943.
- 7. Розенблатт Ф. Принципы нейродинамики. Перцептроны и теория механизмов мозга. – М.: «МИР», 1965. – 480с.
От редакции:
Проблема поднятая авторами в статье «Интеллектуальный полиграф» интересна, как с теоретических, так и с практических позиций.
Хотелось бы иметь на вооружении полиграфологов свой интеллектуальный блок «Персептон», облегчающий диагностику полиграм.
Для успешного решения поставленной задачи, необходимо решить проблему – оперативного получения психофизиологического паспорта на момент тестирования, но это крайне сложная задача.
Если наследственные признаки определяются относительно легко, то деформация их под влиянием внутренних и внешних факторов оперативно определить очень сложно. Эта процедура усложняется еще и тем, что в организме существуют активирующие (дезактивирующие) биоритмы с периодом 7 – 15 секунд, с непостоянной амплитудой и продолжительностью. Поэтому считаю, что сроки ввода «Интеллектуального полиграфа» и ожидаемая точность прогноза – завышена. В статье есть неточности в определении отдельных понятий. В то же время она представляет определенный научный интерес.
Я буду рад, если авторы опровергнут мой пессимизм и создадут реально работающую систему к концу 2006 года.
Главный редактор В.А. Варламов