Список форумов ПОЛИГРАФ - ФОРУМ ПОЛИГРАФ - ФОРУМ
Для общения по теме " Детекция лжи "
 
  На главную FAQFAQ   ПоискПоиск   ПользователиПользователи   ГруппыГруппы   РегистрацияРегистрация 
 ПрофильПрофиль   Войти и проверить личные сообщенияВойти и проверить личные сообщения   ВходВход 

Еще раз про статистическую значимость.
На страницу Пред.  1, 2, 3 ... 12, 13, 14
 
Начать новую тему   Ответить на тему    Список форумов ПОЛИГРАФ - ФОРУМ -> Общий форум
Предыдущая тема :: Следующая тема  
Автор Сообщение
Александр Калафати



Зарегистрирован: 12.10.2011
Сообщения: 1249
Откуда: Москва

СообщениеДобавлено: Вт Мар 05, 2019 7:25 pm    Заголовок сообщения: Ответить с цитатой

Дон Крэпол поделился статьёй, на которую идут периодические ссылки.
Это статья Барланда от 1985 года. Где он впервые даёт распределение колоколов. Там даются вероятности того, что лжец получит такой балл или больший.

_________________
Быть, а не казаться.
http://polygraph-triumph.ru/
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Посетить сайт автора
York



Зарегистрирован: 29.09.2010
Сообщения: 943
Откуда: оттуда на марше

СообщениеДобавлено: Вт Мар 05, 2019 8:17 pm    Заголовок сообщения: Ответить с цитатой

Александр Калафати Спасибо за статью.

В 2013? году я искал эту статью. И не нашёл.

Статья от 1985 года, и тогда Барланда похоже что ни кто не понял. Как впрочем очень похоже что не понимают и сейчас. Хотя вообщем - то всё лежит на поверхности.

Жалко, что в статье самих распределений баллов не приведено. Было бы интересно посмотреть.

А так совсем непонятно зачем они группировали наблюдаемые частоты в пять интервалов? Похоже, что они обращались с баллами как - будто это непрерывные СВ, а баллы - дискретные и группировать их совсем не надо, разве только в хвостах, чтобы ожидаемые частоты были больше пяти как того требует хи2.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
Александр Калафати



Зарегистрирован: 12.10.2011
Сообщения: 1249
Откуда: Москва

СообщениеДобавлено: Ср Мар 06, 2019 9:03 am    Заголовок сообщения: Ответить с цитатой

Юрий, последнюю фразу не понял. Какие 5 интервалов?
Если про колонки таблицы то там слева направо:

1. Баллы
2. Z-баллы для "лжецов"
3. Вероятность того что лжец наберет такой балл или больший
4. Z-баллы для "правдивых"
5. Вероятность того что правдивый наберет такой балл или больший

Для правдивых средний бал 6,9 , для лжецов -8,3
Станд. отклонение - правдивые 8,65 и 8,78


Или это? Each of the two frequency distribution curvеs was
separately grouped into intervals of five.
Каждое из распределений частот было разделено на интервалы по пять. Не 5 интервалов, а интервалы по 5.
И дальше про Хи2 .

_________________
Быть, а не казаться.
http://polygraph-triumph.ru/
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Посетить сайт автора
York



Зарегистрирован: 29.09.2010
Сообщения: 943
Откуда: оттуда на марше

СообщениеДобавлено: Ср Мар 06, 2019 10:41 am    Заголовок сообщения: Ответить с цитатой

Видимо, я не правильно понял.
Цитата:

Каждое из распределений частот было разделено на интервалы по пять. Не 5 интервалов, а интервалы по 5.


Но такой вариант ясности не прибавляет. Как говриат) русские: Хрен редьки не слаще. Надо понимать такой вариант, что разбиение на интервалы было, и в каждый интервал было включено по пять соседних баллов?

Если делают замеры непрерывной случ. величины, то из данных образуют вариационный ряд, который затем разбивают на интервалы в которые входят соседние значения СВ. Для дискретной СВ так делать не надо. Единтсвенно только, если:

Цитата:

...разве только в хвостах, чтобы ожидаемые частоты были больше пяти как того требует хи2
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
$erP
Site Admin


Зарегистрирован: 29.06.2005
Сообщения: 6599
Откуда: Москва

СообщениеДобавлено: Ср Мар 06, 2019 12:36 pm    Заголовок сообщения: Ответить с цитатой

Александр Калафати писал(а):
Дон Крэпол поделился статьёй, на которую идут периодические ссылки.
Это статья Барланда от 1985 года.

Уже предвкушал удивление и радость... думал, что это действительно оригинальная статья 1985 года... Ан нет...

На самом деле, предложена статья, опубликованная в 1989 году в диссертации Матте в качестве приложения . К диссертации есть открытый доступ на сайте самого Матте. Оригинальной статьи Барланда, официально где-то опубликованной или выложенной именно в 1985 году, видимо, нет...


$erP писал(а):
5) Из всего того, что "выдал" Нельсон с данным подходом к ESS, я принципиально не согласен с тем, что он называет "альфу" ошибкой теста. Это не ошибка теста как таковая. Ее нельзя ни считать, ни называть "ошибкой теста". Ни ложноположительной, ни ложноотрицательной. Об этом еще Барланд совершенно недвусмысленно говорил... а он первым придумал и использовал подобный "нормативный" подход для оценки результатов теста...

Сам Барланд на 144 странице отчетливо и настойчиво предупреждает о том, чтобы не смешивали понятия "вероятность получить меньший балл" и "вероятность ошибки"...

Но, думаю, началось все не с Нельсона.

После Барланда в 1989 году Матте был вторым, кто воспользовался "вероятностым" подходом к оценке точности результатов тестирования. Матте пользовался консультациями Барланда при написании диссертации, за что и благодарит Барланда где-то в первых абзацах своей работы... В диссертации косяков нет... Все-таки сказываются, личное присутствие первоисточника Барланда...

А вот уже спустя 15 лет третьим использовал вероятностный подход сам Крэпол, когда разрабатывал свою Объективную систему оценки полиграмм. Надо смотреть статью в Журнале Полиграфе за 1999 году. Он тоже изначально ссылается на Барланда как на первоисточник своего подхода. Выкладывает и предлагает руководствоваться нормативными таблицами. Но его слова об интерпретации таблицы уже не отличаются корректностью.

Например, он "говорит": "According to these data, if an examiner, utilizing the objective scoring system and the ZCT technique with the DoDPI protocol, scored an examination as a -8, Table 9 would indicate that a mere 6% of nondeceptive cases using the objective scoring system have scores that low or lower"
"Согласно этим данным, если полиграфолог, использующий объективную систему оценки и МКВ метод, оценил полиграммы на -8 баллов, таблица девять покажет, что только в 6% нелгущих случаев будут получены такие же баллы или ниже"

Вроде все ОК... но буквально следующая фраза раскрывает, какой тайным смысл сам Крэпол в нее вкладывает...

"Similarly, a DI call based on a +20 score would have a 1% chance of being correct. If the user wishes to avoid errors, wide cutting scores can be applied."
"Таким же образом, вывод "Ложь обнаружена" при +20 баллах будет иметь шанс в 1% быть правильным. Если пользователь желает избежать ошибок, то необходимо применять более широкие границы принятия решения".

Вот это вот "... будет иметь шанс в 1% быть правильным... избежать ошибок..." - это слова уже совсем из другой оперы... это слова, которые сам Барланд категорически увещевал не произносить применительно к нормативной таблице.

Видимо, с этого и пошло... Поскольку Крэпол и Нельсон в друзьях, а, судя по всему, именно Крэполовская идея объективной системы оценки полиграмм была заложена в разработку OSS и, как следствие, далее ESS, то итог в виде некорректной интерпретации нормативных данных в наши дни был предрешен.

_________________
Мое почтение... $erP

................................... ЛЕГКО СОЛГАТЬ ТЯЖЕЛО


Последний раз редактировалось: $erP (Ср Мар 06, 2019 12:46 pm), всего редактировалось 1 раз
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
$erP
Site Admin


Зарегистрирован: 29.06.2005
Сообщения: 6599
Откуда: Москва

СообщениеДобавлено: Ср Мар 06, 2019 12:43 pm    Заголовок сообщения: Ответить с цитатой

York писал(а):
Видимо, я не правильно понял.
Цитата:

Каждое из распределений частот было разделено на интервалы по пять. Не 5 интервалов, а интервалы по 5.


Когда выборка размазанная и неравномерная... часто используется прием - укрупняется диапазон... объединяются частоты...
Может, речь идет об объединении частот по группам баллов по пять штук в каждой группе?
То есть не "-20... -19... -18... -17... -16... -15... -14... ... ... 0... +1... +2... ... ... +10... ... ... +20",

а "-20...-16, -15...-11, -10...-6, -5...-1, 0...+4, +5...+10, +11...+15, +16...+20".

_________________
Мое почтение... $erP

................................... ЛЕГКО СОЛГАТЬ ТЯЖЕЛО
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
Александр Калафати



Зарегистрирован: 12.10.2011
Сообщения: 1249
Откуда: Москва

СообщениеДобавлено: Ср Мар 06, 2019 12:59 pm    Заголовок сообщения: Ответить с цитатой

Вот сиди и думай теперь. ЧТо хотели сказать - интервалы по 5.

Сергей Владимирович , согласен с версией событиё Барланд, Матте, Крэпол, Нельсон. Очень похоже на правду.

Попробую выцыганить статью от 1985 году. Это доклад на конференции в Израиле. Может произошло недопонимание...

_________________
Быть, а не казаться.
http://polygraph-triumph.ru/
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Посетить сайт автора
York



Зарегистрирован: 29.09.2010
Сообщения: 943
Откуда: оттуда на марше

СообщениеДобавлено: Ср Мар 06, 2019 1:06 pm    Заголовок сообщения: Ответить с цитатой

$erP

Да и это тоже .

Если непрерывная СВ, то обязательно разбивают на интервалы.

В случае дискретных баллов это возможно только если данных мало. Вот я и написал, что хорошо бы посмотреть на сами распределения.

Если данных было мало, то в каждом таком интервале всё рвано должно быть более пяти баллов. Пять - это как говорится самый край корректного применения xи2.

И как - то не могу представить как это разбить на интервалы по 5 баллов(наверное, корректней сказать по пять значений баллов) в каждом? Напрмер в вершине колокола (в районе среднего балла) в выборке имеется меньше пяти баллов что - ли? Раз возникла необходимость объеденить его с соседними баллами в один интервал? А какие тогда частоты чуть дальше от середины? А на сигме, вообще, нули? Выборка какого объёма быда использована для вычислений? Мизер?

Вот я и говорю, хорошо бы взглянуть своими глазами, а не гадать.

Хотя это частности (но существенные!), а наиболее важен сам принцип. И это уже история, и полной статьи, видимо, не найти. Поэтому, благоразумней вопрос снять и не баламутить воду)
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
York



Зарегистрирован: 29.09.2010
Сообщения: 943
Откуда: оттуда на марше

СообщениеДобавлено: Ср Мар 06, 2019 1:47 pm    Заголовок сообщения: Ответить с цитатой

Very Happy
Всё - таки глаянул статью ещё раз.

Результат тестов длч группы невиновных (хи2 - 3.1187, df = 4), для группы виновных (x2 = 5.2652 df = 3)

df - это ведь степени свободы? (Приводить значение статистики хи2 без указания степеней свободы нет ни какого смысла)

А раз так, то для группы невиновных было 7 интервалов, а для группы виновных - 6 интервалов.

Т.е. весь диапазон баллов от -36 до 36 (из таблицы) собрали в 7 и 6 диапазонов. Объём выборок очень мал?

Если группировали по пять занчений, то объём выбокри для невиновных 7*5 = 35, а для виновных 6*5 = 30

Т.е. было 35 невиновных и 30 виновных.

Если это так, то надо сказать, что определённые таким образом параметры теоретического распределения почти точно далеки от параметров распределения ген. совокупности. И вытекающие отсюда вычисления имеют малую точность.

Но важен сам принцип!


Последний раз редактировалось: York (Ср Мар 06, 2019 2:00 pm), всего редактировалось 1 раз
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
$erP
Site Admin


Зарегистрирован: 29.06.2005
Сообщения: 6599
Откуда: Москва

СообщениеДобавлено: Ср Мар 06, 2019 1:58 pm    Заголовок сообщения: Ответить с цитатой

York писал(а):
Объём выборок очень мал?

"Полные данные включали 120 правдивых субъектов и 74 обманывающих" (стр. 143)

_________________
Мое почтение... $erP

................................... ЛЕГКО СОЛГАТЬ ТЯЖЕЛО
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
York



Зарегистрирован: 29.09.2010
Сообщения: 943
Откуда: оттуда на марше

СообщениеДобавлено: Ср Мар 06, 2019 2:03 pm    Заголовок сообщения: Ответить с цитатой

$erP

Тогда в интервалы попало больше чем по пять значений баллов.

Тогда значит и интервалов было больше чем пять, и в интервалах не по пять значений баллов.

Что тогда это за цифра 5 связанная с интервалами?
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
$erP
Site Admin


Зарегистрирован: 29.06.2005
Сообщения: 6599
Откуда: Москва

СообщениеДобавлено: Ср Мар 06, 2019 2:04 pm    Заголовок сообщения: Ответить с цитатой

Вообще, судя по тексту, это объединение трех выборок трех ранних исследований: Барланд-Раскин, 1975, Доусон, 1977, исследование Колледжа Канадской Полиции. Все три исследования - на вымышленных преступлениях.
_________________
Мое почтение... $erP

................................... ЛЕГКО СОЛГАТЬ ТЯЖЕЛО
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
Александр Калафати



Зарегистрирован: 12.10.2011
Сообщения: 1249
Откуда: Москва

СообщениеДобавлено: Ср Мар 06, 2019 3:50 pm    Заголовок сообщения: Ответить с цитатой

Если это выдержка из книги Матте, то он мог что-то не так понять просто.
_________________
Быть, а не казаться.
http://polygraph-triumph.ru/
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Посетить сайт автора
$erP
Site Admin


Зарегистрирован: 29.06.2005
Сообщения: 6599
Откуда: Москва

СообщениеДобавлено: Вс Мар 10, 2019 7:18 pm    Заголовок сообщения: Ответить с цитатой

Александр Калафати писал(а):
Попробую выцыганить статью от 1985 году. Это доклад на конференции в Израиле. Может произошло недопонимание...
Александр Юрьевич, не надо хлопот... Приведенная в диссертации Матте статья Барланда - натуральная от 1985 года.

Если посмотреть внимательно, то Матте вставил в свою диссертацию не перепечатку статьи Барланда, а ее прямую ксерокопию из оригинального сборника статей 1985 года.

Поэтому по хронологии в диссертации статья располагается в качестве приложения на 180х страницах (как помнится), но на самой ксерокопии видятся 140е номера страниц самого сборника.

_________________
Мое почтение... $erP

................................... ЛЕГКО СОЛГАТЬ ТЯЖЕЛО
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
York



Зарегистрирован: 29.09.2010
Сообщения: 943
Откуда: оттуда на марше

СообщениеДобавлено: Пт Мар 15, 2019 10:13 pm    Заголовок сообщения: Ответить с цитатой

York писал(а):
Александр Калафати писал(а):


Я это подозревал. Но решил уточнить.
Но я так понял, что после всего можно как-то скомпенсировать ситуацию? Слово jacknife я встречал в публикациях. Попробую найти.


Не буду сейчас категоричен в своём утверждении, но сорее всего, что jacknife может дать лучшую оценку в случае маленькой выборки. Если выборка большая, то эффект от jacknife может быть мал. Хотя можно поэксперементировать...


jacknife улучшает оценку для смещённой статистики (для std). mean не смещённая оценка мат. ожидания. поэтому jacknife для mean бесполезен. А вот для std улучшает оценку, и процедура эта имеет кооректное математическое доказательство.

Посредством jacknife скорректировал std для выборки объёмом 394. Эффект в третьем знаке, конкретнее поправка в 0,005. То есть, результат процедуры для большой выборки действительно очень мал. Если выборка небольшая - jacknife - это "то что доктор прописал". Но кооректировать std имеет смысл, если заранее известно mean, или известно, что оценка mean "хороша".
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
Показать сообщения:   
Начать новую тему   Ответить на тему    Список форумов ПОЛИГРАФ - ФОРУМ -> Общий форум Часовой пояс: GMT + 3
На страницу Пред.  1, 2, 3 ... 12, 13, 14
Страница 14 из 14

 
Перейти:  
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
You cannot attach files in this forum
You cannot download files in this forum


Powered by phpBB © 2001, 2005 phpBB Group
Рейтинг@Mail.ru Rambler's Top100