Консультация № 186777
05.11.2012, 08:28
94.05 руб.
05.11.2012, 23:50
0 12 1
Уважаемые эксперты! Пожалуйста, ответьте на вопрос:
Было проведено скрининговое исследование рака простаты в некой популяции мужчин. Изучалась диагностическая значимость теста PSA (prostata antigen test). Чувствительность теста составила 72,1%, специфичность - 93,2%, распространённость (prevalence) рака простаты среди мужчин оценивается как 16,1%.
1. Какова вероятность, что у случайным образом отобранного пациента НЕ БУДЕТ рака простаты при положительном тесте PSA? P(D-|T+)
2. Какова вероятность, что у случайным образом отобранного пациента БУДЕТ рак простаты при отрицательном тесте PSA? P(D+|T-)

Хотелось бы увидеть полный ход решения.
Для облегчения задачи я рассчитал false positive rate (0.068) и false negative rate (0.279).
Заранее спасибо.

Обсуждение

давно
Мастер-Эксперт
17387
18345
05.11.2012, 12:25
общий
05.11.2012, 12:25
Адресаты:
Здравствуйте, доктор!

В связи с поставленными Вами вопросами небезынтересной представляется статья "Диагностические исследования: показания, точность и ценность". Надеюсь, Вы её осилите, прежде чем ждать ответов от экспертов? Там, в принципе, Вы можете найти и ответы на свои вопросы.
Об авторе:
Facta loquuntur.
давно
Старший Модератор
17042
808
05.11.2012, 13:05
общий
05.11.2012, 16:53
Попытался решить следующим образом.

Составим таблицу 2 х 2:

[table]
[row][col lightblue][/col][col lightblue] D+ [/col][col lightblue] D- [/col][col lightblue] Всего [/col][/row]
[row][col lightblue] T+[/col][col] 0,068 * 1000 [/col][col]?[/col][col lightblue] ? [/col][/row]
[row][col lightblue] T- [/col][col]?[/col][col] 0,279 * 1000 [/col][col lightblue] ? [/col][/row]
[row][col lightblue] Всего [/col][col lightblue] 0,161 * 1000 [/col][col lightblue] ? [/col][col lightblue] 1000 [/col][/row]
[/table]

Путём несложных подсчётов заполним её ячейки:

[table]
[row][col lightblue][/col][col lightblue] D+ [/col][col lightblue] D- [/col][col lightblue] Всего [/col][/row]
[row][col lightblue] T+[/col][col] 68 [/col][col] 560 [/col][col lightblue] 628 [/col][/row]
[row][col lightblue] T- [/col][col] 93 [/col][col] 279 [/col][col lightblue] 372 [/col][/row]
[row][col lightblue] Всего [/col][col lightblue] 161 [/col][col lightblue] 839 [/col][col lightblue] 1000 [/col][/row]
[/table]

P(D-|T+) = P(D- T+) / P(T+) = 0.56 / 0.628 = 0.8917
P(D+|T-) = P(D+ T-) / P(T-) = 0.093 / 0.372 = 0.25

Тем не менее, робот, проверяющий задания, сообщает об ошибке.
Что же не так?
Об авторе:
We have but faith: we cannot know;
For knowledge is of things we see;
And yet we trust it comes from thee,
A beam in darkness: let it grow.
-----
https://www.linkedin.com/in/andreynkuznetsov
https://www.researchgate.net/profile/Andrey_Kuznetsov11
http://www.researcherid.com/rid/K-8824-2014
Неизвестный
05.11.2012, 16:09
общий
Адресаты:
Если обозначить величины таблицы 2х2 как tp, tn, fp, fn, то решение можно получить из уравнений
p = tp/(tp + fp) = 0.932 (precision)
r = tp/(tp + fn) = 0.721 (recall)
q = tp + fn = 0.161
Отсюда:
1. fp = r*q*(1 - p)/p = 0.008 (false positive)
2. fn = q*(1 - r) = 0.045 (false negative)
давно
Старший Модератор
17042
808
05.11.2012, 16:59
общий
05.11.2012, 17:02
Как я уже писал в условии задачи, false positive rate и false negative rate я уже посчитал (и робот подтвердил правильность расчёта):

FPR = 1 - специфичность = 0,068
FNR = 1 - чувствительность = 0,279

Вычислить необходимо P(D-|T+) и P(D+|T-), где D+ / D- - наличие / отсутствие рака простаты, а T+ / T- - положительный / отрицательный PSA тест.

В своём (неверном) варианте решения я пытался исходить из условной популяции в 1000 человек, заполняя ячейки таблицы, исходя из данных распространённости, FPR и FNR.
Об авторе:
We have but faith: we cannot know;
For knowledge is of things we see;
And yet we trust it comes from thee,
A beam in darkness: let it grow.
-----
https://www.linkedin.com/in/andreynkuznetsov
https://www.researchgate.net/profile/Andrey_Kuznetsov11
http://www.researcherid.com/rid/K-8824-2014
давно
Мастер-Эксперт
17387
18345
05.11.2012, 17:05
общий
Адресаты:

Мне кажется, что в соответствии с исходными данными ответом на первый вопрос будет число 0,068, а на второй - число 0,279.

В самом деле, будем отталкиваться от таблицы 2.1, которая содержится в статье, ссылка на которую имеется в моём первом сообщении в этом мини-форуме. Имеем:

Распространение = (а + в)/(а + б + в + г) = 0,161 = 161/1000,
а + в = 161, б + г = 1000 - 161 = 839.

Чувствительность = а/(а + в) = 0,721, а = 0,721(а + в) = 0,721*161 = 116,
в = а + в - а = 161 - 116 = 45.

Специфичность = г/(б + г) = 0,932, г = 0,932*(б + г) = 0,932*839 = 782,
б = б + г - г = 839 - 782 = 57.

Ответ на Ваш первый вопрос сводится к нахождению частоты ложноположительных результатов: в/(а + в) = 45/161 [$8776$] 0,279.

Ответ на Ваш второй вопрос сводится к нахождению числа ложноотрицательных результатов: б/(б + г) = 57/839 [$8776$] 0,068.

А Ваша таблица заполняется так:
[table]
[row][col lightblue][/col][col lightblue] D+ [/col][col lightblue] D- [/col][col lightblue] Всего [/col][/row]
[row][col lightblue] T+[/col][col] 116 [/col][col] 57 [/col][col lightblue] 173 [/col][/row]
[row][col lightblue] T- [/col][col] 45 [/col][col] 782 [/col][col lightblue] 827 [/col][/row]
[row][col lightblue] Всего [/col][col lightblue] 161 [/col][col lightblue] 839 [/col][col lightblue] 1000 [/col][/row]
[/table]
Об авторе:
Facta loquuntur.
давно
Старший Модератор
17042
808
05.11.2012, 17:44
общий
Адресаты:
Увы! Робот опять выдал ошибку. Буду думать дальше.
Об авторе:
We have but faith: we cannot know;
For knowledge is of things we see;
And yet we trust it comes from thee,
A beam in darkness: let it grow.
-----
https://www.linkedin.com/in/andreynkuznetsov
https://www.researchgate.net/profile/Andrey_Kuznetsov11
http://www.researcherid.com/rid/K-8824-2014
Неизвестный
05.11.2012, 19:57
общий
Адресаты:
Цитата: Андрей Кузнецов aka Dr_Andrew
false positive rate и false negative rate я уже посчитал

Если я правильно понимаю терминологию:
Специфичность - доля больных раком среди тех, у кого тест положительный.
Чувствительность - доля положительных тестов среди всех больных.
Тогда вы посчитали FPR относительно популяции с положительным тестом и FNR относительно популяции больных раком. А в задаче требуется FP/FN относительно всей популяции.
Неизвестный
05.11.2012, 20:30
общий
05.11.2012, 20:32
Адресаты:
Сами числа б и в являются ответами на вопрос, так как представляют ложноположительные и ложноотрицательные результаты соответственно среди всей популяции т.е. вероятности для случайного поциента.
давно
Старший Модератор
17042
808
05.11.2012, 22:23
общий
Адресаты:
Итак, робот выдал мне правильные ответы:
Вероятность, что у случайным образом отобранного пациента НЕ БУДЕТ рака простаты при положительном тесте PSA, P(D-|T+) равна 0.329527
Вероятность, что у случайным образом отобранного пациента БУДЕТ рак простаты при отрицательном тесте PSA, P(D+|T-) равна 0.05432434

Теперь думаю, как были получены эти числа...
Об авторе:
We have but faith: we cannot know;
For knowledge is of things we see;
And yet we trust it comes from thee,
A beam in darkness: let it grow.
-----
https://www.linkedin.com/in/andreynkuznetsov
https://www.researchgate.net/profile/Andrey_Kuznetsov11
http://www.researcherid.com/rid/K-8824-2014
давно
Мастер-Эксперт
17387
18345
05.11.2012, 23:07
общий
06.11.2012, 09:30
Адресаты:
Здесь приводится пример заполнения таблицы, аналогичной Вашей. Для правильного её заполнения выполним следующие расчёты:

- распространённость P = (TP + FN)/(TP + FN + FP + TN) = 0,161 = 161/1000,
поэтому если TP + FN + FP + TN = 1000, то TP + FN = 161 (это число является суммой для первого столбца), FP + TN = 1000 - 161 = 839 (это число является суммой для второго столбца);

- чувствительность Se = TP/(TP + FN) = 0,721,
поэтому TP = 0,721 * (TP + FN) = 0,721 * 161 = 116 (это число должно быть записано в первую сверху ячейку первого столбца), FN = 161 - 116 = 45 (это число должно быть записано во вторую сверху ячейку первого столбца);

- специфичность Sp = TN/(FP + TN) = 0,932,
поэтому TN = 0,932 * (FP + TN) = 0,932 * 839 = 782 (это число должно быть записано во вторую сверху ячейку второго столбца), FP = 839 - 782 = 57 (это число должно быть записано в первую сверху ячейку второго столбца);

(для указанных выше параметров непонятно, почему робот выдаёт сообщение об ошибке; таблица была мной заполнена правильно)

- false positive rate
FPR = FP/(FP + TN) = 57/839 = 0,068;

- false negative rate
FNR = FN/(TP + FN) = 45/161 = 0,280;

(эти два указанных выше параметра и Вы, и я вычислили одинаково)

- положительная прогностическая ценность
PPV = TP/(TP + FP) = 116/(116 + 57) = 0,671;

- отрицательная прогностическая ценность
NPV = TN/(FN + TN) = 782/(45 + 782) = 0,946.

И, как я понимаю,
ответом на Ваш первый вопрос будет P(D-|T+) = 1 - PPV = 1 - 0,671 = 0,329;
ответом на Ваш второй вопрос будет P(D+|T-) = 1 - NPV = 1 - 0,946 = 0,054.

А здесь я, конечно, грубо ошибался:
Цитата: Гордиенко Андрей Владимирович
Ответ на Ваш первый вопрос сводится к нахождению частоты ложноположительных результатов: в/(а + в) = 45/161 [$8776$] 0,279.

Ответ на Ваш второй вопрос сводится к нахождению числа ложноотрицательных результатов: б/(б + г) = 57/839 [$8776$] 0,068.

Даже стыдно стало.

Естественно, можно и сразу указать, что P(D-|T+) = FP/(TP + FP) = 57/173 = 0,329; P(D+|T-) = FN/(FN + TN) = 45/823 = 0,054, не находя PPV и NPV. Величины FPR и FNR, как видите, нам тоже не понадобились.

Надеюсь, теперь всё утряслось?

Я предлагаю Вам исправить слово "скриниговое" на "скрининговое" в тексте вопроса. И если не возражаете, позвольте мне из своих сообщений в мини-форуме консультации скомпоновать ответ.
Об авторе:
Facta loquuntur.
давно
Мастер-Эксперт
17387
18345
06.11.2012, 07:58
общий
это ответ
Здравствуйте, Андрей Кузнецов aka Dr_Andrew!

Здесь приводится пример заполнения таблицы, аналогичной той, которую Вы указали в мини-форуме консультации. Для правильного её заполнения выполним следующие расчёты:

- распространённость P = (TP + FN)/(TP + FN + FP + TN) = 0,161 = 161/1000,
поэтому если TP + FN + FP + TN = 1000, то TP + FN = 161 (это число является суммой для первого столбца), FP + TN = 1000 - 161 = 839 (это число является суммой для второго столбца);

- чувствительность Se = TP/(TP + FN) = 0,721,
поэтому TP = 0,721 * (TP + FN) = 0,721 * 161 = 116 (это число должно быть записано в первую сверху ячейку первого столбца), FN = 161 - 116 = 45 (это число должно быть записано во вторую сверху ячейку первого столбца);

- специфичность Sp = TN/(FP + TN) = 0,932,
поэтому TN = 0,932 * (FP + TN) = 0,932 * 839 = 782 (это число должно быть записано во вторую сверху ячейку второго столбца), FP = 839 - 782 = 57 (это число должно быть записано в первую сверху ячейку второго столбца);

- false positive rate
FPR = FP/(FP + TN) = 57/839 = 0,068;

- false negative rate
FNR = FN/(TP + FN) = 45/161 = 0,280;

- положительная прогностическая ценность
PPV = TP/(TP + FP) = 116/(116 + 57) = 0,671;

- отрицательная прогностическая ценность
NPV = TN/(FN + TN) = 782/(45 + 782) = 0,946.

И, как я понимаю, ответом на Ваш первый вопрос будет P(D-|T+) = 1 - PPV = 1 - 0,671 = 0,329; ответом на Ваш второй вопрос будет P(D+|T-) = 1 - NPV = 1 - 0,946 = 0,054.

Естественно, можно и сразу указать, что P(D-|T+) = FP/(TP + FP) = 57/173 = 0,329; P(D+|T-) = FN/(FN + TN) = 45/823 = 0,054.

А соответствующая таблица заполняется так:
[table]
[row][col lightblue][/col][col lightblue] D+ [/col][col lightblue] D- [/col][col lightblue] [/col][/row]
[row][col lightblue] T+[/col][col] TP=116 [/col][col] FP=57 [/col][col lightblue] PPV=116/(116+57)=0,671[/col][/row]
[row][col lightblue] T- [/col][col] FN=45 [/col][col] TN=782 [/col][col lightblue] NPV=782/(45+782)=0,946[/col][/row]
[row][col lightblue] [/col][col lightblue] Se=116/(116+45)=0,721 [/col][col lightblue] Sp=782/(57+782)=0,932 [/col][col lightblue] [/col][/row]
[/table]

С уважением.
5
Об авторе:
Facta loquuntur.
давно
Старший Модератор
17042
808
06.11.2012, 11:35
общий
Адресаты:
Цитата: Гордиенко Андрей Владимирович
Величины FPR и FNR, как видите, нам тоже не понадобились.


Дело в том, что я следовал советам гарвардских тренеров по решению задачи. По-видимому, либо Вы предложили лучшее решение, либо я их не понял. Большое спасибо за ответ: полагаю, что мне надо его тщательно изучить, т.к. подобные задачи довольно типичны.
Об авторе:
We have but faith: we cannot know;
For knowledge is of things we see;
And yet we trust it comes from thee,
A beam in darkness: let it grow.
-----
https://www.linkedin.com/in/andreynkuznetsov
https://www.researchgate.net/profile/Andrey_Kuznetsov11
http://www.researcherid.com/rid/K-8824-2014
Форма ответа