Лютий 1945-го року. Ялта. В Лівадійському палаці вирішується доля ледь не всього людства. Тодішній президент США Франклін Делано Рузвельт почувається вкрай погано, однак, продовжує впевнено відстоювати інтереси Сполучених Штатів. Протягом останнього року здоров’я президента почало погіршуватись в тривожному темпі – хронічний кашель, періодичні болі в животі, проблеми зі сном, гострий головний біль. Однак, найбільше лікарі переймаються артеріальною гіпертензією. З березня до листопада 1944-го артеріальний тиск політика зростав від 186/108 до 260/150 мм. рт. Ст.. Антигіпертензивних препаратів ще не існує, тож лікарі нічого не можуть зробити.
Plokhy S. Yalta. The Price of Peace / Serhii Plokhy. — New York: Viking, 2011. — 480 p.
Та й загалом існує уявлення, що нормальний систолічний тиск дорівнює 100 + вік людини.
Проте сьогодні критерієм встановлення діагнозу “артеріальна гіпертензія” вважається систолічний артеріальний тиск вище 130 мм. рт. ст. для дорослої людини будь-якого віку, що доволі сильно відрізняється від уявлень про норму 1940-их. Але чому протягом останніх років медицина зробила величезний крок вперед, а багато речей, які ще в середині минулого сторіччя вважались нормальними, зараз вважаються абсолютно невірними та іноді навіть варварськими? Та на чому базується медицина сьогодні (принаймні в розвинених країнах?).
Вірогідно, словосполучення “доказова медицина” ви вже чули неодноразово.
Можливо, ви – пацієнт який знає, що якщо ваш лікар призначив вам гомеопатію чи сумнівну настоянку, придуману якимось академіком 100 років тому, то краще від такого “лікаря” тікати й надалі оминати 10 дорогою. Можливо, ви лікар, яким використовує основні засади доказової медицини в своїй практиці.
Словосполучення “доказова медицина” (або медицина, що базується на доказах – evidence-based medicine) в розвинених країнах вже давно стала синонімом медицини адекватної, медицини “здорової”. Для прогресивного лікаря використання підходів до діагностики та лікування захворювань, заснованих на доказовості, є аксіомою. Так само й пацієнт, який йде на прийом до лікаря, завжди очікує, що його/її захворювання (стан) буде діагностовано якомога точніше, а лікування найкращим та найшвидшим.
Дійсно, дуже часто саме так і трапляється, за що впевнено можемо подякувати підходам до діагностики ті лікування, заснованих та доказовості. Однак, так само часто буває і навпаки. За що так само впевнено “дякуємо” тим самим підходам. Чому так відбувається?
Чи задумувались ви колись, що таке доказова медицина насправді? Що лежить в її основі, в чому полягає її глибинна суть (ідея, база, підгрунття) та на яких принципах вона взагалі побудована? Давайте спробуємо розібратись.
Варто одразу зазначити, що в даній статті не буде чутно дифірамбів доказовій медицині, не буде ноток безмежного вихваляння та захоплення, не буде падінь на підлогу в “доказовому” екстазі, не буде іронічних висміювань сотень тисяч бездоказових препаратів та осіб, що їх застосовують. Також доказова медицина не буде розглядатись у “класичному” вигляді – через призму видів досліджень, рівнів доказовості, опису стадій клінічних випробувань і тому побідне. Таку інформацію можна без жодних зусиль знайти в інтернеті, зокрема й українською мовою.
В даній статті ми спустимось глибше, до самих підвалин доказовості, спробуємо торкнутись їх основи та зрозуміти, як доказова медицина змінює філософський підхід до надання допомоги та чому в розвинених демократичних країнах саме доказова медицина є тим грунтом, на якому будується система охорони здоров’я.
Тож кисневий балон заправлений, маска вдягена, безель годиннка встановлений. Глибокий вдих. Занурення.
Підвалини доказової медицини
Доказова медицина – це підхід до надання допомоги пацієнту, що передбачає використання найкращих доступних досліджень з метою прийняття рішень, засонваних на доказах. Ключове слово в цьому визначенні (та й у доказовій медицині загалом) – це дослідження.
Отже, для того, щоб зрозуміти філософію, закладену в доказовій медицини, треба зрозуміти принципи проведення та інтерпретації результатів дослідження.
Спробуємо розібратись на прикладі: дані одного дослідження демонструють, що в осіб з артеріальною гіпертензією, але без цукрового діабету, підтримка артеріального тиску на рівні <120 мм. рт. ст, (група інтенсивного лікування) призводить до зменшення ризику розвитку серцево-судинних подій та смерті, у порівнянні з підтримкою тиску на рівні <140 мм. рт. ст. (група звичайного лікування).
В результатах дослідження можна знайти статистичні розрахунків, які для зручності пояснення можна поділити на три частини:
- Hazard ratio у групі інтенсивного лікування, 0.75;
- 95% довірчий інтервал [ДІ], 0.64 до 0.89;
- P<0.001.
Перше доволі логічне й очевидне питання: “Що це за числа, Мейсон? Що вони означають?”.
Перша частина демонструє*, що особи з артеріальною гіпертензією та без цукрового діабету, які підтримують тиск <120 мм. рт. ст. мають на 25% (1 - 0.75 = 0.25 = 25%) менший ризик розвитку серцево-судинної події або смерті, порівнюючи з особами, які підтримують тиск <140 мм. Рт. Ст. Поки що наче все просто: менше тиск = менше ризик. Здавалося б, користь від підтримки низького артеріального тиску конкретно в цьому дослідженні вже доведена та очевидна, то навіщо все ускладнювати та додавати оцей 95% довірчний інтервал та якусь p?
*(Hazard ratio часто перекладають як “відношення ризиків”, хоча цей переклад більше пасує до терміну Risk ratio. Беручи до уваги, що Hazard ratio та Risk ratio – це різні поняття, які розраховуються та інтерпретуються по різному, з метою уникнення плутанини залишаємо термін Hazard ratio мовою першоджерела).
Кисню ще достатньо? Занурюємось глибше.
95% довірчий інтервал (95% confidence interval) – що це за показник та чому він необхідний?
Показник 95% довірчого інтервалу (95% confidence interval) зустрічаються ледь не в кожному дослідженні, адже він, по-перше, є показниками статистичної значущості, а, по-друге, дозволяє робити припущення про показники цілої популяції, маючи дані лише з однієї вибірки (див. нижче).
Справа в тому, що в дослідженнях, на основі яких базуються клінічні настанови та рекомендації, майже завжди вивчається певна вибірка з популяції (популяція – загальна сукупність з певною характеристикою, наприклад, всі вагітні на території Великобританії, вибірка – частина з популяції, наприклад 100 вагітних жінок з Великобританії).
Уявіть, що вам треба виміряти середній зріст всіх дорослих мешканців міста Києва та Львова. Теоретично, ви можете визначити зріст ВСІХ мешканців міста та вивести середнє значення – це буде справжнє, істинне значення середнього зросту популяції (ви вирішили почати з Львова, тож в даному випадку дорослого населення міста Львова). Можливо, ви дійсно це зробили та знаєте, що середній зріст всіх дорослих мешканці Львова становить 175,1 см. В нашому уявному випадку це значення є дуже точним, бо дійсно розраховане на основі даних всіх дорослих львів'ян. Однак, уявіть, скільки часу та сил на це знадобилось. А вам ще рахувати весь Київ! Тож для Києва ви вирішили використати інший підхід.
Ви можете зробити вибірку, наприклад, порахувати зріст перших 50 дорослих людей, яких ви зустрінете на вулиці (на диво, ви дуже точно можете виміряти середній зріст людини просто “на око” – навіть Стен Лі в шоці від таких здібностей) та вивести середнє значення. Однак, інтуїтивно зрозуміло, що якби ви вирішили порахувати ріст декількох однакових за розміром груп людей, то кожного разу середній показник був би різним: середній зріст перших 50 осіб міг би становити, наприклад, 177,2 см, других – 168,8 см, третіх – 182,3 см і так далі. Істинний показник для популяції вам невідомий, тож ви (та й ніхто інший) ніколи не дізнається який з показників буде найбільш наближеним до справжнього середнього значення для популяції.
То що ж робити? Так і залишити киян напризволяще з думкою, що вони ніколи не дізнаються справжній середній зріст? Чи витратити купу часу та зусиль, щоб порахувати зріст ВСІХ дорослих мешканців Києва (припустимо, що це дійсно можна зробити). На щастя, в науковців є й третій варіант – ви можете взяти показники перших 50 осіб та розрахувати довірчий інтервал.
Довірчий інтервал може бути розрахований для 60%, для 90%, для 95%, для 99% (загалом для будь-якого відсотку, окрім 100%), але в науковому світі прийнято розраховувати саме 95% довірчий інтервал.
Не будемо надто заглиблюватись та пояснювати математичні основи та теорії, покладені в розрахунок довірчого інтервалу (однак, якщо ви аж надто зацікавились, можете почитати про Центральну межову теорему – базис, на якому побудовані всі розрахунки).
Тож, ви провели виміри, сіла за комп’ютер, провели розрахунки та отримали наступні значення:
Середній зріст дорослого мешканця м. Києва – 174,2 см [95% ДІ: 169,6 см до 178,7 см]
Нарешті дійшли до найцікавішого: як інтерпретувати ці розрахунки?
Якщо (конкретно для нашого прикладу) ви будете повторювати виміри зросту для 50 осіб та будувати довірчі інтервали на основі нових даних знову і знову, і так до нескінченності, то до 95% таких побудованих довірчих інтервалів буде входити істинне середнє значення для всієї популяції. Так само довірчий інтервал можна побудувати і для різниці між групами, і для відношень і навіть для показників рівняння в регресійному аналізі.
Хороша новина: вам не треба рахувати зріст всіх дорослих мешканців Києва, достатньо лише зробити репрезентативну вибірку. І якщо розрахований вами довірчий інтервал буде входити до складу тих 95%, що мають у собі істинне значення, – БУМ! Тепер ви знаєте, що істинний середній зріст всіх мешканців Києва знаходиться десь між 169,6 см та 178,7 см, маючи дані лише 50 осіб!
Погана новина: ви (та й ніхто інший) ніколи не дізнаєтесь, чи розрахований вами довірчий інтервал дійсно потрапив у ці 95%, чи ні. Існує ймовірність (ті 5%, що залишились), що до складу вашого довірчого інтервалу не входить істинне значення. І середній зріст дорослого мешканця Києва може становити, наприклад, 168 см – значення, що лежить поза межами інтервалу. Тобто в кожному дослідженні, де дані отримані з вибірки (а саме так і відбувається у більшості досліджень, в тому числі у клінічних випробуваннях препаратів, адже залучити до дослідження всіх осіб з певним захворюванням просто неможливо), буде присутній елемент невизначеності, і ніхто й ніколи не зможе дізнатись точно. Та й справжнє значення лежить де завгодно в межах інтервалу, (знову ж таки, якщо інтервал “попав”), отже, точне число ми ніколи не дізнаємось.
Тож довірчий інтервал є свого роду компромісом -- завжди існує невизначеність, однак, можна рахувати значення на основі вибірки, а не всієї популяції.
В дослідженні з артеріальним тиском вчені отримали значення 95% довірчого інтервалу [ДІ], 0.64 до 0.89, тобто справжнє зменшення ризику розвитку серцево-судинної події в популяції лежить десь між 36% (1-0.64=0.36=36%) в найкращому випадку та 11% в найгіршому (1-0.89=0.11=11%). Проте існує ймовірність, що справжнє значення взагалі лежить десь поза межами інтервалу – як більше 36%, так і менше 11%. І ніхто ніколи не зможе дізнатись навепне.
Однак, беручи до уваги той факт, що дослідження мало репрезентативну вибірку, дизайн дослідження в цілому непоганий, а значення довірчого інтервалу не перетинає 1, тобто є статистично значущим і в найгіршому випадку (за умови, що інтервал “попав”) все одно ризик зменшується, ми можемо з повною серйозністю поставитись до результатів дослідження та дійсно вважати, що підтримка тиску на рівні <120 мм. рт. ст. у порівнянні з тиском на рівні <140 мм. Рт. Ст., в особ з артеріальною гіпертензією та без цукрового діабету призводить до зменшення ризику розвитку серцево-судинної події або смерті.
Ще буквально пару слів про p й закінчуємо теоретичний дайвінг. Значення p також є показником статистичної значущості, яке може приймати будь-яке значення від 1 до 0, але в науковому світі прийнято вважати результат статистично значущим, якщо p < 0.05. То що ж таке p?
P – вірогідність отримати такі самі результати дослідження, або навіть більш екстремальні, лише за рахунок випадковості, за умови, що нульова гіпотеза вірна (нульова гіпотеза зазвичай вказує, що різниця між двома групами, наприклад, між групою плацебо та препарату, відсутня). Тобто якщо p<0.05 – нульова гіпотеза спростовується та приймається альтернативна гіпотеза (яка, на противагу нульовій, вказує, що різниця між групами існує і це не випадковість).
В дослідження артеріального тиску p<0.001, а отже вірогідність того, що нульова гіпотеза вірна (тобто зменшення ризику розвитку серцево-судинної події або смерті на 25% для групи з тиском <120 мм. рт. ст. отримано випадково) складає менше 0.1% (0,001*100=0.1%).
Цікаво, що якщо 95% довірчий інтервал не перетинає нульове значення (для середніх значень, наприклад тиску чи зросту, це 0,а для відношення це 1) значення p завжди буде менше 0,05 і навпаки. Магія.
І начебто поки що все доволі однозначно. Є проблема, яку треба дослідити, є дослідження, побудоване для вивчення цієї проблеми, і є результати у вигляді сухих даних.
Але отут починаються проблеми.
Як ми змогли побачити, вся суть досліджень (а отже й доказової медицини, на яких вона й будується) полягає у математичних розрахунках на основі даних, отриманих в ході дослідження. І якщо математика це точна наука і 2 + 3 завжди 5, то з приводу того, звідки взялась ця 2 і 3 можуть бути питання.
Дослідження можуть мати цілу купу систематичних похибок, починаючи від того, яким чином формується вибірка, хто до неї входить та закінчуючи оцінкою результатів дослідження. Про дані кажуть, що сміття на вході завжди означає сміття на виході. Тобто які б круті методи статистичного аналізу не були застосовані, якщо дані отримані в результаті сумнівного дослідження, то й розрахунки, зроблені на їх основі, будуть, м’яко кажучи, сумнівними (або просто сміттям).
До того ж, амбіції дослідників часто не мають меж, і кожен хоче зробити якесь величне відкриття (та й таке дослідження з більшою ймовірністю десь опублікують), а тому часто результати дослідження можуть бути на межі статистичної значущості (довірчий інтервал ось-ось перетне нульове значення, а p трохи менше або дорівнює 0.05). І це добре, якщо дизайн дослідження загалом не залишає питань, а в публікації повідомляють про всі можливі похибки.
А тепер уявіть фармацевтичну компанію, яке витратила мільйони доларів на розробку препарату чи вакцини, а в ході клінічних випробувань виявляється, що препарат не діє.
Часто клінічні випробування препаратів тривають роками. Згадайте, скільки часу тривала розробка вакцини проти COVID-19 за тієї умови, що тоді науковці мчали на швидкості боліду Формули-1 аби врятувати людство від пандемії (за звичайних умов вчені їздять на стареньких Фіатах).
Іноді складність статистичних розрахунків, покладених в основу дослідження (якщо вам цікаво, можете почитати про регресійний аналіз та спробувати розібратись), часто робить результати дослідження інтуїтивно незрозумілими та важкими до інтерпретації.
І хоча кількість публікацій в журналах з кожним роком все одно зростає в геометричній прогресії, а методи досліджень все більш покращуються, однак, значна кількість публікацій все одно демонструє хибні та невірні висновки.
Звичайно, у клінічній практиці неможливо покладатись ВИКЛЮЧНО та дані з досліджень. Адже, по-перше, дослідження з приводу певної проблеми чи питання може просто не існувати, а, по-друге, іноді результати дослідження можуть бути не точними, а висновки дуже обережними (колись бачили фразу “необхідні подальші дослідження” в кінці статті?).
Тож якщо лікар хоче послуговуватись доказовою медициною в своїй практиці (а іншого вибору просто не існує) вона або він мають бути дуже уважними й обережно ставитись до результатів будь-якого дослідження, особливо, якщо результаті якісь ну дуже ВАУ.
Черчіль якось сказав про демократію, що це найгірша форма державного правління, якщо не брати до уваги всі інші, що випробувало людство.
Можливо, те саме можна сказати й про доказову медицину. Бо доказова медицина це і є демократія – якщо, наприклад, існує мета-аналіз (грубо кажучи, це аналіз всіх досліджень на певну тему), який демонструє відсутність ефективності тейпування колінного суглобу для зменшення болю, то ніхто не може стверджувати, що тейпування дійсно зменшує біль в колінному суглобі, яку б високу посаду людина не мала та скільки б років досвіду в неї не було. В ідеальному світі доказової медицини всі рівні перед даними.
Саме тому у розвинених демократичних країнах саме доказова медицина є тим постулатом, на якому будується системи охорони здоров’я. В ідеалі, саме на принципах доказової медицини кожен лікар вибудовує підходи до діагностики та лікування захворювань, опираюсь на дані найкращих досліджень, що існують. В ідеалі, все піддається сумніву і нічого не сприймається на віру (навіть якщо фарм представник або професор каже що якийсь препарат чи метод лікування ну ТОЧНО працює).
Так, невизначеність. Так, сумніви, Так, майже ніколи не можна сказати напевне. Так, величезна купа умовностей, вірогідностей та інших складнощів.
Але в нас просто немає іншого вибору. Або ми продовжимо застосовувати принципи доказовості, або повернемось в часи каральної психіатрії, вірувань, медицини авторитетів та інших речей, які сьогодні вважаються дикунством.
_________________________________________________________________________________
Публікація даної статті стала можливою завдяки підтримці Фонду Відродження
The non-governmental organization INgenius is a Ukrainian-language medical platform that has been promoting evidence-based medicine among the community of doctors in Ukraine since 2016. Our team has created an open database of translated treatment protocols, analytical articles on reliable treatments, and analysis of fuflomycins. We also organize events for doctors on a highly professional level.
If you want even more evidence-based Ukrainian-language content, more interesting experiments, and practical activities, support us with the help of donors!
The funds raised will be spent on:
- technical support of the site;
- the monthly payment for platforms such as ZOOM, telegram, etc.;
- payment for a designer;
- free events;
- advertising.
Each of your contributions is a contribution to the future not only of our platform but also of the progressive development of evidence-based medicine in Ukraine.
Revolution in you!
ingeniusua@gmail.com