Ефективност на алгоритми за машинно обучение за прогнозиране на прогресията към деменция при пациенти с клиника за памет
Mar 20, 2022
Контакт: Audrey Hu Whatsapp/hp: 0086 13880143964 Имейл:audrey.hu@wecistanche.com
Шарлот Джеймс, д-р; Джанис М. Рансън, д-р; Ричард Евърсън, д-р; Дейвид Дж. Луелин, д-р
Резюме
ВАЖНОСТ: Алгоритмите за машинно обучение могат да се използват като основа за помощ при вземане на клинични решения за подобряване на клиничната практика. ЦЕЛ Да се оцени способността на алгоритмите за машинно обучение да прогнозират случаите на деменция в рамките на 2 години в сравнение със съществуващите модели и да се определи оптималният аналитичен подход и броя на необходимите променливи. ДИЗАЙН, НАСТРОЙКА И УЧАСТНИЦИ: Това прогностично проучване използва данни от проспективна кохорта от 15 307 участници без деменция на изходно ниво, за да извърши вторичен анализ на факторите, които биха могли да се използват за прогнозиране на случаите на деменция. Участниците посетиха Националния координационен център за Алцхаймерпаметклиники в Съединените щати между 2005 и 2015. Анализите са проведени от март до 2021 май. ЕКСПОЗИЦИИ: 258 променливи, обхващащи области на клинични мерки и рискови фактори, свързани с деменцията. ОСНОВНИ РЕЗУЛТАТИ И МЕРКИ: Основният резултат е случайна деменция по всякаква причина, диагностицирана в рамките на 2 години от оценката на изходното ниво. РЕЗУЛТАТИ: В извадка от 15 307 участници (средна [SD] възраст, 72,3 [9,8] години; 9129 [60 процента] жени и 6178 [40 процента] мъже) без деменция в началото, 1568 (10 процента) са получили диагноза деменция в рамките на 2 години от първоначалната им оценка. В сравнение с 2 съществуващи модела за прогнозиране на риска от деменция (т.е. сърдечно-съдови рискови фактори, стареене и честота на деменция, рисков рейтинг и кратък индикатор за скрининг на деменция), алгоритмите за машинно обучение са по-добри в прогнозирането на инцидентна деменция по всякаква причина в рамките на 2 години. Алгоритъмът за подсилени с градиент дървета имаше средна (SD) обща точност от 92 процента (1 процент), чувствителност от 0,45 (0,05), специфичност от 0,97 (0,01) и площ под кривата от 0,92 (0,01), използвайки всички 258 променливи. Анализът на променливата важност показа, че са необходими само 6 променливи, за да могат алгоритмите за машинно обучение да постигнат точност от 91 процента и площ под кривата от поне 0,89. Алгоритмите за машинно обучение също идентифицират до 84 процента от участниците, които са получили първоначална диагноза деменция, която впоследствие е обърната към леко когнитивно увреждане или когнитивно неувредено, което предполага възможна погрешна диагноза. ЗАКЛЮЧЕНИЯ И ЗНАЧЕНИЕ: Тези открития предполагат, че алгоритмите за машинно обучение могат точно да предскажат инцидентна деменция в рамките на 2 години при пациенти, получаващи грижи впаметклиники, използващи само 6 променливи. Тези открития могат да бъдат използвани за информиране при разработването и валидирането на помощни средства за вземане на решенияпаметклиники.
Въведение
Много пациенти, оценени в специализирани заведения, като напрпаметклиники, нямат деменция при първото си посещение.1 Разграничаването между пациенти, които развиват деменция в рамките на клинично значим период от време, и тези, които остават без деменция, е важно, тъй като това прозрение може да се използва за приоритизиране на пациентите за последващи изследвания и интервенции. Идентифицирането на пациенти с висок риск от развитие на деменция е предизвикателство за клиницистите. Един подход е да се съсредоточите върху тези, които имат леко когнитивно увреждане (MCI) при първоначална оценка и да поканите тези пациенти за проследяване. Това обаче може да доведе до значителна погрешна класификация за пациенти, които не са насочени за проследяване, но които развиват деменция, и пациенти, които са насочени за допълнителни изследвания, но не развиват деменция.
Повечето пациенти в клиниката за памет с MCI не прогресират до деменция дори след 10 години, с годишен процент на конверсия от 9,6 процента.2 Клиничните средства за вземане на решения могат да подобрят способността на клиницистите да оценят началото на деменция. Налични са съществуващи клинични помощни средства за вземане на решения за оценка на средносрочната и дългосрочната честота на деменция в различни популации. Например рисковият рейтинг за сърдечносъдови рискови фактори, стареене и честота на деменция (CAIDE)3 е предназначен да предскаже риска от развитие на деменция след 20 години за хора на средна възраст, а краткият показател за скрининг на деменция (BDSI)4 има за цел да идентифицира възрастните хора пациентите да се насочат към когнитивен скрининг чрез определяне на риска от развитие на деменция след 6 години. Въпреки това, доколкото ни е известно, не е разработена клинична помощ за вземане на решения за прогнозиране на случаите на деменция в клиниките за памет за по-кратък клинично значим период. Машинното обучение (ML) позволява използването на информация от големи и сложни набори от данни. Напоследък се прилага за диагностициране на деменция и прогнозиране на риска.5-9
Въпреки това, тези модели често включват информация, която обикновено не е налична в рутинната клинична практика, като усъвършенствани невроизобразявания, генетични тестове и биомаркери на цереброспиналната течност, ограничавайки клиничното приложение до специализирани или изследователски настройки. Проучихме дали техниките за машинно обучение могат да се използват за предсказване на случаите на деменция за 2-годишен период, използвайкипаметклинични данни от Националния координационен център за Алцхаймер на САЩ (NACC). Ние също така проверихме минималния набор от променливи, необходими за ML моделите, за да достигнат пълна диагностична производителност.
Методи
Проучването на NACC получи етично одобрение от институционалния съвет за преглед на всеки сайт, преди да може да предостави данни, и всички участници са предоставили информирано писмено съгласие. Това прогностично проучване се счита за освободено от институционално етично одобрение, тъй като използвахме предварително събрани деидентифицирани данни. Данните, използвани в това проучване, са достъпни чрез заявка за данни до NACC. Това проучване се докладва в съответствие с насоките за докладване на Прозрачно отчитане на многовариантен предсказващ модел за индивидуална прогноза или диагноза (TRIPOD). Данните са анализирани от март до май 2021 г.
Извадка за изследване
Използвахме предварително събрани данни от Единния набор от данни на NACC (UDS).10 UDS съдържа проспективни кохортни данни от програмата на Националния институт за стареене на Центъра за болестта на Алцхаймер на САЩ за многоцентрово съвместно изследване на болестта на Алцхаймер и други невродегенеративни разстройства.11 Нашият набор от данни се състои от данни от клиника за паметта, събрани между септември 2005 г. и февруари 2015 г. от 30 центъра за болестта на Алцхаймер, разположени в Съединените щати. Наборът от данни включва социодемографски характеристики на участниците и съучастниците, фамилна анамнеза, функционален статус,12 поведенчески симптоми (оценени с резултати от въпросника за невропсихиатрична инвентаризация13), батерия от невропсихологични тестове14 и NACC клинична диагноза на деменция, определена от всеки център за болестта на Алцхаймер, използвайки публикувани клинични диагностични критерии въз основа на стандартизираната UDS клинична оценка. Подробности за диагностичните критерии, приети от протокола UDS и свързаните с него насоки, са публикувани по-рано.15
Използвахме UDS версии 1 и 2, които включват 32 573 посетители на клиника за памет с основна оценка. Въпреки че нашите модели са проектирани да предсказват случаите на деменция в рамките на 2 години, за да отчетат вариациите във времето между последващите прегледи, ние включихме проследяване, настъпило в рамките на 29 месеца от първоначалното посещение, за да гарантираме, че посещението е било първото или втора последваща среща.
Променлива на резултата
Променливата на резултата е инцидентна диагноза на деменция по всякаква причина в рамките на 29 месеца (приблизително 2 години) от изходната оценка. Това включва подтипове на деменция, като деменция на Алцхаймер, деменция с телца на Леви, съдова деменция и други по-редки подтипове. Деменцията на Алцхаймер е диагностицирана съгласно критериите на NINCSD-ADRDA,16 съдовата деменция е диагностицирана съгласно критериите на NINDS-AIREN,17 деменцията с телцата на Lewy (LBD) е диагностицирана съгласно третия доклад на критериите на Консорциума за деменция с телца на Lewy18 и фронтотемпоралната деменция е диагностициран според критериите на Neary и колеги от 1998 г.19

Кандидат-предсказатели
Включихме всички клинично значими променливи, събрани по време на първоначалното посещение във версии 1 и 2 на UDS (eTable 1 в добавката). Изключихме променливи със свободни текстови стойности, като имена на лекарства, и променливи, които бяха постоянни за всички участници, като например броя на посещенията. Бяха генерирани четири синтетични променливи, за да помогнат при оценката на важността на променливата (тези променливи трябва да бъдат класирани ниско); 3 от тези променливи бяха пермутации на съществуващи променливи (1 двоична, 1 категорична и 1 числова променлива), а 1 променлива беше генерирана на случаен принцип от нормално разпределение. Това доведе до общо 258 променливи.
Променливите от UDS, включени в нашите модели, включват демографски характеристики на участниците (15 променливи), демографски характеристики на съучастниците (7 променливи), фамилна история (3 променливи), медицинска история (47 променливи), лекарства (21 променливи), физически (12 променливи) ) и неврологични (4 променливи) резултати от прегледи, Унифицирана скала за оценка на болестта на Паркинсон20 (UDPRS) (28 променливи), скала за клинична оценка на деменцията (CDR)21 (8 променливи), функционален статус (10 променливи), невропсихологична тестова батерия (50 променливи) , скала за гериатрична депресия (17 променливи) и клинична оценка на симптомите (32 променливи). От тези променливи 239 (93 процента) липсваха за поне 1 участник и всички участници имаха поне 1 липсваща променлива.
Разработка на модел
Внедрихме 4 ML алгоритма22: логистична регресия (LR),23 поддържаща векторна машина (SVM),24 произволна гора (RF),25,26 и градиентно подсилени дървета (XGB)27 (eMethods в добавката). Тези алгоритми изпълняват задача за класифициране: те определят дали даден участник попада в клас 0 (предвижда се да остане без деменция 29 месеца от изходното ниво) или клас 1 (предвижда се да изпита инцидентна деменция в рамките на 29 месеца от изходното ниво). Класификацията се основава на променливи, записани при първото им (изходно) посещение в клиниката за памет. За внедряване на алгоритмите за ML използвахме библиотеката за обучение на Python sci-kit (Python Software Foundation),28 с 5-кратно кръстосано валидиране (eMethods в добавката). Липсващите стойности бяха приписани чрез вземане на проби със замяна от нелипсващи стойности. Цялата обработка и анализ на данни бяха внедрени във версия 3.9 на Python, версия 1.19.4 на NumPy и версия на sci-kit-learn 0.24.0.
Статистически анализ
Оценка на модела
Оценихме ефективността на всички модели, като сравнихме тяхната цялостна точност, чувствителност и специфичност за прагове за вземане на решения, предварително посочени в литературата (съществуващи модели) или праг от 0.5 (ML модели), който еднакво претегля фалшиво-положителните и фалшиво-отрицателни грешки. Площта под кривата на работната характеристика на приемника (AUC)29 беше използвана за обобщаване на производителността на модела над всички възможни прагове и по този начин теглата на грешките при неправилна класификация.30 Средните мерки за производителност и SDs бяха получени чрез първоначално зареждане (eMethods в добавката).
Сравнение със съществуващи модели
BDSI и CAIDE са съществуващи модели за прогнозиране на риска от деменция, които присвояват на пациентите резултат, представляващ техния риск от развитие на деменция за по-дълги времеви мащаби. За да извлечем рисковите резултати на BDSI и CAIDE, ние избрахме променливи от UDS, които най-точно съответстват на променливите, използвани преди това (eТаблица 2 в добавката). Ефективността на нашите ML модели беше сравнена с тази на BDSI и CAIDE за прогнозиране на 2-годишна честота на деменция.
Ефективност на модела при подтипове деменция
Деменцията може да има различни причини, съответстващи на различни подтипове на деменция. За да оценим способността на ML моделите да идентифицират различни подтипове на деменция, ние разделихме инцидентните случаи на деменция на деменция на Алцхаймер, LBD, васкуларна деменция и други подтипове на деменция. Използвайки тези 4 стратификации, ние изчислихме процента на участниците, правилно класифицирани (истинско положителен процент) и сравнихме ROC кривите за всеки ML модел.
Изследване на диагностична стабилност
Известно е, че клиничната диагноза на деменция включва пациенти, които първоначално са били неправилно диагностицирани (ефективно както фалшиво-положителни, така и фалшиво-отрицателни грешки).31 Ние дефинираме реверсия като когато участник, който е бил диагностициран с деменция до 2 години след първото им посещение в клиника за памет и впоследствие получава диагноза липса на деменция (или MCI, или ненарушена когнитивна функция) в рамките на 2 години след поставянето на диагнозата деменция. Разсъждавайки, че тези реверсии са нестабилни диагнози и вероятно са били резултат от погрешна диагноза на деменция, ние изследвахме точността на класификацията на ML моделите в извадка от участници с реверсия (eMethods в добавката). Използвахме кумулативната функция на разпределение (CDF) на класификационните резултати, получени от всеки ML модел, за да сравним участниците с реверсия с пациенти, които са развили деменция, и пациенти, които са останали без деменция.

Резултати
След изключване на {{0}} участници с диагноза деменция в началото, 4557 участници, които не са имали никакви данни за проследяване, и 573 участници, които са имали първото си проследяване повече от 29 месеца след първото им посещение , крайната аналитична извадка съдържа 15 307 участници (средна [SD] възраст, 72,3 [9,8] години; 9129 [60 процента] жени и 6178 [40 процента] мъже). Примерни характеристики са показани в таблица 1. В рамките на 2 години от изходното ниво, 1568 участници (10 процента) са получили диагноза деменция. От 1568 участници, които са получили диагноза деменция, 273 (17 процента) са диагностицирани от един клиницист, а 1216 (78 процента) са диагностицирани от консенсусна група; за 79 участници (5 процента), източникът на диагнозата не е посочен. Ключовите мерки за ефективност, оценяващи предсказващата сила на всеки модел, са дадени в таблица 2. В сравнение със съществуващите модели, моделите на ML са по-добри в способността си да предскажат дали дадено лице ще развие деменция в рамките на 2 години и превъзхождат съществуващите модели по всички показатели. Всички ML модели се представиха еднакво добре, като XGB имаше най-голяма мощност, когато се измерва чрез обща точност (92 процента) и AUC (средно [SD], 0,92 [0,01]). Кривата на работната характеристика на приемника за всеки модел демонстрира сходството между моделите ML и тяхното превъзходство в сравнение с 2-та съществуващи модела на риска (Фигура 1).
Ефективност на модела при подтипове деменция
За да оценим ефективността на ML модела при различни подтипове деменция, разделихме популацията на 4 подтипа деменция: деменция на Алцхаймер (1285 участници), LBD (82 участници), васкуларна деменция (21 участници) и други подтипове деменция (180 участници). Моделът LR е най-добър в идентифицирането на деменция на Алцхаймер и други подтипове, като правилно класифицира 589 участници (46 процента) с деменция на Алцхаймер и 99 участници (55 процента) с други подтипове. Моделът SVM се представи най-добре при участници с LBD, като правилно класифицира 40 участници (49 процента). Всички модели правилно класифицираха 7 участници (33 процента) със съдова деменция. Кривите на работните характеристики на приемника показват, че всички модели се представят приблизително еднакво добре за всеки подтип (eФигура 1 в допълнението).
Изследване на минимален брой променливи
Един потенциален недостатък на използването на ML подход е големият брой включени променливи. Тъй като броят на променливите, изисквани от модела, се увеличава, прилагането в клинична среда става по-малко практично и интерпретируемостта на модела е нарушена. За да оценим колко променливи изисква всеки ML модел, за да постигне еквивалентна предсказваща сила на това, което открихме, използвайки всичките 258 променливи (Таблица 2), ние оценихме как AUC варира с броя на променливите, включени в моделите. По-конкретно, ние класирахме променливите за всеки модел, като ги сортирахме в низходящ ред по важност (т.е. дискриминационната сила на всяка променлива според алгоритъма; eMethods в добавката). Впоследствие преобучихме всеки модел с нарастващ брой променливи, започвайки с най-важната. Установихме, че всички модели изискват само 22 променливи за постигане на диагностична производителност, статистически неразличима от тяхната оптимална средна производителност (Фигура 2; eФигура 2 в добавката). Синтетичните променливи, добавени, за да гарантират валидността на оценката на важността на променливата, не бяха сред първите 22 променливи за нито един модел, което отразява факта, че след достигането на пълната диагностична ефективност е имало малко информация, която да определи категорично класирането на променливата.
Идентифициране на ключови рискови фактори
От 22-те най-важни променливи за всеки модел, само 5 бяха общи за всички модели (т.е. клинична преценка за влошаване на паметта, когнитивните способности, поведението, способността за управление на делата или двигателните и двигателните промени; време за попълване на теста за правене на пътеки Част Б; CDR: увреждане на ориентацията; CDR: увреждане на дома и хобитата; и ниво на независимост). От останалите променливи имаше 1 0 двойки, които имаха корелация, по-голяма от 0.7, което показва, че те са подобни променливи (eТаблица 3 в допълнението). Отчитайки тази корелация чрез размяна на променливи, които са силно корелирани, ние открихме, че има 6 високо предсказуеми променливи (клинична преценка за спад, време за завършване на теста за правене на следи, част Б, 3 компонента на CDR [ориентация, памет, дом и хобита увреждане] и ниво на независимост), които са общи за всички модели на ML (eТаблица 4 в допълнението). Обучавайки всеки модел, използвайки само тези променливи, открихме, че за LR и XGB не е имало значително намаляване на диагностичната производителност: използвайки този основен набор от 6 променливи, тези модели имат средна (SD) точност от 91 процента (0 процент ) за LR и 91 процента (1 процент ) за XGB и средна (SD) AUC от 0.89 (0.01) за LR и 0,89 (0,02) за XGB (eТаблица 5 в Приложението).
Диагностична стабилност
От 1568 участници, които са получили диагноза деменция в рамките на 2 години, идентифицирахме 130 (8 процента) като преживели реверсия, които вероятно първоначално са били неправилно диагностицирани и следователно неправилно етикетирани за целите на машинното обучение. Ние открихме, че докато реверсиите са докладвани само при 0,8 процента от участниците, те представляват 92 до 109 участници (7 процента -8 процента ) от неправилно класифицираните участници, с малко вариации между моделите (Таблица 3). RF моделът има най-висока диагностична стабилност, идентифицирайки правилно 109 от 130 участници с реверсия (84 процента), като ги класифицира като прогнозирани като свободни от деменция след 2 години. За да изследваме диагностичната стабилност на ML моделите, премахнахме участниците с реверсия по време на обучение (eMethods в добавката). След повторно обучение на моделите без реверсии открихме, че RF идентифицира 106 участници, които са преживели реверсии (медиана [IQR], 82 процента [78 процента -82 процента]), SVM идентифицира 93 участници, които са преживели реверсии (медиана [IQR], 72 процента [69 процента -74 процента ]), и LR, и XGB идентифицираха 92 участници, които са преживели реверсии (медиана [IQR], 71 процента [68 процента -75 процента ]). IQR бяха получени чрез стартиращи участници, които са преживели реверсия.
За да разберем разликата между неправилно класифицирани участници, участници с реверсия и участници, които са развили деменция без реверсия, анализирахме CDF на класификационни резултати, получени от всеки ML модел. Установихме, че резултатите на неправилно класифицираните участници и специфичните участници с реверсия са различни от участниците, които са развили деменция, и тези, които не са (еФигура 3 в добавката). CDF на класификационните резултати за участниците, които не са развили деменция, паднаха най-вляво на всеки график, което показва, че ML моделите определят на тези участници ниска вероятност за развитие на деменция. Обратно, за участниците, които наистина са развили деменция, CDFs са паднали вдясно от графиките: на тях е определена висока вероятност за развитие на деменция. За всички модели разпределението на резултатите за участниците с реверсия падна вляво от това за участниците, които са развили деменция, което означава, че участниците с реверсия са оценени като имащи по-ниска вероятност да развият деменция според тези модели.

Дискусия
В това прогностично проучване, ML алгоритмите имат превъзходна прогностична точност в сравнение с BDSI и CAIDE при прогнозиране на случаите на деменция в рамките на 2 години след първата оценка на клиниката за паметта на пациента. Два от ML алгоритмите бяха оценени за постигане на точност от 91 процента и AUC от 0.89 само с 6 ключови променливи. Анализите на чувствителността предполагат, че моделите на ML биха могли правилно да класифицират голяма част от участниците, преживели реверсия, които са потенциално неправилно диагностицирани в рамките на 2 години от първоначалното им посещение. Това проучване има няколко силни страни, включително голямата извадка от пациенти, получени от множество клиники за памет в Съединените щати, широката гама от използвани техники за машинно обучение, сравняване със съществуващи рискови модели и изследване на диагностична стабилност и вероятна погрешна диагноза.
Предишни проучвания за използването на ML за предсказване на риска от деменция са фокусирани върху превръщането от неувредена когнитивна способност в деменция на Алцхаймер или MCI,6,8 или превръщането от MCI в деменция на Алцхаймер.5 Тези подходи са по-малко полезни в клинична среда, тъй като изключват други видове деменция5,6,8 или пациенти, които първоначално са без когнитивни увреждания.5 Данните, използвани в тези проучвания, включват позитронно-емисионни томографски сканирания,5,8, и биомаркери на цереброспиналната течност,8 от които не са често налични в клиники за памет. Проучване на Lin et al6 преодолява това, като използва данни от NACC, за да намери набор от 15 неинвазивни клинични променливи за оценка на риска от преобразуване от ненарушена когнитивна способност към MCI за 4-годишен период. Конструктът на MCI обаче остава донякъде противоречив,32 и процентите на конверсия между MCI и деменция често са ниски.32,33 Нашите ML модели допълват тези анализи и имат предимството да включват само 6 ключови променливи спрямо клинично значима времева скала и да прогнозират резултат от деменция по всякаква причина.
От съществуващите модели, изследвани в нашето проучване, моделът CAIDE беше най-малко точен при прогнозиране на риска от деменция за 2 години, което не е изненадващо, като се има предвид, че е разработен за прогнозиране на дългосрочен риск от деменция при възрастни на средна възраст за много по-дълъг период период на проследяване от 20 години. BDSI се представи по-добре от CAIDE, което вероятно отразява, че е предназначено за употреба при по-възрастни хора за по-умерен период на проследяване от 6 години. Въпреки това, всички ML модели надминаха тези съществуващи модели. Използвайки всички променливи, XGB беше най-мощният подход на ML при прогнозиране на пациенти, които е вероятно да бъдат диагностицирани с деменция в рамките на 2 години, което предполага, че начинът, по който новите дървета на решенията се обучават да коригират грешките на последните три, води до незначително представяне печалба. Въпреки това, XGB изглежда също така е подходът, който най-малко може да идентифицира участниците, които са преживели реверсия, т.е. тези, които първоначално са били диагностицирани с деменция в рамките на 2 години и тази диагноза е обърната в рамките на 2 години от първоначалната диагноза.
Производителността на ML моделите може да бъде значително намалена от неправилно маркирани данни за обучение.34 Противно на интуицията, изключването на неправилно маркирани данни за обучение не винаги подобрява производителността.35 Тъй като нивото на шума в данните за обучение се увеличава, стойността на изключването или намаляването на този шум намалява, ако същият шум присъства в данните за валидиране.36 По този начин филтрирането на данни за обучение може дори да намали данните за невалидност на производителността, както е установено в това проучване. Въпреки това, когато нивото на неправилно маркиране е по-малко от приблизително 20 процента до 40 процента, премахването на неправилно маркирани данни може да подобри точността на валидиращите данни, дори ако това включва неправилно маркирани данни.35,37,38 Това илюстрира значението на изследването на диагностичната стабилност в обучението и данни за валидиране: дори стандартните данни за критерий съдържат грешки.
Наблюдаваният процент на реверсия (8 процента) е подобен на този, открит в проучване от 2019 г., базирано на различно население в САЩ.31 В нашето проучване беше установено, че процентът на фалшивите положителни резултати варира от 7 процента до 19 процента, в зависимост от когнитивните използвана оценка. Доколкото ни е известно, това е първият анализ на потенциална погрешна диагноза в NACC UDS и предполага, че използването на ML като клинична помощ при вземане на решения има потенциала да намали погрешната диагноза на фалшивите положителни резултати с до 84 процента. Като се има предвид, че пациентите, които претърпяват реверсия, са гранични в диагностичен смисъл, от клинична гледна точка, може да е разумно те все пак да бъдат проследявани, като се има предвид, че е имало основания за клинична загриженост. По този начин XGB може да бъде най-добрият модел за помощ при вземане на клинични решения. Алтернативно, ансамбълният подход, който прави вторични прогнози за вероятната диагностична стабилност и потенциала за погрешна класификация, може да се окаже още по-полезен.
Ограничения
Това проучване има няколко ограничения. Първо, както CAIDE, така и BDSI са разработени с помощта на различни популации от тази, използвана в това проучване. Не всички променливи, използвани за разработването на тези модели, са имали точен еквивалент в UDS, което може да е повлияло на тяхното представяне в този набор от данни. Второ, методът, използван за импутиране на данните, може да доведе до грешка при импутирането. По-конкретно, импутацията замества всички липсващи стойности с числена стойност, но някои стойности липсват поради връзката им с друга стойност; следователно фактът, че дадена стойност липсва, е информативен. Въпреки това, докато участниците имаха средно 14 процента липсващи данни, 6-те идентифицирани ключови променливи липсваха за средно 1 процент от участниците. Трето, въпреки че нашето проучване използва голяма извадка от посетители на клиника за памет в Съединените щати, което прави нашите резултати изключително приложими за тази среда, степента, до която тези резултати ще се обобщят за други популации, не е известна.
Изводи
Това прогностично проучване установи, че ML моделите превъзхождат съществуващите модели за прогнозиране на риска от деменция и може да имат потенциала да подобрят прогнозата за инцидентна деменция за 2 години в клиниките за памет. Шест ключови фактора за риска от деменция, идентифицирани в това проучване, може да имат потенциала да подобрят клиничната практика в клиниките за памет, ако бъдат включени в бъдещи помощни средства за вземане на клинични решения.


