Разработване и валидиране на индекс на риска за прогнозиране на оцеляването на бъбречна присадка: Индекс на риск от бъбречна трансплантация
Mar 04, 2022
Въведение
Трансплантация на бъбрекпредлага по-добро качество на живот и превъзходно оцеляване в сравнение с другибъбрекмодалности на заместителна терапия [1]. Здравните системи по света обаче се борят да преодолеят нарастващата пропаст между голямото търсене набъбречни трансплантациии ограниченото предлагане. Една от стратегиите е режисиранетобъбрекприсадки на реципиенти с най-голяма продължителност на живота, като по този начин се намалява както броят на неуспешните присадки, така и броят на пациентите, умиращи с функционираща присадка [2]. Моделите за прогнозиране на риска, предвиждащи неуспех на присадката преди трансплантацията, са клинични опори при сложното вземане на решения за съвпадение на реципиенти с най-голяма дълголетие и алографти с нисък риск от неуспех. Има няколкобъбрекмодели за прогнозиране на риска от присаждане в литературата, които са подпомогнали вземането на медицински решения, базирани на доказателства в клиничната практика [3, 4]. TheБъбрекИндекс на донорския риск (KDRI), разработен от Rao et al. през 2009 г. има широко разпространение при вземането на клинични решения [3] и се използва в САЩБъбрекСистема за разпределение [5]. C-индексът, който показва способността на модела за прогнозиране да различава по-дълго оцелели присадки от по-къси оцелели присадки, обаче е 0.62, стойност, обозначаваща само разумна дискриминация. Новите подходи, базирани на статистика или методи за машинно обучение, имат потенциала да дадат по-точни прогнози [6].
Машинното обучение се разви бързо през последните десетилетия и вече се прилага в някои области на медицинската диагностика [7]. Неотдавнашен систематичен преглед от нашата група подчерта ролята на базираните на машинно обучение модели за прогнозиране на риска при вземането на медицински решения, което води до по-точнитрансплантация на бъбрекпрогнози за резултатите [8]. Нашият преглед обаче установи, че модели, различни от тези, разработени в Съединените щати, обикновено са извлечени от размер на извадката от по-малко от 1 000 пациенти. Освен това нито един от разработените досега модели за машинно обучение не моделира времето до събитие (оцеляване) [8]. Вместо това повечето използват двоичния резултат от неуспех или не. Въпреки това, двоичният подход третира присадка, която оцелява една година, като присадка, която се проваля след две години, значително различни резултати за пациента и здравната система. Тези модели не вземат предвид загубата за проследяване. Следователно, включването на динамиката на времето до събитието в модела за прогнозиране произвежда клинично и икономически важна допълнителна информация [9]. Нашата цел беше да разработим и валидираме статистически и прогнозни модели за машинно обучение, за да предскажем неуспех на присадката след починал донорбъбречна трансплантация,използване на данни от време до събитие в голям национален набор от данни от Австралия.
Ключови думи:Прогнозиране на риска, машинно обучение, недостатъчност на присадката, бъбречна трансплантация, бъбрек
МетодиПротоколът от това проучване е рецензиран и публикуван [10]. Накратко, три модела на машинно обучение (Дърво на оцеляване [11], Случайна гора за оцеляване [12] и векторна машина за поддържане на оцеляване [13]) и един традиционен регресионен (регресия на Кокс [14]) модела от време до събитие (време за оцеляване) бяха генерирани. Това проучване се докладва с помощта на методологията на прозрачното отчитане на многовариантен предсказващ модел за индивидуална прогноза или диагноза (TRIPOD)[15]. Кохорта на проучването Източник на данни е Регистърът за диализа и трансплантация на Австралия и Нова Зеландия (ANZDATA)[16]. Той събира и отчита разпространението, честотата и резултатите от диализата итрансплантация на бъбрекпациенти в Австралия. Наборът от данни съдържа характеристики на донор и реципиент от 7365бъбрексамо трансплантации на починали донори от 1 януари 2007 г. до 31 декември 2017 г., извършени в Австралия.

CISTANCHE ЩЕ ПОДОБРИ БЪБРЕЧНО/БЪБРЕЧНО ЗАБОЛЯВАНЕ
РезултатПървичният резултат е времето до отказ на присадката, започвайки от датата на трансплантацията. Пациентите, които са починали с функционираща присадка, са включени и са цензурирани на датата на смъртта си. Пациентите с функционираща присадка в края на периода на проучването бяха цензурирани отдясно на 31 декември, 2017. Шестдесет и пет пациенти (0,9 процента) бяха изгубени за проследяване и бяха правилно цензурирани на последната им известна дата на проследяване. Независими променливи Нашата цел беше да разработим индекс на риска за използване при вземане на решения преди трансплантация, следователно използвахме само наличните променливи преди трансплантацията и променливите, докладвани в ANZDATA за всички групи пациенти. Бяха идентифицирани общо 67 възможни независими променливи, характеристики както на реципиента, така и на донора[17].
Разработка на моделбеше последователен процес със следните пет стъпки: подготовка на данни, разделяне на набора от данни на набори от данни за обучение и валидиране, избор на променлива, обучение на модел и оценка на модела (фиг. 1).
Стъпка 1: Подготовка на данните Преди разработването на модела данните бяха обработени чрез: третиране на липсващи стойности, фиктивно кодиране на категорични променливи и мащабиране на непрекъснатите променливи. Наборът от данни имаше почти 500 000 точки от данни (7365 пациенти × 67 независими променливи) и 2,5 процента от точките от данни липсваха. Повечето от променливите (64 процента) са имали по-малко от 1 процент липсващи. За променливи с липсващи стойности бяха използвани множество импутации за 14 категорични променливи и 17 непрекъснати променливи с произволна гореща палуба и дървета за класификация и регресия (CART), използвайки „симпутация“ на R пакета [18] с пълния набор от данни от 7365 пациенти. Въз основа на експертно мнение липсващите стойности на 13 категориални променливи бяха определени в отделна категория „липсващи“, за да се избегне загубата на данни. Числените независими променливи бяха нормализирани с помощта на минимално-максимално мащабиране, преобразувайки ги в подобна скала, за да се опростят сравненията между променливите[19]. Категориалните променливи бяха фиктивно кодирани в номинални категории. След фиктивно кодиране общият брой на независимите променливи беше 98.
Стъпка 2: Данни за обучение и валидиранеНаборът от данни беше произволно разделен на две части: набор от данни за обучение и набор от данни за валидиране. Наборът за обучение, използван за обучение на четирите прогнозни модела, съдържаше 70 процента от данните (n=5,156). Наборът за валидиране (n=2,209) беше използван за стабилно тестване на предсказващата сила на всеки модел. Наличието на отделен набор за валидиране осигури по-реалистични оценки на точността на прогнозиране на моделите и помогна да се избегне прекомерното напасване.

Стъпка 3: Избор на променливаВажна стъпка в процеса на изграждане на модела е изборът на пестелив набор от предикторни променливи от големия набор от налични независими променливи (n=98). Твърде много независими променливи в модела рискуват да бъдат пренастроени, от своя страна, намалявайки силата на прогнозиране[20]. Използвани са три методи за избор на независими променливи: 1. Експертно мнение: Три опитни нефролози прегледаха потенциалния набор от независими променливи и посочиха дали променливата има клинично значение. Споразумението на поне двама експерти се счита за адекватно за включване на променлива в модела. 2. Анализът на главните компоненти [21] намалява размерността на набор от данни, като го трансформира в по-малък брой главни компоненти въз основа на корелациите между променливите. Този набор от компоненти в идеалния случай запазва по-голямата част от дисперсията и така не губи информация, но го прави с помощта на по-малко променливи. Използвахме броя на основните компоненти, които запазиха 90 процента от първоначалната вариация. 3. Еластични нетни сделки - на модел ft и сложност за намиране на пестелив модел. Той разглежда набор от модели, използващи санкции, за да се избегне прекомерното приспособяване, които варират от липса на санкция (регресия на Ridge – L2) до екстремна санкция (регресия на ласо – L1), за да се намери идеалната точка за компромис на санкциите с помощта на кръстосано валидиране [22] . Стойностите L1 и L2, които доведоха до най-ниската средна квадратична грешка по време на кръстосано валидиране, бяха използвани за определяне на модела на еластичната мрежа. Тези методи за избор на индивидуални променливи бяха приложени самостоятелно, а също и във всички възможни комбинации, например експертно мнение, последвано от еластична мрежа. Следователно бяха използвани общо седем метода за избор на променливи за генериране на седем различни набора от независими променливи.
Стъпка 4: Обучение на моделИзползвахме четири подхода за моделиране на времето до основното събитие, т.е. резултат от оцеляването. Пропорционална регресия на Кокс[14]. Този полупараметричен модел се използва широко за изследване на връзката между резултатите като данни за оцеляване и независими променливи. След моделиране на избраните независими променливи, броят на променливите беше допълнително намален чрез включване само на тези, които бяха статистически значими (p<0.05). this="" made="" the="" model="" more="" parsimonious="" and="" also="" improved="" predictive="" power.="" survival="" tree[11].="" a="" survival="" tree="" is="" a="" tree-like="" structure,="" where="" leaves="" represent="" outcome="" variables,="" i.e.="" graft="" failure="" (1)="" or="" no="" graft="" failure="" (0),="" and="" branches="" are="" independent="" variables="" that="" influence="" the="" timing="" of="" the="" outcome.="" the="" complexity="" parameter="" was="" set="" to="" 0.00001="" and="" the="" following="" two="" hyper-parameters="" were="" regularized="" until="" the="" optimal="" tree="" was="" created:="" the="" minimum="" number="" of="" samples="" that="" must="" exist="" in="" a="" node="" in="" order="" for="" a="" split="" to="" be="" attempted,="" and="" the="" number="" of="" competitors="" splits="" retained="" in="" the="" output.="" random="" survival="" forest="" (rsf)="" [12].="" rsf="" is="" an="" ensemble="" method="" where="" numerous="" unpruned="" survival="" trees="" are="" developed="" via="" bootstrap="" aggregation[23,="" 24].="" te="" 'variable="" importance'="" was="" set="" to="" "permutation"="" and="" the="" splitting="" rule="" to="" "log-rank".="" te="" hyper-parameters,="" a="" number="" of="" variables="" to="" possibly="" split="" at="" each="" node,="" a="" number="" of="" trees="" and="" a="" minimum="" number="" of="" nodes="" were="" regularised="" to="" achieve="" the="" lowest="" out-of-bag="" prediction="" error.="" 'variable="" importance',="" a="" variable="" selection="" algorithm="" widely="" used="" in="" rsf,="" was="" used="" to="" avoid="" overfitting="" and="" to="" reduce="" the="" prediction="">0.05).>
Векторна машина за подпомагане на оцеляването[13]. Това използва хиперравнини за създаване на класове от независими променливи с линейни (напр. линейна ядрена функция) или нелинейно разделими данни (напр. полиномиално ядро) [26, 27]. Въз основа на производителността на модела, всички модели на опорни векторни машини бяха монтирани с помощта на линейна функция на ядрото с модел на векторна машина за поддържане на оцеляване от тип „регресия“. Седемте набора от независими променливи бяха използвани за обучение и валидиране на четирите прогнозни модела, даващи 28 резултата: седем метода за избор на променлива × четири прогнозни модела. Прогнозираният резултат за всеки от четирите модела беше индекс на интервална скала, който обозначавамеТрансплантация на бъбрекИндекс на риска.

CISTANCHE ЩЕ ПОДОБРИ БЪБРЕЧНАТА/БЪБРЕЧНАТА НЕДОСТАТЪЧНОСТ
Стъпка 5: Оценяване на моделитеНие оценихме моделите, като използвахме методите, предложени от Royston и Altman [28]. Ефективността на модела беше оценена с помощта на два показателя: дискриминация и калибриране. Индекс с добра дискриминация трябва да има по-високи рискови резултати за пациенти с по-висок риск и обратно. Калибрирането измерва точността на прогнозата, тъй като сравнява точността на прогнозираното оцеляване от индекса с оцеляването в наблюдаваните данни[29]. За целта на нашето изследване дискриминацията е по-важна от калибрирането, тъй като целта ни е да предоставим ръководство за вземане на решения, което идентифицира пациенти с относително висок и нисък риск [28]. Следователно най-добрият модел беше избран с помощта на индекса на съгласуваност (C-index)[30], индекс, който оценява способността за разграничаване на модела. Te C-индекс се определя като част от двойки пациенти, при които пациентът, който има по-дълго време на преживяемост, също има по-нисък прогнозен резултат за риска. Диапазонът на съответствие е между нула и едно, като по-високата стойност показва по-добро представяне и 0,5 показва дискриминация по случайност.
Прилагайки методите за оценка на Royston и Altman, индексите на най-подходящите модели бяха категоризирани в четири групи на 16-ти, 50-ти и 84-ти центил, за да се разработят четири прогностични групи: добри, сравнително добри, сравнително лоши и лоши. Използването на групи с различен размер подобри разграничаването на пациентите между четирите групи и групирани пациенти с подобен риск[28]. Преживяемостта на тези четири групи беше сравнена с помощта на графиките на Каплан-Майер, които в идеалния случай трябваше да покажат голяма разлика в оцеляването между четирите групи.
Калибрирането беше визуално оценено с помощта на най-подходящия модел на Cox. Повторните проби от Bootstrap бяха използвани за оценка на коригираната с отклонение предсказана и наблюдавана средна преживяемост на 3 и 5 години след трансплантацията[31]. Перфектното съответствие между прогнозираната и наблюдаваната средна преживяемост показва идеално калибриран прогнозен модел. Най-добрият модел за прогнозиране беше сравнен с предсказващата способност на KDRI, който е настоящият модел, използван от много лица, вземащи клинични решения. Te KDRI има 14 променливи, свързани с донора и трансплантацията, и е разработен с помощта на регресия на Кокс за прогнозиране на цялостния неуспех на присадката. Променливите бяха избрани чрез поетапно изтриване на незначими променливи [3] и този метод за избор на модел има много ограничения, документирани в литературата, включително колинеарност, p-стойности, които са твърде малки и доверителни интервали, които са твърде тесни [32]. Езикът за програмиране Te R (версия 3.6.0), с библиотеките 'survivalism', 'ranger', survival' и 'LTRCtrees', беше използван за разработване на прогнозни модели[33].
ЕтикаДейностите на регистъра ANZDATA получиха пълно етично одобрение от Комитета по етика на изследването на хора на Royal Adelaide Hospital. Това проучване получи етично одобрение от Куинсландския технологичен университет.
Резултати
Базови характеристикиХарактеристиките на реципиентите и донорите са в таблица 1. Общата извадка от изследването включва 7365 починали донорибъбречни трансплантацииизвършено от 1 януари 2007 г. до 31 декември 2017 г. Средната възраст на донорите е 52 години (интерквартилен диапазон 41 до 60), а на реципиентите е 47 години (интерквартилен диапазон 32 до 58). Мнозинството са мъже (63 процента). Около 87 процента от присадките са първични присадки.

Избор на променливи Имаше 98 потенциални независими променливи. Таблица 2 обобщава резултата от трите подхода за избор на подмножество от независими променливи, които не са преувеличени, което води до седем набора от независими променливи. Експертното мнение намали независимите променливи до 40 променливи, докато еластичната мрежа ги намали до 46 променливи. Прилагането на всичките три метода за избор на променлива намали 98 потенциални променливи до 23 основни компонента. Всеки от тези седем комплекта независими променливи беше използван за обучение и тестване на моделите. По време на изграждането на модела независимите променливи бяха допълнително намалени в cox и RSF чрез включване само на тези, които бяха статистически значими (p<0.05) and="" including="" only="" those="" with="" positive="" 'variable="" importance'="" (a="" variable="" selection="" algorithm="" used="" in="" rsf),="" respectively.="" model="" development="" and validation="" te="" predictive="" performance="" of="" the="" models="" is="" compared="" in="" table 3.="" cox="" proportional="" regression="" and="" rsf="" outperformed="" the="" other="" two="" models="" (i.e.="" survival="" tree="" and="" support="" vector="" machine).="" the="" highest="" c-index="" (0.67)="" was="" from="" a="" cox="" proportional="" regression="" model="" which="" used="" expert="" opinion="" as="" the="" variable="" selection="" method="" and="" rsf="" which="" used="" the="" elastic="" net="" as="" the="" variable="" selection="" method.="" a="" c-index="" of="" 0.67="" indicates="" the="" moderate="" discriminative="" ability="" of="" death-censored="" graft="" failure.="" the="" discriminative="" ability="" of="" kdri="" in="" discriminating="" death-censored="" graft="" failure="" was="" 0.53,="" a="" lower="" prediction="" ability="" than="" our="" two="" best="" models.="" the="" cox="" model="" used="" 7="" independent="" variables="" while="" the="" rsf="" used="" 20="" variables="" (table 4).="" since="" the="" cox="" model="" was="" able="" to="" produce="" the="" same="" discriminatory="" power="" with="" a="" lower="" number="" of="" variables,="" it="" was="" considered="" as="" the="" best="" fitting="">0.05)>


Най-подходящ модел на CoxТъй като възрастта на донора е силен предиктор за оцеляването на присадката, в модела беше добавена нелинейна трансформация на възрастта (логаритмична база 2). Това увеличи C-индекса само с 0.003. Ние мащабирахме индекса до средния донор (45 години) и възрастта на реципиента (50 години). Индексът на модела на Кокс се изчислява, както е показано на фиг. 2. Моделът на Уейбул, който предполага, че опасността зависи от времето[34], също беше монтиран като алтернатива. Въпреки това C-индексът беше намален с 0,0014, без увеличаване на дискриминацията, и така запазихме модела на Кокс. Хипертонията на донора (HR 1,43; 95 процента CI 1,16 до 1,76) увеличава риска, докато има поликистозазаболяване на бъбрецитетъй като първичното бъбречно заболяване намалява риска (HR {{0}}.66; 95 процента CI 0.48 до 0,91) (Таблица 5) от неуспех.
Разпределението на индекса общо за пациентите показва, че резултатите от рисковите групи, „Добри“ (< 16th="" centile)="" and="" "fairly="" good"="" (16th–50th="" centile),="" have="" a="" narrow="" separation,="" whereas="" the="" other="" two="" categories="" ("fairly="" poor"="" and="" "poor")="" are="" clearly="" separated="" (supplementary="" figure ="" 1).="" this="" indicates="" that="" the="" cox="" model="" does="" better="" at="" separating="" the="" higher="" risk="" groups.="" the="" cox="" model="" was="" able="" to="" discriminate="" the="" extreme="" categories="" of="" graft="" failure="" risk="" (good="" vs="" poor)="" with="" good="" discriminative="" power="" (c-index="0.73)." discrimination="" between="" other="" groups="" was="" moderate="" (c-index="">0.6) (Таблица 6). Криви на оцеляване на Каплан-Майер, показващи цензурирана смъртбъбрекнеуспех на присадката за четирите рискови групи е на Фиг. 3. Тъй като рисковите групи се движат от "Добри" към "Лоши", кривите на преживяемост демонстрират значително повишен риск от неуспех на присадката. Освен това, в сравнение с групата „Добри“, тъй като групите преминават от „Сравнително добри“ към „Лоши“, коефициентите на опасност се увеличават както в наборите от данни за обучение, така и в валидиращите (Таблица 7). Тези резултати показват, че индексът има добра дискриминационна сила[28].
Средната изчислена преживяемост в сравнение със средната действителна преживяемост на 3-години и 5-години е изобразена на Фиг. 4. В идеално калибриран модел точките от данни ще лежат по протежение на пунктираната линия (перфектна прогнозна линия) , което показва перфектна точност на прогнозата. Средната действителна преживяемост е постоянно по-ниска от прогнозираната преживяемост както на 3, така и на 5 години. Въпреки това, разликата между перфектната линия на прогнозиране и линията на прогнозиране и в двата периода от време намалява с увеличаване на прогнозираното оцеляване. Като цяло моделът на Кокс показва умерено ниво на точност на прогнозиране.
Дискусия
Нашето проучване разработи модел за прогнозиране на риска, за да предскаже неуспех на присадката a priori, използвайки голяма извадка от пациенти. Анализирахме четири възможни модела за прогнозиране, използвайки статистически методи и методи за машинно обучение. Най-добрият модел беше моделът за прогнозиране на риска с регресия на Кокс, който можеше да предвиди неуспех на присаждането, цензуриран от смъртта, с умерено ниво на дискриминация и точност на прогнозиране, използвайки само седем независими променливи. Дискриминационната сила на настоящия индекс превъзхожда повечето налични в момента модели за прогнозиране на риска от неуспех на присадката.


Моделът за прогнозиране на риска е разработен за използване при вземане на решения преди трансплантация (напр.бъбрекразпределение), следователно само променливите, налични преди трансплантацията, се считат за независими променливи. Използвахме вътрешно валидиране, за да създадем пестелив модел, тъй като използването на голям брой независими променливи може лесно да създаде модели с лоша производителност, които не могат да бъдат обобщени поради пренастройване [35]. Поетапният избор на променливи, често използван метод за избор на променливи, който беше използван за разработване на KDRI, е нестабилен метод, който може да създаде модели, които се представят слабо при външно валидиране [28]. Използването на седем различни комбинации за избор на променливи в настоящото проучване, идентифицирани чрез комбинация от експертно мнение и статистика, помогна да се идентифицира

най-важните променливи, които обясняват по-голямата част от дисперсията в данните. Пестеливият модел води до индекс, който е по-лесен за използване в клинична среда. Последният най-добър модел на Кокс има седем променливи, по-малко от броя на променливите, използвани в най-често използваните модели за прогнозиране на риска от неуспех на присадката [3, 36].
Моделът на Кокс превъзхожда трите метода за машинно обучение, използвани в изследването. Прегледът на литературата показва, че точността на прогнозиране дава смесени резултати, когато се сравняват машинното обучение и традиционните методи за прогнозиране [8]. Настоящото проучване използва два дървовидни метода за машинно обучение и по-слабото представяне на тези методи в нашите данни може да е индикация, че данните нямат основна дървовидна структура, където резултатите се определят от двоични разделяния. По-скоро рискът от оцеляване на присадката може да бъде по-зависим от непрекъснати предиктори, като възрастта.
Нашият модел е разработен, за да предскаже смъртно цензурирана неуспех на присадката, докато общата неуспех на присадката включва комбинация от неуспех на присадката, както и смърт с функционираща присадка. Знания за оцеляването на даден донорбъбреке по-важен от цялостния неуспех на присадката при вземането на решения преди трансплантация [2]. В нашето проучване C-индексът на неуспешна трансплантация, цензурирана от смърт, беше 0.67. Клейтън и др. валидира американския KDRI, използвайки австралийски данни [2], и C-индекса при разграничаване на цензурирана смърт

неуспехът на присаждането беше {{0}}.63, което е по-ниска дискриминация от резултатите, получени тук. Въпреки това, включването както на характеристиките на трансплантацията, така и на реципиента (общо независими променливи 24) в KDRI повишава C-индекса на неуспех на присаждането, цензуриран от смърт, до 0.70 в Clayton et al. проучване. Тези автори не са оценили калибрирането (точността на прогнозата), което възпрепятства цялостното сравнение с резултатите от нашето изследване. Нашият най-добър модел има C-индекс от 0,67 само за седем променливи в сравнение с C-индекс от 0,70 за 24 променливи в последния и клиницистите може да преценят, че това малко увеличение на точността не си струва увеличаването на сложността. Моделите за прогнозиране с много променливи също са по-трудни от логистична гледна точка, тъй като изискват събирането на повече данни и само една липсваща променлива означава, че прогнозата не може да бъде оценена.
Освен това, дискриминационната сила на текущия индекс надмина няколко други налични в момента индекси, включително KDRI, както беше описано по-рано. Kasiske и др. (2010), разработи индекс с 11 променливи на донора и реципиента, налични преди трансплантацията, и имаше C-индекс 0.649 [37]. По-скорошен индекс от Molnar et al., през 2018 г., има С-индекс от 0,63 при разграничаване на пациенти с висок риск от неуспех на присадката. Този индекс използва 10 характеристики на донор и реципиент [38]. Следователно индексът, описан в тази статия, успя да постигне превъзходна дискриминационна сила с по-малко променливи. Трябва обаче да обмислим дали прогноза, използваща индекс с умерена дискриминационна способност (C-индекс 0,67), е приемлива за целите на разпределениетобъбреци, тъй като моделът е далеч от идеалния C-индекс от 1, което означава ние


не може да бъде сигурен, че прогнозираните разпределения ще дадат най-добрите резултати. Фалшиво отчитане на висок индекс в модела за прогнозиране по време на трансплантацията може да обезкуражи клинициста, както и пациента да приеме донорскибъбрек. Това е стигматизиращ ефект от погрешното етикетиране на донорбъбреккато „маргинално/ниско качество вече е документирано [39].
Прогнозата за неуспех на присадката е сложен феномен, който включва характеристики на донора, характеристики, свързани с извличането на орган от донор, характеристики на реципиента, характеристики, свързани с трансплантацията, и фактори след трансплантация, като употребата на лекарства за имуносупресия. Решения, свързани сбъбрекразпределението, разбира се, трябва да се извърши преди трансплантацията; следователно факторите за процедурата и след трансплантацията не са налични по време на първоначалното вземане на решение. Следователно източникът на променливостта, която не се отчита в повечето от наличните в момента модели за прогнозиране (както се вижда от тяхното единствено умерено ниво на дискриминационна способност), може да бъде трансплантирани процедурни или свързани с трансплантацията фактори. Те могат също да бъдат донорни или реципиентни фактори, които не се записват рутинно в базите данни, както и непредсказуеми стохастични събития, водещи до несъвършени прогнози. Това означава, че перфектният C-индекс от 1 вероятно е невъзможен за модел, използващ фактори преди трансплантацията. Трудно е да се знае какъв е най-високият постижим C-индекс и това би изисквало отделно моделиране, което включва непроверими предположения за важността на 1) стохастични събития и 2) неизмерени предиктори.

CISTANCHE ЩЕ ПОДОБРИ БЪБРЕЧНА/БЪБРЕЧНА ИНФЕКЦИЯ
Моделът Te Cox успя да дискриминира екстремните категории на риск от неуспех на присадката (добър срещу лош) с добра дискриминационна сила (C-index=0.73), като по този начин полезността на инструмента сред екстремните категории на риск от неуспех на присадката е по-добър в сравнение с други рискови категории. Следователно ограничаването на използването на инструмента само сред тези рискови категории може да доведе до превъзходни резултати втрансплантация на бъбреквземане на решение. Използвахме стабилно вътрешно валидиране, но външното валидиране е важна стъпка към приемането на рисков индекс при вземането на клинични решения, тъй като оценяването на ефективността на модел, базирано само на вътрешно валидиране, може да доведе до прекалено оптимистична оценка на ефективността [28]. Освен това повечето клиницисти може да не желаят да използват инструмент, който не е тестван на различнибъбрекпопулации. Следователно, ние предлагаме този индекс да бъде външно валидиран, за да се оцени възможността за обобщаване преди употреба в клиничната практика. Ако индексът демонстрира добра външна валидност, индексът има потенциал за по-добро привличане на донора към реципиентите, подобрявайки текущиябъбрекразпределяне. Тъй като този индекс има характеристики както на донора, така и на реципиента, той може да предвиди кое съвпадение на донор-реципиент има най-висока преживяемост след трансплантация сред наличните възможности за избор.
Това проучване има няколко ограничения. Прогнозният модел използва само променливите, събрани от ANZDATA, следователно може да не сме включили пълния рисков профил на пациентите. Използвахме само четири метода и други методи за машинно обучение, които биха могли да моделират информация от време до събитие, може да са дали по-добри резултати. Въпреки това, моделите за машинно обучение за данни за оцеляване не са добре разработени, което ограничава нашия избор на типове модели за най-добро приложение [35].
ЗаключениеВ обобщение, новият индекс умерено добре разграничава пациентите с по-висок риск от неуспех на присадката и прави прогнози за неуспех на присадката с умерено ниво на точност. Този обещаващ нов индекс си струва следващата стъпка на външно валидиране, за да се докаже използването му в клинични условия.

CISTANCHE ЩЕ ПОДОБРИ БЪБРЕЧНАТА/БЪБРЕЧНАТА ФУНКЦИЯ
