An interpretable machine learning model for covid-19 screening

Gustavo Carreiro Pinasco; Eduardo Moreno Júdice de Mattos Farina; Fabiano Novaes Barcellos Filho; Willer  França Fiorotti; Matheus Coradini Mariano Ferreira; Sheila Cristina de Souza Cruz; Andre   Louzada Colodette; Luciene Rossati Loureiro; Tatiane Comério; Dilzilene Cunha Sivirino Farias; Eliane  de Fátima Almeida Lima; Katia Valéria Manhambusque

doi:10.36311/jhgd.v32.13324

Autores

Gustavo Carreiro Pinasco Universidade Federal do Espírito Santo – UFES, Brazil;
Eduardo Moreno Júdice de Mattos Farina Universidade Federal de São Paulo – UNIFESP, Brazil;
Fabiano Novaes Barcellos Filho cEscola Superior de Ciências da Santa Casa de Misericórdia de Vitória – EMESCAM, Brazil;
Willer França Fiorotti cEscola Superior de Ciências da Santa Casa de Misericórdia de Vitória – EMESCAM, Brazil;
Matheus Coradini Mariano Ferreira dPrefeitura Municipal de Vitória, Brazil.
Sheila Cristina de Souza Cruz dPrefeitura Municipal de Vitória, Brazil.
Andre Louzada Colodette cEscola Superior de Ciências da Santa Casa de Misericórdia de Vitória – EMESCAM, Brazil;
Luciene Rossati Loureiro dPrefeitura Municipal de Vitória, Brazil.
Tatiane Comério dPrefeitura Municipal de Vitória, Brazil.
Dilzilene Cunha Sivirino Farias dPrefeitura Municipal de Vitória, Brazil.
Eliane de Fátima Almeida Lima aUniversidade Federal do Espírito Santo – UFES, Brazil;
Katia Valéria Manhambusque aUniversidade Federal do Espírito Santo – UFES, Brazil;

DOI:

https://doi.org/10.36311/jhgd.v32.13324

Palavras-chave:

COVID-19, pandemia, aprendizado de máquina, inteligência artificial

Resumo

Introdução: a Doença do Coronavírus 2019 (COVID-19) é uma doença viral que foi declarada uma pandemia pela OMS. Testes diagnósticos são caros e nem sempre estão disponíveis. Pesquisas utilizando a abordagem de aprendizado de máquina (ML) para o diagnóstico de infecção por SARS-CoV-2 têm sido propostas na literatura para reduzir custos e permitir melhor controle da pandemia.

Objetivo: nosso objetivo é desenvolver um modelo de aprendizado de máquina para prever se um paciente tem COVID-19 com dados epidemiológicos e características clínicas.

Método: usamos seis algoritmos de ML para triagem de COVID-19 por meio de predição diagnóstica e fizemos uma análise interpretativa usando modelos SHAP e importâncias de recursos.

Resultados: nosso melhor modelo foi o XGBoost (XGB) que obteve área sob a curva ROC de 0,752, sensibilidade de 90%, especificidade de 40%, valor preditivo positivo (VPP) de 42,16% e valor preditivo negativo ( VPL) de 91,0%. Os melhores preditores foram febre, tosse, história de viagem internacional há menos de 14 dias, sexo masculino e congestão nasal, respectivamente.

Conclusão: Concluímos que o ML é uma importante ferramenta de triagem com alta sensibilidade, em comparação aos testes rápidos, e pode ser usado para potencializar a precisão clínica na COVID-19, doença em que os sintomas são muito inespecíficos.

Downloads

Os dados de download ainda não estão disponíveis.

Referências

WHO Coronavirus Disease (COVID-19) Dashboard. World Health Organization – Avaliable from: <https://covid19.who.int> (2020).

Bustin, S. & Nolan, T. RT-qPCR Testing of SARS-CoV-2: A Primer. International Journal of Molecular Sciences 21, 3004 (2020). DOI: https://doi.org/10.3390/ijms21083004

Wynants, L. et al. Prediction models for diagnosis and prognosis of covid-19: systematic review and critical appraisal. BMJ 369, m1328 (2020). DOI: https://doi.org/10.1136/bmj.m1328

Peiffer-Smadja, N., Maatoug, R., Lescure, FX. et al. Machine Learning for COVID-19 needs global collaboration and data-sharing. Nat Mach Intell 2, 293–294 (2020). DOI: https://doi.org/10.1038/s42256-020-0181-6

Meng, Z. et al. Development and utilization of an intelligent application for aiding COVID-19 diagnosis. medRxiv, (2020). DOI: https://doi.org/10.1101/2020.03.18.20035816

Yan, L. et al. A machine learning-based model for survival prediction in patients with severe COVID-19 infection. medRxiv, (2020). DOI: https://doi.org/10.1101/2020.02.27.20028027

Zangirolami-Raimundo, J., Echeimberg, J. & Leone, C. Research methodology topics: Cross-sectional studies. Journal of Human Growth and Development 28, 356–360 (2018).DOI: https://doi.org/10.7322/jhgd.152198

Orientações para o Manejo de Pacientes de COVID-19. Federal Government of Brazil (2020). Preprint at: <https://www.gov.br/saude/pt-br>.

Cascella, M., Rajnik, M., Cuomo, A., Dulebohn, S. & Napoli, R. Features, Evaluation, and Treatment of Coronavirus. (StatPearls Publishing LLC., 2020).

McIntosh, K., Hirsch, M. & Bloom, A. Coronavirus disease 2019 (COVID-19): Epidemiology, virology, and prevention. Uptodate (2020). Preprint at <https://www.uptodate.com/contents/coronavirus-disease-2019-covid-19-epidemiolog y-virology-clinical-features-diagnosis-and-prevention#H3103904400>

Batista, G., Prati, R. & Monard, M. A study of the behavior of several methods for balancing machine learning training data. ACM SIGKDD Explorations Newsletter 6, 20-29 (2004). DOI: https://doi.org/10.1145/1007730.1007735

Moons, K. et al. Transparent Reporting of a multivariable prediction model for Individual Prognosis Or Diagnosis (TRIPOD): Explanation and Elaboration. Annals of Internal Medicine 162, W1-W73 (2015).DOI: https://doi.org/10.7326/M14-0698

Shah, P., Kendall, F., Khozin, S. et al. Artificial intelligence and machine learning in clinical development: a translational perspective. npj Digit. Med. 2, 69 (2019). DOI: https://doi.org/10.1038/s41746-019-0148-3

Finding a role for AI in the pandemic. Nat Mach Intell 2, 291 (2020). DOI: https://doi.org/10.1038/s42256-020-0196-z

Batista, A., Miraglia, J., Donato, T. & Chiavegatto Filho, A. COVID-19 diagnosis prediction in emergency care patients: a machine learning approach. medRxiv (2020). DOI: https://doi.org/10.1101/2020.04.04.20052092

Ribeiro, M., Singh, S. & Guestrin, C. “Why Should I Trust You?”: Explaining the Predictions of Any Classifier. Association for Computing Machinery 1135–1144 (2016). DOI: https://doi.org/10.1145/2939672.2939778

Lundberg, S. & Lee, S. A Unified Approach to Interpreting Model Predictions. 31st Conference on Neural Information Processing Systems NIPS (2017). Preprint at <https://proceedings.neurips.cc/paper/2017/hash/8a20a8621978632d76c43dfd28b67 767-Abstract.html>

Couzin-Frankel, J. The mystery of the pandemic’s ‘happy hypoxia’. Science 368, 455-456 (2020). DOI: https://doi.org/10.1126/science.368.6490.455

Um modelo de aprendizagem de máquina interpretável para triagem de COVID-19

Autores

DOI:

Palavras-chave:

Resumo

Downloads

Referências

Downloads

Publicado

Edição

Seção

Licença

Dados

Palavras-chave

Artigos mais recentes