Обзор программ для оценки патогенности генетических вариантов
https://doi.org/10.24884/1607-4181-2025-32-1-11-20
Аннотация
В настоящее время молекулярно-генетические методы играют важную роль в диагностике ряда патологий. Внедрение массового параллельного секвенирования значительно увеличило объем данных, описывающих варианты ДНК пациентов с различными заболеваниями, но клиническое значение многих из этих результатов остается неизвестным. Для оценки эффекта генетических вариантов широко используется автоматическое определение клинической значимости вариантов при помощи программ-предикторов. Отечественные и международные руководства по интерпретации данных, полученных методами массового параллельного секвенирования, рекомендуют использовать программы-предикторы для определения клинического значения генетических вариантов. Однако, принципы работы и характеристики этих программ в научной литературе описаны недостаточно. В данном обзоре на примере наиболее популярных программ-предикторов представлены основные принципы их работы, которые используются для оценки патогенности вариантов.
Об авторах
Д. С. БугРоссия
Буг Дмитрий Сергеевич, младший научный сотрудник, НИЦ биоинформатики НОИ биомедицины
197022, Санкт-Петербург, ул. Льва Толстого, д. 6-8
А. Н. Наркевич
Россия
Наркевич Артем Николаевич, доктор медицинских наук, доцент, профессор кафедры общественного здоровья и здравоохранения
454092, г. Челябинск, ул. Воровского, д. 64
Н. В. Петухова
Россия
Петухова Наталья Витальевна, кандидат медицинских наук, руководитель центра НИЦ биоинформатики НОИ биомедицины
197022, Санкт-Петербург, ул. Льва Толстого, д. 6-8
Список литературы
1. Cook C. E., Bergman M. T., Finn R. D. et al. The European Bioinformatics Institute in 2016: Data growth and integration // Nucleic Acids Res. – 2015. – Vol. 44, № D1. – P. D20–D26. https://doi.org/10.1093%2Fnar%2Fgkv1352.
2. Gagan J., Van Allen E. M. Next-generation sequencing to guide cancer therapy // Genome Med. – 2015. – Vol. 7, № 1. – P. 80. https://doi.org/10.1186/s13073-015-0203-x.
3. Рыжкова О., Кардымон О., Прохорчук Е. и др. Руководство по интерпретации данных последовательности ДНК человека, полученных методами массового параллельного секвенирования (MPS) (редакция 2018, версия 2) // Медицинская генетика. – 2020. – Т. 18, № 2. – C. 3–23. https://doi.org/10.25557/2073-7998.2019.02.3-23.
4. Спектор М., Ясько Л., Друй А. Интерпретация соматических генетических вариантов, выявленных методом высокопроизводительного секвенирования опухолевой ДНК, на примере онкологических заболеваний детского возраста // Медицинская генетика – 2021. – Т. 20, № 3. – C. 3–25. https://doi.org/10.25557/2073-7998.2021.03.3-25.
5. Cooper G. M., Stone E. A., Asimenos G. et al. Distribution and intensity of constraint in mammalian genomic sequence // Genome Res. – 2005. – Vol. 15, № 7. – P. 901–913. https://doi.org/10.1101/gr.3577405.
6. Garber M., Guttman M., Clamp M. et al. Identifying novel constrained elements by exploiting biased substitution patterns // Bioinformatics. – 2009. – Vol. 25, № 12. – P. i54–i62. https://doi.org/10.1093%2Fbioinformatics%2Fbtp190.
7. Pollard K. S., Hubisz M. J., Rosenbloom K. R. et al. Detection of nonneutral substitution rates on mammalian phylogenies // Genome Res. – 2009. – Vol. 20, № 1. – P. 110–121. https://doi.org/10.1101/gr.097857.109.
8. Siepel A., Bejerano G., Pedersen J. S. et al. Evolutionarily conserved elements in vertebrate, insect, worm, and yeast genomes // Genome Res. – 2005. – Vol. 15, № 8. – P. 1034–1050. https://doi.org/10.1101/gr.3715005.
9. Adzhubei I. A., Schmidt S., Peshkin L. et al. A method and server for predicting damaging missense mutations // Nat Methods. – 2010. – Vol. 7, № 4. – P. 248–249. https://doi.org/10.1038/nmeth0410-248.
10. Ashkenazy H., Abadi S., Martz E. et al. ConSurf 2016: an improved methodology to estimate and visualize evolutionary conservation in macromolecules // Nucleic Acids Res. – 2016. – Vol. 44, № W1. – P. W344–W350. https://doi.org/10.1093/nar/gkw408.
11. Calabrese R., Capriotti E., Fariselli P. et al. Functional annotations improve the predictive score of human disease-related mutations in proteins // Hum. Mutat. – 2009. – Vol. 30, № 8. – P. 1237–1244. https://doi.org/10.1002/humu.21047.
12. Choi Y., Sims G. E., Murphy S. et al. Predicting the Functional Effect of Amino Acid Substitutions and Indels // PLoS ONE. – 2012. – Vol. 7, № 10. – P. e46688. https://doi.org/10.1371/journal.pone.0046688.
13. Frazer J., Notin P., Dias M. et al. Disease variant prediction with deep generative models of evolutionary data // Nature. – 2021. – Vol. 599, № 7883. – P. 91–95. https://doi.org/10.1038/s41586-021-04043-8.
14. Reva B., Antipin Y., Sander C. Predicting the functional impact of protein mutations: application to cancer genomics // Nucleic Acids Research. – 2011. – Vol. 39, № 17. – P. e118–e118. https://doi.org/10.1093/nar/gkr407.
15. Sim N., Kumar P., Hu J. et al. SIFT web server: predicting effects of amino acid substitutions on proteins // Nucleic Acids Research. – 2012. – Vol. 40, № W1. – P. W452–W457. https://doi.org/10.1093/nar/gks539.
16. Capriotti E., Fariselli P. Evaluating the relevance of sequence conservation in the prediction of pathogenic missense variants // Hum Genet. – 2022. – Vol. 141, № 10. – P. 1649–1658. https://doi.org/10.1007/s00439-021-02419-4.
17. Adebali O., Reznik A. O., Ory D. S. et al. Establishing the precise evolutionary history of a gene improves prediction of disease-causing missense mutations // Genetics in Medicine. – 2016. – Vol. 18, № 10. – P. 1029–1036. https://doi.org/10.1038/gim.2015.208.
18. Li W., Godzik A. Cd-hit: a fast program for clustering and comparing large sets of protein or nucleotide sequences // Bioinformatics. – 2006. – Vol. 22, № 13. – P. 1658–1659. https://doi.org/10.1093/bioinformatics/btl158.
19. Ng P. C. SIFT: predicting amino acid changes that affect protein function // Nucleic Acids Research. – 2003. – Vol. 31, № 13. – P. 3812–3814. https://doi.org/10.1093/nar/gkg509.
20. Thompson J. D., Higgins D. G., Gibson T. J. CLUSTAL W: improving the sensitivity of progressive multiple sequence alignment through sequence weighting, position-specific gap penalties and weight matrix choice // Nucl Acids Res. – 2007. – Vol. 22, № 22. – P. 4673–4680. https://doi.org/10.1093/nar/22.22.4673.
21. Sievers F., Wilm A., Dineen D. et al. Fast, scalable generation of high-quality protein multiple sequence alignments using Clustal Omega // Molecular Systems Biology. – 2011. – Vol. 7, № 1. – P. 539. https://doi.org/10.1038/msb.2011.75.
22. Katoh K. MAFFT: a novel method for rapid multiple sequence alignment based on fast Fourier transform // Nucleic Acids Research. – 2002. – Vol. 30, № 14. – P. 3059–3066. https://doi.org/10.1093/nar/gkf436.
23. Mount D.W. Using Iterative Methods for Global Multiple Sequence Alignment // Cold Spring Harb Protoc. – 2009. – Vol. 2009, № 7. – P. pdb.top44. https://doi.org/10.1101/pdb.top44.
24. Edgar R.C. MUSCLE: a multiple sequence alignment method with reduced time and space complexity // BMC Bioinformatics. – 2004. – Vol. 5, № 1. – P. 113. https://doi.org/10.1186/1471-2105-5-113.
25. Morgenstern B. DIALIGN 2: improvement of the segment-to-segment approach to multiple sequence alignment // Bioinformatics. – 2002. – Vol. 15, № 3. – P. 211-218. https://doi.org/10.1093/bioinformatics/15.3.211.
26. Notredame C. SAGA: sequence alignment by genetic algorithm // Nucleic Acids Research. – 2002. – Vol. 24, № 8. – P. 1515–1524. https://doi.org/10.1093%2Fnar%2F24.8.1515.
27. Sievers F., Higgins D.G. QuanTest2: benchmarking multiple sequence alignments using secondary structure prediction // Bioinformatics. – 2019. – Vol. 36, № 1. – P. 90–95. https://doi.org/10.1093/bioinformatics/btz552.
28. Ng P.C., Henikoff S. Predicting Deleterious Amino Acid Substitutions // Genome Res. – 2002. – Vol. 11, № 5. – P. 863–874. https://doi.org/10.1101/gr.176601.
29. Shihab H.A., Gough J., Cooper D.N. et al. Predicting the Functional, Molecular, and Phenotypic Consequences of Amino Acid Substitutions using Hidden Markov Models // Human Mutation. – 2012. – Vol. 34, № 1. – P. 57–65. https://doi.org/10.1002/humu.22225.
30. Tang H., Thomas P. D. PANTHER-PSEP: predicting disease-causing genetic variants using position-specific evolutionary preservation // Bioinformatics. – 2016. – Vol. 32, № 14. – P. 2230–2232. https://doi.org/10.1093/bioinformatics/btw222.
31. Glaser F., Pupko T., Paz I. et al. ConSurf: Identification of Functional Regions in Proteinsby Surface-Mapping of Phylogenetic Information // Bioinformatics. – 2002. – Vol. 19, № 1. – P. 163–164. https://doi.org/10.1093/bioinformatics/19.1.163.
32. Chun S., Fay J. C. Identification of deleterious mutations within three human genomes // Genome Res. – 2009. – Vol. 19, № 9. – P. 1553–1561. https://doi.org/10.1101/gr.092619.109.
33. Stone E. A., Sidow A. Physicochemical constraint violation by missense substitutions mediates impairment of protein function and disease severity // Genome Res. – 2005. – Vol. 15, № 7. – P. 978–986. https://doi.org/10.1101/gr.3804205.
34. Tavtigian S. V. Comprehensive statistical study of 452 BRCA1 missense substitutions with classification of eight recurrent substitutions as neutral // Journal of Medical Genetics. – 2005. – Vol. 43, № 4. – P. 295–305. https://doi.org/10.1136/jmg.2005.033878.
35. Frazer J., Notin P., Dias M. et al. Disease variant prediction with deep generative models of evolutionary data // Nature. – 2021. – Vol. 599, № 7883. – P. 91–95. https://doi.org/10.1038/s41586-021-04043-8.
36. Moles-Fernández A., Duran-Lozano L., Montalban G. et al. Computational Tools for Splicing Defect Prediction in Breast/Ovarian Cancer Genes: How Efficient Are They at Predicting RNA Alterations? // Front. Genet. – 2018. – Vol. 9. – P. 366. https://doi.org/10.3389/fgene.2018.00366.
37. Mahmood K., Jung C., Philip G. et al. Variant effect prediction tools assessed using independent, functional assay-based datasets: implications for discovery and diagnostics // Hum Genomics. – 2017. – Vol. 11, № 1. – P. 10. https://doi.org/10.1186/s40246-017-0104-8.
38. Pollard K. S., Salama S. R., Lambert N. et al. An RNA gene expressed during cortical development evolved rapidly in humans // Nature. – 2006. – Vol. 443, № 7108. – P. 167–172. https://doi.org/10.1038/nature05113.
39. Rao C.R. Score Test: Historical Review and Recent Developments / Eds. N. Balakrishnan, H. N. Nagaraja, N. Kannan. – Boston, MA: Birkhäuser, 2005. – P. 3–20. http://dx.doi.org/10.1007/0-8176-4422-9_1.
40. Siepel A., Pollard K. S., Haussler D. New Methods for Detecting Lineage-Specific Selection / Eds. A. Apostolico et al. – Berlin, Heidelberg: Springer Berlin Heidelberg, 2006. – P. 190–205. https://doi.org/10.1007/11732990_17.
41. Kircher M., Witten D. M., Jain P. et al. A general framework for estimating the relative pathogenicity of human genetic variants // Nat Genet. – 2014. – Vol. 46, № 3. – P. 310–315. https://doi.org/10.1038/ng.2892.
42. Quang D., Chen Y., Xie X. DANN: a deep learning approach for annotating the pathogenicity of genetic variants // Bioinformatics. – 2014. – Vol. 31, № 5. – P. 761–763. https://doi.org/10.1093/bioinformatics/btu703.
43. Ionita-Laza I., McCallum K., Xu B. et al. A spectral approach integrating functional genomic annotations for coding and noncoding variants // Nat Genet. – 2016. – Vol. 48, № 2. – P. 214–220. https://doi.org/10.1038/ng.3477.
44. Shihab H.A., Rogers M.F., Gough J. et al. An integrative approach to predicting the functional effects of non-coding and coding sequence variation // Bioinformatics. – 2015. – Vol. 31, № 10. – P. 1536–1543. https://doi.org/10.1093/bioinformatics/btv009.
45. Dong C., Wei P., Jian X. et al. Comparison and integration of deleteriousness prediction methods for nonsynonymous SNVs in whole exome sequencing studies // Human Molecular Genetics. – 2015. – Vol. 24, № 8. – P. 2125–2137. https://doi.org/10.1093/hmg/ddu733.
46. Jagadeesh K. A., Wenger A. M., Berger M. J. et al. M-CAP eliminates a majority of variants of uncertain significance in clinical exomes at high sensitivity // Nat Genet. – 2016. – Vol. 48, № 12. – P. 1581–1586. https://doi.org/10.1038/ng.3703.
47. Ioannidis N. M., Rothstein J. H., Pejaver V. et al. REVEL: An Ensemble Method for Predicting the Pathogenicity of Rare Missense Variants // The American Journal of Human Genetics. – 2016. – Vol. 99, № 4. – P. 877–885. https://doi.org/10.1016/j.ajhg.2016.08.016.
48. Koonin E. V. Orthologs, Paralogs, and Evolutionary Genomics // Annu. Rev. Genet. – 2005. – Vol. 39, № 1. – P. 309–338. https://doi.org/10.1146/annurev.genet.39.073003.114725.
49. Han J., Batey S., Nickson A. A. et al. The folding and evolution of multidomain proteins // Nat Rev Mol Cell Biol. – 2007. – Vol. 8, № 4. – P. 319–330. https://doi.org/10.1038/nrm2144.
50. Lipton Z. C. The mythos of model interpretability // Queue. – 2020. – Vol. 16, № 3. – P. 31–57. https://doi.org/10.48550/arXiv.1606.03490.
Рецензия
Для цитирования:
Буг Д.С., Наркевич А.Н., Петухова Н.В. Обзор программ для оценки патогенности генетических вариантов. Учёные записки Первого Санкт-Петербургского государственного медицинского университета имени академика И. П. Павлова. 2025;32(1):11-20. https://doi.org/10.24884/1607-4181-2025-32-1-11-20
For citation:
Bug D.S., Narkevich A.N., Petukhova N.V. Review of programs for assessing the pathogenicity of genetic variants. The Scientific Notes of the Pavlov University. 2025;32(1):11-20. (In Russ.) https://doi.org/10.24884/1607-4181-2025-32-1-11-20