Preview

Учёные записки Первого Санкт-Петербургского государственного медицинского университета имени академика И. П. Павлова

Расширенный поиск

Обзор программ для оценки патогенности генетических вариантов

https://doi.org/10.24884/1607-4181-2025-32-1-11-20

Аннотация

В настоящее время молекулярно-генетические методы играют важную роль в диагностике ряда патологий. Внедрение массового параллельного секвенирования значительно увеличило объем данных, описывающих варианты ДНК пациентов с различными заболеваниями, но клиническое значение многих из этих результатов остается неизвестным. Для оценки эффекта генетических вариантов широко используется автоматическое определение клинической значимости вариантов при помощи программ-предикторов. Отечественные и международные руководства по интерпретации данных, полученных методами массового параллельного секвенирования, рекомендуют использовать программы-предикторы для определения клинического значения генетических вариантов. Однако, принципы работы и характеристики этих программ в научной литературе описаны недостаточно. В данном обзоре на примере наиболее популярных программ-предикторов представлены основные принципы их работы, которые используются для оценки патогенности вариантов.

Об авторах

Д. С. Буг
Первый Санкт-Петербургский государственный медицинский университет им. акад. И.П. Павлова
Россия

Буг Дмитрий Сергеевич, младший научный сотрудник, НИЦ биоинформатики НОИ биомедицины

197022, Санкт-Петербург, ул. Льва Толстого, д. 6-8



А. Н. Наркевич
Южно-Уральский государственный медицинский университет
Россия

Наркевич Артем Николаевич, доктор медицинских наук, доцент, профессор кафедры общественного здоровья и здравоохранения

454092, г. Челябинск, ул. Воровского, д. 64



Н. В. Петухова
Первый Санкт-Петербургский государственный медицинский университет им. акад. И.П. Павлова
Россия

Петухова Наталья Витальевна, кандидат медицинских наук, руководитель центра НИЦ биоинформатики НОИ биомедицины

197022, Санкт-Петербург, ул. Льва Толстого, д. 6-8



Список литературы

1. Cook C. E., Bergman M. T., Finn R. D. et al. The European Bioinformatics Institute in 2016: Data growth and integration // Nucleic Acids Res. – 2015. – Vol. 44, № D1. – P. D20–D26. https://doi.org/10.1093%2Fnar%2Fgkv1352.

2. Gagan J., Van Allen E. M. Next-generation sequencing to guide cancer therapy // Genome Med. – 2015. – Vol. 7, № 1. – P. 80. https://doi.org/10.1186/s13073-015-0203-x.

3. Рыжкова О., Кардымон О., Прохорчук Е. и др. Руководство по интерпретации данных последовательности ДНК человека, полученных методами массового параллельного секвенирования (MPS) (редакция 2018, версия 2) // Медицинская генетика. – 2020. – Т. 18, № 2. – C. 3–23. https://doi.org/10.25557/2073-7998.2019.02.3-23.

4. Спектор М., Ясько Л., Друй А. Интерпретация соматических генетических вариантов, выявленных методом высокопроизводительного секвенирования опухолевой ДНК, на примере онкологических заболеваний детского возраста // Медицинская генетика – 2021. – Т. 20, № 3. – C. 3–25. https://doi.org/10.25557/2073-7998.2021.03.3-25.

5. Cooper G. M., Stone E. A., Asimenos G. et al. Distribution and intensity of constraint in mammalian genomic sequence // Genome Res. – 2005. – Vol. 15, № 7. – P. 901–913. https://doi.org/10.1101/gr.3577405.

6. Garber M., Guttman M., Clamp M. et al. Identifying novel constrained elements by exploiting biased substitution patterns // Bioinformatics. – 2009. – Vol. 25, № 12. – P. i54–i62. https://doi.org/10.1093%2Fbioinformatics%2Fbtp190.

7. Pollard K. S., Hubisz M. J., Rosenbloom K. R. et al. Detection of nonneutral substitution rates on mammalian phylogenies // Genome Res. – 2009. – Vol. 20, № 1. – P. 110–121. https://doi.org/10.1101/gr.097857.109.

8. Siepel A., Bejerano G., Pedersen J. S. et al. Evolutionarily conserved elements in vertebrate, insect, worm, and yeast genomes // Genome Res. – 2005. – Vol. 15, № 8. – P. 1034–1050. https://doi.org/10.1101/gr.3715005.

9. Adzhubei I. A., Schmidt S., Peshkin L. et al. A method and server for predicting damaging missense mutations // Nat Methods. – 2010. – Vol. 7, № 4. – P. 248–249. https://doi.org/10.1038/nmeth0410-248.

10. Ashkenazy H., Abadi S., Martz E. et al. ConSurf 2016: an improved methodology to estimate and visualize evolutionary conservation in macromolecules // Nucleic Acids Res. – 2016. – Vol. 44, № W1. – P. W344–W350. https://doi.org/10.1093/nar/gkw408.

11. Calabrese R., Capriotti E., Fariselli P. et al. Functional annotations improve the predictive score of human disease-related mutations in proteins // Hum. Mutat. – 2009. – Vol. 30, № 8. – P. 1237–1244. https://doi.org/10.1002/humu.21047.

12. Choi Y., Sims G. E., Murphy S. et al. Predicting the Functional Effect of Amino Acid Substitutions and Indels // PLoS ONE. – 2012. – Vol. 7, № 10. – P. e46688. https://doi.org/10.1371/journal.pone.0046688.

13. Frazer J., Notin P., Dias M. et al. Disease variant prediction with deep generative models of evolutionary data // Nature. – 2021. – Vol. 599, № 7883. – P. 91–95. https://doi.org/10.1038/s41586-021-04043-8.

14. Reva B., Antipin Y., Sander C. Predicting the functional impact of protein mutations: application to cancer genomics // Nucleic Acids Research. – 2011. – Vol. 39, № 17. – P. e118–e118. https://doi.org/10.1093/nar/gkr407.

15. Sim N., Kumar P., Hu J. et al. SIFT web server: predicting effects of amino acid substitutions on proteins // Nucleic Acids Research. – 2012. – Vol. 40, № W1. – P. W452–W457. https://doi.org/10.1093/nar/gks539.

16. Capriotti E., Fariselli P. Evaluating the relevance of sequence conservation in the prediction of pathogenic missense variants // Hum Genet. – 2022. – Vol. 141, № 10. – P. 1649–1658. https://doi.org/10.1007/s00439-021-02419-4.

17. Adebali O., Reznik A. O., Ory D. S. et al. Establishing the precise evolutionary history of a gene improves prediction of disease-causing missense mutations // Genetics in Medicine. – 2016. – Vol. 18, № 10. – P. 1029–1036. https://doi.org/10.1038/gim.2015.208.

18. Li W., Godzik A. Cd-hit: a fast program for clustering and comparing large sets of protein or nucleotide sequences // Bioinformatics. – 2006. – Vol. 22, № 13. – P. 1658–1659. https://doi.org/10.1093/bioinformatics/btl158.

19. Ng P. C. SIFT: predicting amino acid changes that affect protein function // Nucleic Acids Research. – 2003. – Vol. 31, № 13. – P. 3812–3814. https://doi.org/10.1093/nar/gkg509.

20. Thompson J. D., Higgins D. G., Gibson T. J. CLUSTAL W: improving the sensitivity of progressive multiple sequence alignment through sequence weighting, position-specific gap penalties and weight matrix choice // Nucl Acids Res. – 2007. – Vol. 22, № 22. – P. 4673–4680. https://doi.org/10.1093/nar/22.22.4673.

21. Sievers F., Wilm A., Dineen D. et al. Fast, scalable generation of high-quality protein multiple sequence alignments using Clustal Omega // Molecular Systems Biology. – 2011. – Vol. 7, № 1. – P. 539. https://doi.org/10.1038/msb.2011.75.

22. Katoh K. MAFFT: a novel method for rapid multiple sequence alignment based on fast Fourier transform // Nucleic Acids Research. – 2002. – Vol. 30, № 14. – P. 3059–3066. https://doi.org/10.1093/nar/gkf436.

23. Mount D.W. Using Iterative Methods for Global Multiple Sequence Alignment // Cold Spring Harb Protoc. – 2009. – Vol. 2009, № 7. – P. pdb.top44. https://doi.org/10.1101/pdb.top44.

24. Edgar R.C. MUSCLE: a multiple sequence alignment method with reduced time and space complexity // BMC Bioinformatics. – 2004. – Vol. 5, № 1. – P. 113. https://doi.org/10.1186/1471-2105-5-113.

25. Morgenstern B. DIALIGN 2: improvement of the segment-to-segment approach to multiple sequence alignment // Bioinformatics. – 2002. – Vol. 15, № 3. – P. 211-218. https://doi.org/10.1093/bioinformatics/15.3.211.

26. Notredame C. SAGA: sequence alignment by genetic algorithm // Nucleic Acids Research. – 2002. – Vol. 24, № 8. – P. 1515–1524. https://doi.org/10.1093%2Fnar%2F24.8.1515.

27. Sievers F., Higgins D.G. QuanTest2: benchmarking multiple sequence alignments using secondary structure prediction // Bioinformatics. – 2019. – Vol. 36, № 1. – P. 90–95. https://doi.org/10.1093/bioinformatics/btz552.

28. Ng P.C., Henikoff S. Predicting Deleterious Amino Acid Substitutions // Genome Res. – 2002. – Vol. 11, № 5. – P. 863–874. https://doi.org/10.1101/gr.176601.

29. Shihab H.A., Gough J., Cooper D.N. et al. Predicting the Functional, Molecular, and Phenotypic Consequences of Amino Acid Substitutions using Hidden Markov Models // Human Mutation. – 2012. – Vol. 34, № 1. – P. 57–65. https://doi.org/10.1002/humu.22225.

30. Tang H., Thomas P. D. PANTHER-PSEP: predicting disease-causing genetic variants using position-specific evolutionary preservation // Bioinformatics. – 2016. – Vol. 32, № 14. – P. 2230–2232. https://doi.org/10.1093/bioinformatics/btw222.

31. Glaser F., Pupko T., Paz I. et al. ConSurf: Identification of Functional Regions in Proteinsby Surface-Mapping of Phylogenetic Information // Bioinformatics. – 2002. – Vol. 19, № 1. – P. 163–164. https://doi.org/10.1093/bioinformatics/19.1.163.

32. Chun S., Fay J. C. Identification of deleterious mutations within three human genomes // Genome Res. – 2009. – Vol. 19, № 9. – P. 1553–1561. https://doi.org/10.1101/gr.092619.109.

33. Stone E. A., Sidow A. Physicochemical constraint violation by missense substitutions mediates impairment of protein function and disease severity // Genome Res. – 2005. – Vol. 15, № 7. – P. 978–986. https://doi.org/10.1101/gr.3804205.

34. Tavtigian S. V. Comprehensive statistical study of 452 BRCA1 missense substitutions with classification of eight recurrent substitutions as neutral // Journal of Medical Genetics. – 2005. – Vol. 43, № 4. – P. 295–305. https://doi.org/10.1136/jmg.2005.033878.

35. Frazer J., Notin P., Dias M. et al. Disease variant prediction with deep generative models of evolutionary data // Nature. – 2021. – Vol. 599, № 7883. – P. 91–95. https://doi.org/10.1038/s41586-021-04043-8.

36. Moles-Fernández A., Duran-Lozano L., Montalban G. et al. Computational Tools for Splicing Defect Prediction in Breast/Ovarian Cancer Genes: How Efficient Are They at Predicting RNA Alterations? // Front. Genet. – 2018. – Vol. 9. – P. 366. https://doi.org/10.3389/fgene.2018.00366.

37. Mahmood K., Jung C., Philip G. et al. Variant effect prediction tools assessed using independent, functional assay-based datasets: implications for discovery and diagnostics // Hum Genomics. – 2017. – Vol. 11, № 1. – P. 10. https://doi.org/10.1186/s40246-017-0104-8.

38. Pollard K. S., Salama S. R., Lambert N. et al. An RNA gene expressed during cortical development evolved rapidly in humans // Nature. – 2006. – Vol. 443, № 7108. – P. 167–172. https://doi.org/10.1038/nature05113.

39. Rao C.R. Score Test: Historical Review and Recent Developments / Eds. N. Balakrishnan, H. N. Nagaraja, N. Kannan. – Boston, MA: Birkhäuser, 2005. – P. 3–20. http://dx.doi.org/10.1007/0-8176-4422-9_1.

40. Siepel A., Pollard K. S., Haussler D. New Methods for Detecting Lineage-Specific Selection / Eds. A. Apostolico et al. – Berlin, Heidelberg: Springer Berlin Heidelberg, 2006. – P. 190–205. https://doi.org/10.1007/11732990_17.

41. Kircher M., Witten D. M., Jain P. et al. A general framework for estimating the relative pathogenicity of human genetic variants // Nat Genet. – 2014. – Vol. 46, № 3. – P. 310–315. https://doi.org/10.1038/ng.2892.

42. Quang D., Chen Y., Xie X. DANN: a deep learning approach for annotating the pathogenicity of genetic variants // Bioinformatics. – 2014. – Vol. 31, № 5. – P. 761–763. https://doi.org/10.1093/bioinformatics/btu703.

43. Ionita-Laza I., McCallum K., Xu B. et al. A spectral approach integrating functional genomic annotations for coding and noncoding variants // Nat Genet. – 2016. – Vol. 48, № 2. – P. 214–220. https://doi.org/10.1038/ng.3477.

44. Shihab H.A., Rogers M.F., Gough J. et al. An integrative approach to predicting the functional effects of non-coding and coding sequence variation // Bioinformatics. – 2015. – Vol. 31, № 10. – P. 1536–1543. https://doi.org/10.1093/bioinformatics/btv009.

45. Dong C., Wei P., Jian X. et al. Comparison and integration of deleteriousness prediction methods for nonsynonymous SNVs in whole exome sequencing studies // Human Molecular Genetics. – 2015. – Vol. 24, № 8. – P. 2125–2137. https://doi.org/10.1093/hmg/ddu733.

46. Jagadeesh K. A., Wenger A. M., Berger M. J. et al. M-CAP eliminates a majority of variants of uncertain significance in clinical exomes at high sensitivity // Nat Genet. – 2016. – Vol. 48, № 12. – P. 1581–1586. https://doi.org/10.1038/ng.3703.

47. Ioannidis N. M., Rothstein J. H., Pejaver V. et al. REVEL: An Ensemble Method for Predicting the Pathogenicity of Rare Missense Variants // The American Journal of Human Genetics. – 2016. – Vol. 99, № 4. – P. 877–885. https://doi.org/10.1016/j.ajhg.2016.08.016.

48. Koonin E. V. Orthologs, Paralogs, and Evolutionary Genomics // Annu. Rev. Genet. – 2005. – Vol. 39, № 1. – P. 309–338. https://doi.org/10.1146/annurev.genet.39.073003.114725.

49. Han J., Batey S., Nickson A. A. et al. The folding and evolution of multidomain proteins // Nat Rev Mol Cell Biol. – 2007. – Vol. 8, № 4. – P. 319–330. https://doi.org/10.1038/nrm2144.

50. Lipton Z. C. The mythos of model interpretability // Queue. – 2020. – Vol. 16, № 3. – P. 31–57. https://doi.org/10.48550/arXiv.1606.03490.


Рецензия

Для цитирования:


Буг Д.С., Наркевич А.Н., Петухова Н.В. Обзор программ для оценки патогенности генетических вариантов. Учёные записки Первого Санкт-Петербургского государственного медицинского университета имени академика И. П. Павлова. 2025;32(1):11-20. https://doi.org/10.24884/1607-4181-2025-32-1-11-20

For citation:


Bug D.S., Narkevich A.N., Petukhova N.V. Review of programs for assessing the pathogenicity of genetic variants. The Scientific Notes of the Pavlov University. 2025;32(1):11-20. (In Russ.) https://doi.org/10.24884/1607-4181-2025-32-1-11-20

Просмотров: 103


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1607-4181 (Print)
ISSN 2541-8807 (Online)