<?xml version="1.0" encoding="UTF-8"?>
    <!DOCTYPE article PUBLIC "-//NLM/DTD JATS (Z39.96) Journal Publishing DTD v1.2 20120330//EN" "http://jats.nlm.nih.gov/publishing/1.2/JATS-journalpublishing1.dtd">
    <!--<?xml-stylesheet type="text/xsl" href="article.xsl">-->
<article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:ns1="http://www.w3.org/1999/xlink" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" article-type="research-article" dtd-version="1.2" xml:lang="en">
	<front>
		<journal-meta>
			<journal-id journal-id-type="eissn">2530-1381</journal-id>
			<journal-title-group>
				<journal-title>Journal of Bioinformatics and Genomics</journal-title>
			</journal-title-group>
			<publisher>
				<publisher-name>ООО Цифра</publisher-name>
			</publisher>
		</journal-meta>
		<article-meta>
			<article-id pub-id-type="doi">10.60797/jbg.2026.32.7</article-id>
			<article-categories>
				<subj-group>
					<subject>Brief communication</subject>
				</subj-group>
			</article-categories>
			<title-group>
				<article-title>ПРИМЕР ЦЕЛЕВОГО ПОДХОДА К РАСПОЗНАВАНИЮ РОДА КОРОНАВИРУСОВ С ПОМОЩЬЮ МЕТОДА ГЛАВНЫХ КОМПОНЕНТ</article-title>
			</title-group>
			<contrib-group>
				<contrib contrib-type="author" corresp="yes">
					<contrib-id contrib-id-type="orcid">https://orcid.org/0000-0003-0236-2673</contrib-id>
					<contrib-id contrib-id-type="rid">https://publons.com/researcher/O-2496-2013</contrib-id>
					<name>
						<surname>Чалей</surname>
						<given-names>Мария Борисовна</given-names>
					</name>
					<email>maramaria@yandex.ru</email>
					<xref ref-type="aff" rid="aff-2">2</xref>
				</contrib>
				<contrib contrib-type="author">
					<contrib-id contrib-id-type="orcid">https://orcid.org/0000-0001-6815-002X</contrib-id>
					<contrib-id contrib-id-type="rid">https://publons.com/researcher/V-5429-2017</contrib-id>
					<name>
						<surname>Кутыркин</surname>
						<given-names>Владимир Андреевич</given-names>
					</name>
					<email>vkutyrkin@yandex.ru</email>
					<xref ref-type="aff" rid="aff-1">1</xref>
				</contrib>
			</contrib-group>
			<aff id="aff-1">
				<label>1</label>
				<institution>Московский государственный технический университет им. Н.Э. Баумана</institution>
			</aff>
			<aff id="aff-2">
				<label>2</label>
				<institution>Институт математематических проблем биологии - филиал Института прикладной математики им. М.В.Келдыша РАН</institution>
			</aff>
			<pub-date publication-format="electronic" date-type="pub" iso-8601-date="2026-06-26">
				<day>26</day>
				<month>06</month>
				<year>2026</year>
			</pub-date>
			<pub-date pub-type="collection">
				<year>2026</year>
			</pub-date>
			<volume>8</volume>
			<issue>32</issue>
			<fpage>1</fpage>
			<lpage>8</lpage>
			<history>
				<date date-type="received" iso-8601-date="2026-05-13">
					<day>13</day>
					<month>05</month>
					<year>2026</year>
				</date>
				<date date-type="accepted" iso-8601-date="2026-06-25">
					<day>25</day>
					<month>06</month>
					<year>2026</year>
				</date>
			</history>
			<permissions>
				<copyright-statement>Copyright: &amp;#x00A9; 2022 The Author(s)</copyright-statement>
				<copyright-year>2022</copyright-year>
				<license license-type="open-access" xlink:href="http://creativecommons.org/licenses/by/4.0/">
					<license-p>
						This is an open-access article distributed under the terms of the Creative Commons Attribution 4.0 International License (CC-BY 4.0), which permits unrestricted use, distribution, and reproduction in any medium, provided the original author and source are credited. See 
						<uri xlink:href="http://creativecommons.org/licenses/by/4.0/">http://creativecommons.org/licenses/by/4.0/</uri>
					</license-p>
					.
				</license>
			</permissions>
			<self-uri xlink:href="https://journal-biogen.org/archive/2-32-2026-june/10.60797/jbg.2026.32.7"/>
			<abstract>
				<p>На примере распознавания рода коронавирусов представлен оригинальный подход к определению таксономии вирусов в метагеномных исследованиях. Подход относится к целевым (таргетным) методам по распознаванию вирусов на основе частот кодонов в N-гене белка нуклеокапсида. Используемый подход основан на нестандартном применении метода главных компонент к обучающим выборкам векторов частот кодонов для N-генов коронавирусов разных родов. Показана репрезентативность предложенной обучающей выборки. Продемонстрирована возможность значительного уменьшения параметров распознавания путем сокращения размерности пространства векторов частот кодонов N-гена. Предлагаемый подход к определению таксономической принадлежности вирусов относится к группе методов без выравнивания, развиваемых в последние десятилетия для выявления родства и эволюции видов вирусов по их секвенированным геномам.</p>
			</abstract>
			<kwd-group>
				<kwd>N-ген</kwd>
				<kwd> коронавирусы</kwd>
				<kwd> классификация вирусов</kwd>
				<kwd> методы без выравнивания</kwd>
				<kwd> метод главных компонент</kwd>
			</kwd-group>
		</article-meta>
	</front>
	<body>
		<sec>
			<title>HTML-content</title>
			<p>1. Введение</p>
			<p>Таксономия вирусов, установленная и развиваемая Международным комитетом по таксономии вирусов ICTV [1], не только описывает и систематизирует наши знания об известных вирусах, но также способствует разработке вакцин и методов лечения вирусных инфекций. В случае обнаружения нового патогенного вируса определение его вида, рода и семейства ускоряет выбор возможной терапии и вакцинации, особенно если средства и способы борьбы против родственных ему вирусов уже существуют.</p>
			<p>Благодаря современным технологиям классифицировать вирусы и определять эволюционные связи между ними возможно в результате сравнительного анализа их геномов. Быстрое развитие технологий секвенирования и рост метагеномных данных создают запрос на создание новых вычислительных методов, программ для анализа и классификации вирусов. С переходом к революционной нанопоровой технологии (Oxford Nanopore) секвенирования третьего поколения с длинным прочтением (LRS — long-read sequencing) открываются новые возможности вирусной метагеномики [2], [3]. В отличие от высоко производительной технологии NGS (Illumina), известной как секвенирование с коротким прочтением (SRS — short-read sequencing), LRS технология позволяет значительно быстрее и надежнее определять области генома, содержащие тандемные повторы, и реконструировать полные геномы за одно прочтение [4]. Технология LRS способствует классификации вирусов с высоким разрешением и точному определению важных генетических элементов. Кроме того, её существенным преимуществом является возможность идентифицировать химические модификации нуклеотидов, возникающие на уровне эпигенетических процессов.</p>
			<p>Основные подходы к классификации метагеномных данных (идентификации вирусов) можно условно разделить на четыре основные группы [5]: выравнивание; статистические и скрытые марковские модели (HMM); идентификация вирусов на основе машинного обучения на основе частот k-меров (небольших последовательностей из k нуклеотидных или аминокислотных остатков);гибридные методологии, которые сочетают в себе несколько стратегий.</p>
			<p>Одними из первых, и широко используемых в настоящее время в метагеномике, подходов к таксономии являются методы определения сходства путем выравнивания с референсными геномами из баз данных, например, RefSeq [6]. Программа BLAST [7] является самым известным инструментом в этой группе. Специализированный портал NCBI Virus [8] предоставляет BLAST-интерфейс для анализа вирусных последовательностей, сравниваемых с тщательно отобранными метаданными о вирусах, в том числе и с коронавирусами рода Betacoronavirus. В настоящее время широко используются программы множественного выравнивания такие, как MUSCLE [9], MAFFT [10] и др. По результатам работы этих программ методами филогении [11] (наиболее часто методом правдоподобия [12]) строятся дендрограммы вирусных таксонов. В случае, когда денрограммы строятся на основе выравненных последовательностей, количественные различия определяют меру расстояния между ними.</p>
			<p>Выравнивание последовательностей и анализ k-меров, требуют очень больших вычислительных затрат, что осложняет их применение для оценки огромных массивов данных. Потому в последние два десятилетия разрабатываются различные методы без выравнивания, обладающие достаточной эффективностью [13], [14], [15]. Методы без выравнивания для сравнения и классификации последовательностей извлекают и используют их характерные признаки или шаблоны.</p>
			<p>Наши работы по распознаванию рода коронавирусов (Alphacoronavirus, Betacoronavirus, Deltacoronavirus, Gammacoronavirus) также направлены на создание новых подходов к распознаванию таксономической принадлежности вирусов без сравнительного выравнивания их геномных последовательностей относительно известных геномов вирусов. С этой целью в настоящей работе анализируемый вирус характеризуется вектором частот кодонов одного из его генов, кодирующего вирусный белок нуклеокапсида.</p>
			<p>Ранее для распознавания рода коронавирусов на основе частот кодонов в генах нами рассматривался вариантный подход, который использовал как отдельные структурные (S-, M-, N- гены) и неструктурные гены (объединенные в единой ORF1ab), так и их различные комбинации-варианты [16]. Всего было рассмотрено шесть вариантов. Отметим, что ORF1ab содержит, в частности, ген РНК-зависимой РНК-полимеразы (RdRp), обычно используемый для разделения видов, родов и семейств коронавирусов [1].</p>
			<p>Анализируемому геному коронавируса при вариантном подходе соответствовала вариантная строка, компоненты которой содержали результат распознавания рода коронавируса по каждому варианту. Мозаичность компонент вариантных строк отражала рекомбинантные процессы в геномах. Наиболее эффективное распознавание рода продемонстрировал вариант, использующий только ORF1ab. Распознавание рода коронавируса при рассмотрении частот кодонов структурных генов оказалось чуть менее эффективно, с уровнем достоверности (чувствительности) не менее 95%.</p>
			<p>Вариантный подход использовал сравнение частот кодонов в генах анализируемого вирусного генома с усредненными частотами кодонов в соответствующих генах прототипных штаммов каждого рода коронавирусов, то есть вирусов, рассматриваемых Международным комитетом по таксономии вирусов ICTV [1] в качестве типичных представителей вирусного таксона. При этом среди структурных генов распознавание на основе N-гена показало недостаточно высокую чувствительность только для одного рода Alphacoronavirus.</p>
			<p>Хотя N-ген имеет достаточно малую длину — 1200 нукл. (для сравнения S-ген имеет длину порядка 3700 нукл.), ранее он успешно использовался для построения филогенетических дендрограмм при изучении географии распространения коронавирусов [17] и в молекулярно-эпидемиологическом анализе вариантов вируса SARS-CoV-2 [18]. В работе [19] по распознаванию рода и подрода коронавируса также использовался N-ген белка нуклеопротеина, частоты кодонов которого из анализируемого генома сравнивались с частотами кодонов в N-генах индивидуальных прототипных штаммов подродов коронавирусов. Такой подход был назван типологическим [19], [20].</p>
			<p>В работе [19] было показано, что при типологическом подходе распознавание на основе N-гена наиболее эффективно (в сравнении с S-геном и ORF1ab). Поэтому N-ген белка нуклеокапсида был выбран в качестве целевого (таргетного) гена в дальнейшем анализе.</p>
			<p>Сложность типологического подхода обусловлена необходимостью сравнения с большим числом прототипных штаммов. В этом его сходство с методами выравнивания, которые также требуют сравнения с множеством эталонов.</p>
			<p>Для упрощения задачи распознавания рода коронавирусов нами было выполнено сравнение вектора частот кодонов в анализируемом N-гене с усредненными по родам векторами частот кодонов в N-генах из обучающей выборки. Однако такой подход показал слишком низкую эффективность распознавания рода коронавируса. Поэтому в работе [21] для распознавания рода коронавирусов был предложен другой подход, в котором особым образом использовался метод главных компонент для векторов частот кодонов в анализируемых N-генах. В этом подходе на основе обучающей выборки для каждого рода коронавирусов создаются процедуры преобразования векторов частот кодонов в N-генах. Для фиксированного рода процедура преобразования выполняется следующим образом. Сначала на основе векторов частот кодонов в N-генах из обучающей выборки рассматриваемого рода коронавирусов вычисляется усредненный вектор частот кодонов в этом роде. На его основе осуществляется трансформация каждого вектора частот кодонов рода, и для каждого рода коронавирусов создается соответствующая выборка трансформированных векторов частот кодонов. Далее к выборке трансформированных векторов частот кодонов N-генов каждого рода применяется метод главных компонент, для которых найдены их дисперсии. Таким образом, на основе обучающей выборки для анализируемого вектора частот кодонов N-гена созданы фиксированные процедуры его преобразования, зависящие от рода коронавирусов.</p>
			<p>Согласно процедуре предполагаемого рода, анализируемый вектор частот кодонов N-гена коронавируса сначала трансформируется и, затем, для трансформированного вектора вычисляются главные компоненты. В результате для предполагаемого рода коронавирусов вычисляется сумма квадратов значений главных компонент, нормированных на соответствующие им дисперсии. Таким образом, для анализируемого коронавируса вычисляются такие суммы для возможных распознаваемых родов. На основе минимальной суммы выбирается род анализируемого коронавируса.</p>
			<p>Описываемый выше способ распознавания рода коронавирусов основан на предположении о том, что для каждого рода векторы частот кодонов в N-генах коронавирусов могут быть достаточно близки к различным нормальным многомерным распределениям типичным для каждого рода коронавирусов. Эксперименты показали, что, начиная с некоторой размерности пространства векторов частот кодонов N-гена, достигался уровень чувствительности 95% (и выше) в распознавании рода коронавируса для обучающей и тестируемых выборок. Однако для тестируемой выборки в работе [21] наблюдались следующие явления. Тестируемая выборка показывала приемлемый уровень чувствительности (95%) распознавания рода Betacoronavirus только для достаточно высокой размерности (n=28) пространства векторов частот кодонов в N-генах. Кроме того, для рода Deltacoronavirus, начиная с размерности 16 происходит существенное снижение уровня чувствительности к распознаванию этого рода. По-видимому, такие явления обусловлены недостаточной репрезентативностью обучающей выборки.</p>
			<p>В настоящей работе увеличен размер обучающей выборки. Показано, что приемлемый уровень эффективности распознавания рода коронавирусов достигается, начиная с достаточно низкой размерности пространства анализируемых векторов частот кодонов в N-генах и стабильно возрастает с ростом этой размерности.</p>
			<p>Таким образом, в настоящей работе на примере распознавания рода коронавируса по N-гену белка нуклеокапсида демонстрируется возможность успешного применения метода главных компонент для классификации вирусов без выравнивания их полных геномов, с опорой только на выделенный целевой ген. Предлагаемый подход может существенно упростить распознавание последовательностей геномов, и избежать ошибок идентификации, обусловленных частыми рекомбинациями между вирусными геномами. Кроме того, дополнительно упростить анализ возможно путем значительного уменьшения размерности векторов частот кодонов, характеризующих целевой ген.</p>
			<p>2. Методы и принципы исследования</p>
			<p>В предыдущей работе [21], посвященной распознаванию рода коронавирусов, основанному на методе главных компонент, объем обучающей выборки N-генов был существенно меньше объема тестируемой. В настоящей работе объем обучающей выборки значительно увеличен, особенно для родов Deltacoronavirus и Gammacoronavirus. Численный состав по родам для обучающей и тестируемой выборок N-генов коронавирусов в настоящей работе, соответственно, составлял: для Alphacoronavirus (α-CoV) — 1281 и 251, для Betacoronavirus (β-CoV) — 2126 и 1647, для Deltacoronavirus (δ-CoV) — 244 и 80, и для Gammacoronavirus (γ-CoV) — 406 и 135. Обучающая и тестируемая выборки различались между собой в среднем на 91%.</p>
			<p>Исходные последовательности N-генов были получены из базы данных GenBank [22]. Порядок компонент в векторах частот кодонов соответствовал нумерации кодонов, упорядоченных по убыванию частот встречаемости в N-генах прототипных штаммов для родов коронавирусов, GenBank коды доступа которых приведены в работе [23]. Таблица 1 представляет список упорядоченных таким образом кодонов, за которыми закреплены соответствующие номера. Последние пять кодонов, включая кодоны терминации, с самыми низкими частотами были исключены из анализа. Убывание частоты встречаемости кодона происходит в соответствии с ростом его порядкового номера в таблице 1.</p>
			<table-wrap id="T1">
				<label>Table 1</label>
				<caption>
					<p>Нумерованный список кодонов аминокислот в соответствии с убыванием их частоты встречаемости в N-генах прототипных штаммов подродов коронавирусов</p>
				</caption>
				<table>
					<tr>
						<td>1 aag</td>
						<td>2 gat</td>
						<td>3 aaa</td>
						<td>4 gct</td>
						<td>5 ggt</td>
						<td>6 aat</td>
						<td>7 cct</td>
						<td>8 caa</td>
						<td>9 cca</td>
						<td>10 tct</td>
					</tr>
					<tr>
						<td>11 cag</td>
						<td>12 act</td>
						<td>13 gga</td>
						<td>14 gaa</td>
						<td>15 aga</td>
						<td>16 gca</td>
						<td>17 gtt</td>
						<td>18 gac</td>
						<td>19 ttt</td>
						<td>20 cgt</td>
					</tr>
					<tr>
						<td>21 tca</td>
						<td>22 aac</td>
						<td>23 att</td>
						<td>24 ctt</td>
						<td>25 gag</td>
						<td>26 aca</td>
						<td>27 ggc</td>
						<td>28 tgg</td>
						<td>29 agt</td>
						<td>30 gcc</td>
					</tr>
					<tr>
						<td>31 ttc</td>
						<td>32 atg</td>
						<td>33 tat</td>
						<td>34 ccc</td>
						<td>35 cgc</td>
						<td>36 acc</td>
						<td>37 tac</td>
						<td>38 gtg</td>
						<td>39 ttg</td>
						<td>40 gtc</td>
					</tr>
					<tr>
						<td>41 cat</td>
						<td>42 agc</td>
						<td>43 agg</td>
						<td>44 tcc</td>
						<td>45 gta</td>
						<td>46 ctg</td>
						<td>47 ggg</td>
						<td>48 atc</td>
						<td>49 ctc</td>
						<td>50 cta</td>
					</tr>
					<tr>
						<td>51 gcg</td>
						<td>52 ccg</td>
						<td>53 ata</td>
						<td>54 cga</td>
						<td>55 cac</td>
						<td>56 tta</td>
						<td>57 tcg</td>
						<td>58 acg</td>
						<td>59 cgg</td>
						<td> </td>
					</tr>
				</table>
			</table-wrap>
			<p>Кратко опишем метод распознавания рода коронавирусов на основании метода главных компонент.</p>
			<p>Каждый N-ген характеризуется вектором частот кодонов в виде [LATEX_FORMULA]\boldsymbol{P}=\left(P_{1}, P_{2}, \ldots, P_{n}\right)^{\mathrm{T}}[/LATEX_FORMULA], где — частота встречаемости i-го кодона [LATEX_FORMULA](i=\overline{1, n})[/LATEX_FORMULA], n — количество первых упорядоченных кодонов. Наименьшее число рассматриваемых кодонов — два, наибольшее — 59. Пять кодонов с минимальными частотами встречаемости не рассматривались.</p>
			<p>Для анализируемого вектора частот коронавирусов опишем его трансформацию, соответствующую каждому роду коронавирусов, где [LATEX_FORMULA]X \in\{\alpha, \beta, \delta, \gamma\}[/LATEX_FORMULA] — индекс рода коронавируса.</p>
			<p>Для каждого рода по всем генам его обучающей выборки рассчитываются средние частоты встречаемости каждого рассматриваемого кодона. Тем самым для рода X создается вектор средних частот [LATEX_FORMULA]\overline{\boldsymbol{P}}^{X}=\left(\bar{P}_{1}^{X}, \bar{P}_{2}^{X}, \ldots, \bar{P}_{n}^{X}\right)^{\mathrm{T}}[/LATEX_FORMULA] и для каждого вектора частот [LATEX_FORMULA]\boldsymbol{P}=\left(P_{1}, P_{2}, \ldots, P_{n}\right)^{\mathrm{T}}[/LATEX_FORMULA] обучающей выборки из рода X вычисляется трансформированный вектор [LATEX_FORMULA]\boldsymbol{p}=\left(\frac{P_{1}-\bar{P}_{1}^{X}}{\bar{P}_{1}^{X}}, \frac{P_{2}-\bar{P}_{2}^{X}}{\bar{P}_{2}^{X}}, \ldots, \frac{P_{n}-\bar{P}_{n}^{X}}{\bar{P}_{n}^{X}}\right)^{\mathrm{T}}=\boldsymbol{F}_{X}(\boldsymbol{P})[/LATEX_FORMULA] где FX — операция X-трансформирования вектора частот. Следовательно, для обучающей выборки векторов частот из рода X с помощью операции FX создается соответствующая выборка трансформированных векторов. На основе этой выборки вычисляется ковариационная матрица CX для рода X. Для получения главных компонент рода X матрица CX представляется в виде [LATEX_FORMULA]\boldsymbol{C}_{X}=\boldsymbol{Q}_{X} \cdot \boldsymbol{D}_{X} \cdot \boldsymbol{Q}_{X}^{\mathrm{T}}[/LATEX_FORMULA], где [LATEX_FORMULA]\boldsymbol{Q}_{X}=\left(\boldsymbol{q}_{1}^{X}, \boldsymbol{q}_{2}^{X}, \ldots, \boldsymbol{q}_{n}^{X}\right)[/LATEX_FORMULA] — ортогональная матрица, столбцы которой являются собственными векторами матрицы CX т.е. [LATEX_FORMULA]\boldsymbol{C}_{X} \cdot \boldsymbol{q}_{i}^{X}=d_{i}^{X} \boldsymbol{q}_{i}^{X}[/LATEX_FORMULA] для [LATEX_FORMULA]i=\overline{1, n}[/LATEX_FORMULA] и</p>
			<mml:math display="inline">
				<mml:mrow>
					<mml:msub>
						<mml:mrow>
							<mml:mi mathvariant="bold-italic">D</mml:mi>
						</mml:mrow>
						<mml:mrow>
							<mml:mi>X</mml:mi>
						</mml:mrow>
					</mml:msub>
					<mml:mo>=</mml:mo>
					<mml:mrow>
						<mml:mo stretchy="true" fence="true" form="prefix">(</mml:mo>
						<mml:mtable>
							<mml:mtr>
								<mml:mtd columnalign="center">
									<mml:msubsup>
										<mml:mi>d</mml:mi>
										<mml:mrow>
											<mml:mn>1</mml:mn>
										</mml:mrow>
										<mml:mrow>
											<mml:mi>X</mml:mi>
										</mml:mrow>
									</mml:msubsup>
								</mml:mtd>
								<mml:mtd columnalign="center">
									<mml:mi>a</mml:mi>
									<mml:mi>m</mml:mi>
									<mml:mi>p</mml:mi>
									<mml:mi>;</mml:mi>
									<mml:mn>0</mml:mn>
								</mml:mtd>
								<mml:mtd columnalign="center">
									<mml:mi>a</mml:mi>
									<mml:mi>m</mml:mi>
									<mml:mi>p</mml:mi>
									<mml:mi>;</mml:mi>
									<mml:mi>…</mml:mi>
								</mml:mtd>
								<mml:mtd columnalign="center">
									<mml:mi>a</mml:mi>
									<mml:mi>m</mml:mi>
									<mml:mi>p</mml:mi>
									<mml:mi>;</mml:mi>
									<mml:mn>0</mml:mn>
								</mml:mtd>
							</mml:mtr>
							<mml:mtr>
								<mml:mtd columnalign="center">
									<mml:mn>0</mml:mn>
								</mml:mtd>
								<mml:mtd columnalign="center">
									<mml:mi>a</mml:mi>
									<mml:mi>m</mml:mi>
									<mml:mi>p</mml:mi>
									<mml:mi>;</mml:mi>
									<mml:msubsup>
										<mml:mi>d</mml:mi>
										<mml:mrow>
											<mml:mn>2</mml:mn>
										</mml:mrow>
										<mml:mrow>
											<mml:mi>X</mml:mi>
										</mml:mrow>
									</mml:msubsup>
								</mml:mtd>
								<mml:mtd columnalign="center">
									<mml:mi>a</mml:mi>
									<mml:mi>m</mml:mi>
									<mml:mi>p</mml:mi>
									<mml:mi>;</mml:mi>
									<mml:mi>O</mml:mi>
								</mml:mtd>
								<mml:mtd columnalign="center">
									<mml:mi>a</mml:mi>
									<mml:mi>m</mml:mi>
									<mml:mi>p</mml:mi>
									<mml:mi>;</mml:mi>
									<mml:mi>M</mml:mi>
								</mml:mtd>
							</mml:mtr>
							<mml:mtr>
								<mml:mtd columnalign="center">
									<mml:mi>M</mml:mi>
								</mml:mtd>
								<mml:mtd columnalign="center">
									<mml:mi>a</mml:mi>
									<mml:mi>m</mml:mi>
									<mml:mi>p</mml:mi>
									<mml:mi>;</mml:mi>
									<mml:mi>O</mml:mi>
								</mml:mtd>
								<mml:mtd columnalign="center">
									<mml:mi>a</mml:mi>
									<mml:mi>m</mml:mi>
									<mml:mi>p</mml:mi>
									<mml:mi>;</mml:mi>
									<mml:mi>O</mml:mi>
								</mml:mtd>
								<mml:mtd columnalign="center">
									<mml:mi>a</mml:mi>
									<mml:mi>m</mml:mi>
									<mml:mi>p</mml:mi>
									<mml:mi>;</mml:mi>
									<mml:mn>0</mml:mn>
								</mml:mtd>
							</mml:mtr>
							<mml:mtr>
								<mml:mtd columnalign="center">
									<mml:mn>0</mml:mn>
								</mml:mtd>
								<mml:mtd columnalign="center">
									<mml:mi>a</mml:mi>
									<mml:mi>m</mml:mi>
									<mml:mi>p</mml:mi>
									<mml:mi>;</mml:mi>
									<mml:mrow>
										<mml:mtext> </mml:mtext>
										<mml:mi mathvariant="normal">L</mml:mi>
									</mml:mrow>
								</mml:mtd>
								<mml:mtd columnalign="center">
									<mml:mi>a</mml:mi>
									<mml:mi>m</mml:mi>
									<mml:mi>p</mml:mi>
									<mml:mi>;</mml:mi>
									<mml:mn>0</mml:mn>
								</mml:mtd>
								<mml:mtd columnalign="center">
									<mml:mi>a</mml:mi>
									<mml:mi>m</mml:mi>
									<mml:mi>p</mml:mi>
									<mml:mi>;</mml:mi>
									<mml:msubsup>
										<mml:mi>d</mml:mi>
										<mml:mrow>
											<mml:mi>n</mml:mi>
										</mml:mrow>
										<mml:mrow>
											<mml:mi>X</mml:mi>
										</mml:mrow>
									</mml:msubsup>
								</mml:mtd>
							</mml:mtr>
						</mml:mtable>
						<mml:mo stretchy="true" fence="true" form="postfix">)</mml:mo>
					</mml:mrow>
				</mml:mrow>
			</mml:math>
			<p>– диагональная матрица.</p>
			<p>На диагонали матрицы DX стоят собственные значения матрицы CX, являющиеся дисперсиями соответствующих главных компонент. Кроме того, QXT — транспонированная матрица (для QX</p>
			<mml:math display="inline">
				<mml:mrow>
					<mml:mrow>
						<mml:mi mathvariant="bold-italic">P</mml:mi>
					</mml:mrow>
					<mml:mo>=</mml:mo>
					<mml:msup>
						<mml:mrow>
							<mml:mo stretchy="true" fence="true" form="prefix">(</mml:mo>
							<mml:msub>
								<mml:mi>P</mml:mi>
								<mml:mrow>
									<mml:mn>1</mml:mn>
								</mml:mrow>
							</mml:msub>
							<mml:mo>,</mml:mo>
							<mml:msub>
								<mml:mi>P</mml:mi>
								<mml:mrow>
									<mml:mn>2</mml:mn>
								</mml:mrow>
							</mml:msub>
							<mml:mo>,</mml:mo>
							<mml:mi>…</mml:mi>
							<mml:mo>,</mml:mo>
							<mml:msub>
								<mml:mi>P</mml:mi>
								<mml:mrow>
									<mml:mi>n</mml:mi>
								</mml:mrow>
							</mml:msub>
							<mml:mo stretchy="true" fence="true" form="postfix">)</mml:mo>
						</mml:mrow>
						<mml:mrow>
							<mml:mi>T</mml:mi>
						</mml:mrow>
					</mml:msup>
				</mml:mrow>
			</mml:math>
			<mml:math display="inline">
				<mml:mrow>
					<mml:msub>
						<mml:mrow>
							<mml:mi mathvariant="bold-italic">F</mml:mi>
						</mml:mrow>
						<mml:mrow>
							<mml:mi>X</mml:mi>
						</mml:mrow>
					</mml:msub>
					<mml:mo stretchy="false">(</mml:mo>
					<mml:mi>X</mml:mi>
					<mml:mo>∈</mml:mo>
					<mml:mo stretchy="false">{</mml:mo>
					<mml:mi>α</mml:mi>
					<mml:mo>,</mml:mo>
					<mml:mi>β</mml:mi>
					<mml:mo>,</mml:mo>
					<mml:mi>δ</mml:mi>
					<mml:mo>,</mml:mo>
					<mml:mi>γ</mml:mi>
					<mml:mo stretchy="false">}</mml:mo>
					<mml:mo stretchy="false">)</mml:mo>
				</mml:mrow>
			</mml:math>
			<mml:math display="inline">
				<mml:mrow>
					<mml:msup>
						<mml:mrow>
							<mml:mi mathvariant="bold-italic">y</mml:mi>
						</mml:mrow>
						<mml:mrow>
							<mml:mi>X</mml:mi>
						</mml:mrow>
					</mml:msup>
					<mml:mo>=</mml:mo>
					<mml:msup>
						<mml:mrow>
							<mml:mo stretchy="true" fence="true" form="prefix">(</mml:mo>
							<mml:msubsup>
								<mml:mi>y</mml:mi>
								<mml:mrow>
									<mml:mn>1</mml:mn>
								</mml:mrow>
								<mml:mrow>
									<mml:mi>X</mml:mi>
								</mml:mrow>
							</mml:msubsup>
							<mml:mo>,</mml:mo>
							<mml:msubsup>
								<mml:mi>y</mml:mi>
								<mml:mrow>
									<mml:mn>2</mml:mn>
								</mml:mrow>
								<mml:mrow>
									<mml:mi>X</mml:mi>
								</mml:mrow>
							</mml:msubsup>
							<mml:mo>,</mml:mo>
							<mml:mi>…</mml:mi>
							<mml:mo>,</mml:mo>
							<mml:msubsup>
								<mml:mi>y</mml:mi>
								<mml:mrow>
									<mml:mi>n</mml:mi>
								</mml:mrow>
								<mml:mrow>
									<mml:mi>X</mml:mi>
								</mml:mrow>
							</mml:msubsup>
							<mml:mo stretchy="true" fence="true" form="postfix">)</mml:mo>
						</mml:mrow>
						<mml:mrow>
							<mml:mi>T</mml:mi>
						</mml:mrow>
					</mml:msup>
					<mml:mo>=</mml:mo>
					<mml:msubsup>
						<mml:mrow>
							<mml:mi mathvariant="bold-italic">Q</mml:mi>
						</mml:mrow>
						<mml:mrow>
							<mml:mi>X</mml:mi>
						</mml:mrow>
						<mml:mrow>
							<mml:mi>T</mml:mi>
						</mml:mrow>
					</mml:msubsup>
					<mml:mi>·</mml:mi>
					<mml:msub>
						<mml:mrow>
							<mml:mi mathvariant="bold-italic">F</mml:mi>
						</mml:mrow>
						<mml:mrow>
							<mml:mi>X</mml:mi>
						</mml:mrow>
					</mml:msub>
					<mml:mo stretchy="false">(</mml:mo>
					<mml:mrow>
						<mml:mi mathvariant="bold-italic">P</mml:mi>
					</mml:mrow>
					<mml:mo stretchy="false">)</mml:mo>
				</mml:mrow>
			</mml:math>
			<mml:math display="inline">
				<mml:mrow>
					<mml:msup>
						<mml:mi>z</mml:mi>
						<mml:mrow>
							<mml:mi>X</mml:mi>
						</mml:mrow>
					</mml:msup>
					<mml:mo>=</mml:mo>
					<mml:mfrac>
						<mml:mrow>
							<mml:mn>1</mml:mn>
						</mml:mrow>
						<mml:mrow>
							<mml:mi>n</mml:mi>
						</mml:mrow>
					</mml:mfrac>
					<mml:msubsup>
						<mml:mo>∑</mml:mo>
						<mml:mrow>
							<mml:mi>i</mml:mi>
							<mml:mo>=</mml:mo>
							<mml:mn>1</mml:mn>
						</mml:mrow>
						<mml:mrow>
							<mml:mi>n</mml:mi>
						</mml:mrow>
					</mml:msubsup>
					<mml:mfrac>
						<mml:mrow>
							<mml:msup>
								<mml:mrow>
									<mml:mo stretchy="true" fence="true" form="prefix">(</mml:mo>
									<mml:msubsup>
										<mml:mi>y</mml:mi>
										<mml:mrow>
											<mml:mi>i</mml:mi>
										</mml:mrow>
										<mml:mrow>
											<mml:mi>X</mml:mi>
										</mml:mrow>
									</mml:msubsup>
									<mml:mo stretchy="true" fence="true" form="postfix">)</mml:mo>
								</mml:mrow>
								<mml:mrow>
									<mml:mn>2</mml:mn>
								</mml:mrow>
							</mml:msup>
						</mml:mrow>
						<mml:mrow>
							<mml:msubsup>
								<mml:mi>d</mml:mi>
								<mml:mrow>
									<mml:mi>i</mml:mi>
								</mml:mrow>
								<mml:mrow>
									<mml:mi>X</mml:mi>
								</mml:mrow>
							</mml:msubsup>
						</mml:mrow>
					</mml:mfrac>
				</mml:mrow>
			</mml:math>
			<p>Опишем процедуру распознавания рода анализируемого вектора частот на основе предлагаемого метода главных компонент. Для каждого рода коронавирусов осуществляется следующая процедура преобразования этого вектора. Сначала этот вектор преобразуется с помощью операций трансформации и, затем, вычисляются главные вектора и суммы Минимальное число среди  и указывает на род анализируемого вектора частот.</p>
			<p>3. Результаты и обсуждение</p>
			<p>Эффективность распознавания рода коронавирусов в предлагаемом подходе оценивалась с помощью двух параметров: чувствительности и специфичности распознавания. Согласно определению [24], чувствительность — отношение количества истинно положительных результатов к общему количеству объектов с признаком, умноженное на 100%; специфичность — отношение количества истинно отрицательных результатов к общему количеству объектов без признака, умноженное на 100%.</p>
			<p>3.1. Распознавания рода коронавирусов в зависимости от объема обучающей выборки</p>
			<p>Рассмотрим особенности в распознавании рода коронавирусов, проявившиеся на тестируемой выборке N-генов в работе [21], которые показывает рисунок 1. Как отмечалось во Введении, приемлемый уровень чувствительности (95%) в распознавании рода Betacoronavirus достигается, начиная с достаточно высокой размерности (n=28) пространства векторов частот кодонов N-гена. Одновременно с улучшением распознавания рода Betacoronavirus, для рода Deltacoronavirus, начиная с размерности n=21, происходит существенное снижение уровня чувствительности в распознавании этого рода. Такие явления говорят о недостаточной репрезентативности обучающей выборки в работе [21]. Поэтому в настоящей работе объём обучающей выборки N-генов был значительно увеличен для всех родов коронавирусов.</p>
			<fig id="F1">
				<label>Figure 1</label>
				<caption>
					<p>Чувствительность распознавания родов коронавирусов (Alphacoronavirus, Betacoronavirus, Deltacoronavirus, Gammacoronavirus) для N-генов (представленных векторами частот кодонов), соответствующая обучающей выборке в работе [21]</p>
				</caption>
				<alt-text>Чувствительность распознавания родов коронавирусов (Alphacoronavirus, Betacoronavirus, Deltacoronavirus, Gammacoronavirus) для N-генов (представленных векторами частот кодонов), соответствующая обучающей выборке в работе [21]</alt-text>
				<graphic ns1:href="/media/images/2026-06-25/ded9ca59-3e24-45d5-be26-ed53dd598648.png"/>
			</fig>
			<p>На рисунке 2 показаны результаты распознавания тестируемой выборки при увеличении численности обучающей выборки, в среднем, в три раза для каждого рода коронавирусов (см. Материалы). Как можно видеть из рисунка 2, чувствительность в распознавании каждого рода (доля N-генов с правильно распознанным родом) непрерывно возрастает с ростом размерности рассматриваемого пространства векторов n, начиная с достаточно малой размерности n=12. С этой размерности специфичность распознавания рода Alphacoronavirus растет, начиная с 97.7%, и специфичность распознавания остальных трех родов составляет практически 100%. Следовательно, можно говорить о репрезентативности обучающей выборки.</p>
			<p>Таким образом, увеличение объема обучающей выборки привело к отсутствию негативных особенностей в чувствительности предлагаемого подхода и его высокой специфичности при распознавании.</p>
			<fig id="F2">
				<label>Figure 2</label>
				<caption>
					<p>Чувствительность распознавания родов коронавирусов (Alphacoronavirus, Betacoronavirus, Deltacoronavirus, Gammacoronavirus) для N-генов (представленных векторами частот кодонов), достигаемая с помощью обучающей выборки, используемой в настоящей работе</p>
				</caption>
				<alt-text>Чувствительность распознавания родов коронавирусов (Alphacoronavirus, Betacoronavirus, Deltacoronavirus, Gammacoronavirus) для N-генов (представленных векторами частот кодонов), достигаемая с помощью обучающей выборки, используемой в настоящей работе</alt-text>
				<graphic ns1:href="/media/images/2026-06-25/edd45a39-5412-438d-8146-3df774420b38.png"/>
			</fig>
			<p>Распознавание обучающей выборки</p>
			<p>Если обучающая выборка может считаться репрезентативной, то мы вправе ожидать, что результат распознавания с ее помощью любой тестируемой выборки не должен кардинально отличаться от результата, который достигается, когда обучающая выборка распознает саму себя. Рисунок 3 показывает, как обучающая выборка, используемая в настоящей работе, распознает себя в качестве тестируемой.</p>
			<fig id="F3">
				<label>Figure 3</label>
				<caption>
					<p>Чувствительность распознавания родов коронавирусов (Alphacoronavirus, Betacoronavirus, Deltacoronavirus, Gammacoronavirus) для N-генов (представленных векторами частот кодонов), полученные для обучающей выборки, используемой в настоящей работе, в случае, когда она одновременно является и тестируемой</p>
				</caption>
				<alt-text>Чувствительность распознавания родов коронавирусов (Alphacoronavirus, Betacoronavirus, Deltacoronavirus, Gammacoronavirus) для N-генов (представленных векторами частот кодонов), полученные для обучающей выборки, используемой в настоящей работе, в случае, когда она одновременно является и тестируемой</alt-text>
				<graphic ns1:href="/media/images/2026-06-25/c148e145-a191-4d20-8db2-7591018f9cac.png"/>
			</fig>
			<p>Как можно видеть из рисунка 3, начиная с размерности векторного пространства n=12, чувствительность в распознавании каждого рода коронавирусов становится выше 0.9 и продолжает стабильно расти с увеличением размерности n пространства векторов частот кодонов, с помощью которых анализируются N-гены коронавирусов. Такой же результат наблюдался и на рисунке 2 при распознавании рода на тестируемой выборке. Сравнение рис. 2 и рис. 3 дополнительно подтверждает достоверность в распознавании рода коронавирусов с помощью используемой в настоящей работе обучающей выборки.</p>
			<p>Таким образом, из рисунка 2 и рисунка 3 следует, что для эффективного распознавания рода коронавирусов можно ограничиться достаточно низкой размерностью (n=12) пространства векторов частот кодонов в N-гене.</p>
			<p>4. Заключение</p>
			<p>В настоящей работе представлен пример использования оригинального подхода к распознаванию геномов коронавирусов, относящийся к методам целевого (таргетного) распознавания без выравнивания. Подход исходит из оценки частот встречаемости кодонов в таргетном гене (в настоящей работе это N-ген белка нуклеокапсида). Подход основан на использовании метода главных компонент и требует репрезентативной обучающей выборки, наличие которой показано в настоящей работе. Кроме того, отмечена возможность значительного уменьшения параметров распознавания путем сокращения размерности пространства векторов частот кодонов N-гена.</p>
		</sec>
		<sec sec-type="supplementary-material">
			<title>Additional File</title>
			<p>The additional file for this article can be found as follows:</p>
			<supplementary-material xmlns:xlink="http://www.w3.org/1999/xlink" id="S1" xlink:href="https://doi.org/10.5334/cpsy.78.s1">
				<!--[<inline-supplementary-material xlink:title="local_file" xlink:href="https://journal-biogen.org/media/articles/25515.docx">25515.docx</inline-supplementary-material>]-->
				<!--[<inline-supplementary-material xlink:title="local_file" xlink:href="https://journal-biogen.org/media/articles/25515.pdf">25515.pdf</inline-supplementary-material>]-->
				<label>Online Supplementary Material</label>
				<caption>
					<p>
						Further description of analytic pipeline and patient demographic information. DOI:
						<italic>
							<uri>https://doi.org/10.60797/jbg.2026.32.7</uri>
						</italic>
					</p>
				</caption>
			</supplementary-material>
		</sec>
	</body>
	<back>
		<ack>
			<title>Acknowledgements</title>
			<p/>
		</ack>
		<sec>
			<title>Competing Interests</title>
			<p/>
		</sec>
		<ref-list>
			<ref id="B1">
				<label>1</label>
				<mixed-citation publication-type="confproc">Львов Д.К. Таксономия и мегатаксономия вирусов (домен Vira) — текущий статус / Д.К. Львов, В.Г. Акимкин, А.Д. Забережный [и др.] // Вопросы вирусологии. — 2025. — Т. 70. — № 5. — C. 401–416. — DOI: 10.36233/0507-4088-344.</mixed-citation>
			</ref>
			<ref id="B2">
				<label>2</label>
				<mixed-citation publication-type="confproc">Kim C. Unraveling metagenomics through long-read sequencing: a comprehensive review / C. Kim, M. Pongpanich, T. Porntaveetus // Journal of Translational Medicine. — 2024. — Vol. 22. — Art. 111. — DOI: 10.1186/s12967-024-04917-1.</mixed-citation>
			</ref>
			<ref id="B3">
				<label>3</label>
				<mixed-citation publication-type="confproc">Le B. A review of computational approaches for metagenomics by long-read sequencing / B. Le, L. Jia, T. Pang [et al.] // Science China Life Sciences. — 2026. — DOI: 10.1007/s11427-025-3133-3.</mixed-citation>
			</ref>
			<ref id="B4">
				<label>4</label>
				<mixed-citation publication-type="confproc">Ерёмин А.А. Нанопоровое секвенирование в геномике метагеномике и эпигеномике: инструменты и алгоритмы анализа / А.А. Ерёмин, А.В. Сергеев, М.Э. Зверева [и др.] // Математическая биология и биоинформатика. — 2025. — Т. 20. — № 2. — C. 588–624. — DOI: 10.17537/2025.20.588.</mixed-citation>
			</ref>
			<ref id="B5">
				<label>5</label>
				<mixed-citation publication-type="confproc">Galeeva J. Bioinformatics tools and approaches for virus discovery in genomic data: a systematic review / J. Galeeva, P. Kuzmichenko, A. Manolov [et al.] // Viruses. — 2025. — Vol. 17. — № 12. — Art. 1538. — DOI: 10.3390/v17121538.</mixed-citation>
			</ref>
			<ref id="B6">
				<label>6</label>
				<mixed-citation publication-type="confproc">Pruitt K.D. NCBI Reference Sequences (RefSeq): current status, new features and genome annotation policy / K.D. Pruitt, T. Tatusova, G.R. Brown [et al.] // Nucleic Acids Research. — 2011. — Vol. 40. — № D1. — P. D130–D135. — DOI: 10.1093/nar/gkr1079.</mixed-citation>
			</ref>
			<ref id="B7">
				<label>7</label>
				<mixed-citation publication-type="confproc">Johnson M. NCBI BLAST: a better web interface / M. Johnson, I. Zaretskaya, Y. Raytselis [et al.] // Nucleic Acids Research. — 2008. — Vol. 36. — Ssuppl. 2. — P. W5–W9. — DOI: 10.1093/nar/gkn201.</mixed-citation>
			</ref>
			<ref id="B8">
				<label>8</label>
				<mixed-citation publication-type="confproc">NCBI Virus. — URL: https://www.ncbi.nlm.nih.gov/labs/virus/vssi/ (accessed: 06.04.2026).</mixed-citation>
			</ref>
			<ref id="B9">
				<label>9</label>
				<mixed-citation publication-type="confproc">Edgar R.C. MUSCLE: multiple sequence alignment with high accuracy and high throughput / R.C. Edgar // Nucleic Acids Research. — 2004. — Vol. 32. — № 5. — P. 1792–1797. — DOI: 10.1093/nar/gkh340.</mixed-citation>
			</ref>
			<ref id="B10">
				<label>10</label>
				<mixed-citation publication-type="confproc">Katoh K. MAFFT online service: multiple sequence alignment, interactive sequence choice and visualization / K. Katoh, J. Rozewicki, K.D.Yamada // Briefings in Bioinformatics. — 2019. — Vol. 20. — № 4. — P. 1160–1166. — DOI: 10.1093/bib/bbx108.</mixed-citation>
			</ref>
			<ref id="B11">
				<label>11</label>
				<mixed-citation publication-type="confproc">Kapli P. Phylogenetic tree building in the genomic age / P. Kapli, Z. Yang, M.J. Telford // Nature Reviews. Genetics. — 2020. — Vol. 21. — № 7. — P. 428–444. — DOI: 10.1038/s41576-020-0233-0.</mixed-citation>
			</ref>
			<ref id="B12">
				<label>12</label>
				<mixed-citation publication-type="confproc">Yang Z. PAML 4: phylogenetic analysis by maximum likelihood / Z. Yang // Molecular Biology and Evolution. — 2007. — Vol. 24. — № 8. — P. 1586–1591. — DOI: 10.1093/molbev/msm088.</mixed-citation>
			</ref>
			<ref id="B13">
				<label>13</label>
				<mixed-citation publication-type="confproc">Chen J. Alignment-free comparison of metagenomics sequences via approximate string matching / J. Chen, L. Yang, L. Li [et al.] // Bioinformatics Advances. — 2022. — Vol. 2. — № 1. — Art. vbac077. — DOI: 10.1093/bioadv/vbac077.</mixed-citation>
			</ref>
			<ref id="B14">
				<label>14</label>
				<mixed-citation publication-type="confproc">Shaukat M.A. Comparative study of encoded and alignment-based methods for virus taxonomy classification / M.A. Shaukat, T.T. Nguyen, E.B. Hsu [et al.] // Scientific Reports. — 2023. — Vol. 13. — № 1. — Art. 18662. — DOI: 10.1038/s41598-023-45461-0.</mixed-citation>
			</ref>
			<ref id="B15">
				<label>15</label>
				<mixed-citation publication-type="confproc">Yu H. The optimal metric for viral genome space / H. Yu, S.S. Yau // Computational and Structural Biotechnology Journal. — 2024. — Vol. 23. — P. 2083–2096. — DOI: 10.1016/j.csbj.2024.05.005.</mixed-citation>
			</ref>
			<ref id="B16">
				<label>16</label>
				<mixed-citation publication-type="confproc">Чалей М.Б. Распознавание рода коронавируса на основе прототипных штаммов / М.Б. Чалей, В.А. Кутыркин // Математическая биология и биоинформатика. — 2022. — Т. 17. — № 1. — С. 10–27. — DOI: 10.17537/2022.17.10.</mixed-citation>
			</ref>
			<ref id="B17">
				<label>17</label>
				<mixed-citation publication-type="confproc">Глотов А.Г. Генетический полиморфизм сибирских изолятов коронавируса крупного рогатого скота (Coronaviridae: Betacoronavirus-1: Bovine-Like coronaviruses) / А.Г. Глотов, А.В. Нефедченко, А.Г. Южаков [и др.] // Вопросы вирусологии. — 2022. —Т. 67. — № 6. — C. 465–474. — DOI: 10.36233/0507-4088-141.</mixed-citation>
			</ref>
			<ref id="B18">
				<label>18</label>
				<mixed-citation publication-type="confproc">Ожмегова Е.Н. Молекулярно-эпидемиологический анализ геновариантов SARS-CoV-2 на территории Москвы и Московской области / Е.Н. Ожмегова, Т.Е. Савочкина, А.Г. Прилипов [и др.] // Вопросы вирусологии. — 2022. — Т. 67. — № 6. — C. 496–505. — DOI: 10.36233/0507-4088-146.</mixed-citation>
			</ref>
			<ref id="B19">
				<label>19</label>
				<mixed-citation publication-type="confproc">Чалей М.Б. Выбор таргета в геномах прототипных штаммов для распознавания подрода коронавирусов / М.Б. Чалей, В.А. Кутыркин // Математическая биология и биоинформатика. — 2023. — Т. 18. — № 2. — С. 267–281. — DOI: 10.17537/2023.18.267.</mixed-citation>
			</ref>
			<ref id="B20">
				<label>20</label>
				<mixed-citation publication-type="confproc">Чалей М.Б. Типологические подходы к распознаванию рода и подрода коронавирусов по структурным и неструктурным генам / М.Б. Чалей, В.А. Кутыркин // Математическая биология и биоинформатика. — 2024. — Т. 19. — № 2. — С. 593–606. — DOI: 10.17537/2024.19.593.</mixed-citation>
			</ref>
			<ref id="B21">
				<label>21</label>
				<mixed-citation publication-type="confproc">Чалей М.Б. Метод главных компонент в таргетном подходе к определению рода коронавирусов / М.Б. Чалей, В.А. Кутыркин // Математическая биология и биоинформатика. — 2026. — Т. 21. — № 1. — C. 1–13. — DOI: 10.17537/2026.21.1.</mixed-citation>
			</ref>
			<ref id="B22">
				<label>22</label>
				<mixed-citation publication-type="confproc">Benson D.A. GenBank / D.A. Benson, M. Cavanaugh, K. Clark [et al.] // Nucleic Acids Research. — 2013. — Vol. 41 (Database issue). — P. D36–D42. — DOI: 10.1093/nar/gks1195.</mixed-citation>
			</ref>
			<ref id="B23">
				<label>23</label>
				<mixed-citation publication-type="confproc">Щелканов М.Ю. История изучения и современная классификация коронавирусов (Nidovirales: Coronaviridae) / М.Ю. Щелканов, А.Ю. Попова, В.Г. Дедков [и др.] // Инфекция и иммунитет. — 2020. — Т. 10. — № 2. — С. 221–246. — DOI: 10.15789/2220-7619-HOI-1412.</mixed-citation>
			</ref>
			<ref id="B24">
				<label>24</label>
				<mixed-citation publication-type="confproc">Корнеенков А.А. Вычисление и интерпретация показателей информативности диагностических медицинских технологий / А.А. Корнеенков, С.В. Рязанцев, Е.Э. Вяземская // Медицинский Совет. — 2019. — Т. 20. — С. 45–51. — DOI: 10.21518/2079-701X-2019-20-45-51.</mixed-citation>
			</ref>
		</ref-list>
	</back>
	<fundings/>
</article>