Впервые сообщение о секвенировании человеческого генома появилось двадцать лет назад, но тогда последовательность была описана неполно. Часть информации отсутствовала: технологические ограничения не позволили исследователям определить, как определенные участки ДНК подходят друг к другу, особенно в случае повторяющихся оснований. В 2013 году в самую последнюю модель были внесены дополнения, но по-прежнему отсутствовало 8 % информации.
Теперь исследователи из Telomere-to-Telomere (T2T), международного консорциума, объединяющего 30 организаций, заполнили эти пробелы.
В препринте статьи, опубликованной на сайте bioRxiv, они сообщили, что секвенировали оставшуюся часть генома, идентифицировав около 115 новых генов, кодирующих белки. В секвенированный геном, получивший название T2T-CHM13, добавили почти 200 миллионов пар оснований к версии 2013 года.
Однако на этом работа не закончится. У команды T2T возникли проблемы с определением нескольких участков хромосом, и, по оценкам, около 0,3% генома может содержать ошибки. Пробелов нет, но авторы отметили, что в этих областях требуется проверка качества.
Пока расшифрован геном только одного человека. Через три года команда намеревается секвенировать более 300 геномов людей со всего мира. Когда это удастся сделать, то геном T2T-CHM13 будет использоваться как ориентир для понимания того, какие его части чаще различаются у разных людей. Они также планируют секвенировать весь геном, содержащий хромосомы обоих родителей.
Комментарии