Исследователи научили нейросеть генерировать реалистичный геном несуществующих людей
Исследователи научили нейросеть генерировать реалистичный геном несуществующих людей

Команда исследователей из Эстонии разработала нейросеть, способную генерировать искусственную ДНК. Созданные компьютером геномы в будущем могут использоваться для исследований вместо настоящих.

Нейросети в последнее десятилетие научились генерировать изображения, практически неотличимые от настоящих. Этот принцип взяли за основу эстонские ученые. 

«В своей работе мы применяем аналогичную концепцию к генетическим данным, анализируя их структуру и на ее основе создавая высококачественные реалистичные геномы». 

Нейросеть создает фрагменты человеческих геномов, которые не принадлежат реальным людям, но соответствуют характеристикам настоящей ДНК. Это позволяет исследователям не беспокоиться об этической стороне вопроса.

«Существующие геномные базы данных являются бесценным ресурсом для медицинских исследований.

Но они либо недоступны для общественности, либо защищены долгими и изнурительными процедурами подачи заявок из-за этических соображений. Это создает барьер для исследователей. Геномы, сгенерированные машиной, или, как мы их называем, искусственные геномы, могут помочь нам преодолеть ограничения в рамках этических норм», -— пояснил Бурак Ельмен. (первый автор исследования и сотрудник Тартуского университета).

Согласно нынешней исследовательской парадигме, ученые должны гарантировать конфиденциальность людей, которым принадлежит используемая в исследованиях ДНК. Учреждения не имеют права обмениваться базами данных ДНК, из-за чего материала для исследований часто не хватает.  Синтетические геномы должны помочь в решении этих проблем.

Команда Тартуского университета провела несколько анализов, чтобы оценить качество сгенерированных геномов по сравнению с реальными. 

Качество сгенерированных геномов, а также их отличия от настоящих, было проверено в ходе многочисленных анализов. По словам Луки Пагани, ведущего автора исследования, искусственные геномы имитируют сложности, присущие настоящим геномам человека. Они почти не имеют отличия от натуральных геномов биобанка, используемых для обучения алгоритма. Единственным отличием является то, что они не принадлежат реальному человеку.

Ученые также проанализировали близость искусственных геномов к реальным, чтобы проверить, сохраняется ли конфиденциальность исходных образцов. Авторы статьи отмечают, что искусственные реалистичные геномы смогут в будущем заменить реальные. Это позволит значительно ускорить исследования ДНК, особенно для недостаточно представленных популяций.