Интегрированные варианты из 13000 полных геномов доступны общественности в базе данных Kaviar

Институт системной биологии (ISB) и Институт трансляционной медицины Inova (ITMI) объявили сегодня о выпуске новой версии Kaviar, наиболее полной коллекции вариантов генома человека, доступной в настоящее время общественности. Этот выпуск расширяет выпуск от января 2015 года, в первую очередь добавлением 3842 полногеномных последовательностей, предоставленных ITMI. Inova, некоммерческая система здравоохранения, базирующаяся в Северной Вирджинии, основала ITMI, чтобы превратить здравоохранение из реактивной модели в прогностическую.

Впервые описано в Glusman et al., Биоинформатика. 2011, Кавиар отвечает на вопрос: "Встречался ли этот вариант раньше, и если да, то как часто?" Kaviar в настоящее время перечисляет 169 миллионов сайтов SNV (однонуклеотидный вариант) и 48 миллионов инделей и замен.

Kaviar объединяет 31 общедоступный источник данных и 4622 частных полногеномных последовательности. Kaviar объединяет данные об вариациях генома 77 238 неродственных людей, включая данные проекта 1000 Genomes Project, частоты аллелей UK10K COHORT, представляющие 3781 человека, 63 000 экзомов Консорциума агрегации экзомов (ExAC) и 808 полных геномов от Инициативы нейровизуализации болезни Альцгеймера (ADNI). Разнообразие увеличивается за счет включения данных из проекта Simons Foundation Diversity и нескольких источников данных по конкретным группам населения. Очень редкие варианты в личных данных (наблюдаемые менее чем у 3 человек) не включены в Kaviar для защиты конфиденциальности отдельных лиц.

Kaviar доступен по адресу http: // db.систембиология.net / kaviar /, где пользователи могут запрашивать базу данных через веб-интерфейс. Kaviar принимает запросы о местонахождении генома, а затем сообщает, какие варианты наблюдались в этих местах и ​​с какой частотой. Kaviar также можно запросить программно через веб-службу. Пользователи также могут загрузить полную базу данных Kaviar в формате VCF и использовать стандартные программные инструменты для запроса к ней.

ISB регулярно обновляет Kaviar, включая обновления dbSNP, недавно полученные последовательности генома и улучшения в эталонной сборке. Предстоящий релиз будет содержать частоты генотипов в дополнение к частотам аллелей.