Инструмент Google на основе искусственного интеллекта выявляет генетические факторы рака

Инструмент Google на основе искусственного интеллекта выявляет генетические факторы рака
Компания Google анонсировала DeepSomatic — инструмент на основе искусственного интеллекта, который может более точно выявлять мутации, связанные с раком, в генетических последовательностях опухолей.
Рак начинается с нарушения механизмов, контролирующих деление клеток. Выявление специфических генетических мутаций, стимулирующих рост опухоли, крайне важно для разработки эффективных планов лечения. Врачи регулярно секвенируют геномы опухолевых клеток из биопсий, чтобы определить методы лечения, направленные на рост и распространение конкретного вида рака.
В работе, опубликованной в журнале Nature Biotechnology, представлен инструмент, использующий сверточные нейронные сети для выявления генетических вариантов в опухолевых клетках с большей точностью, чем существующие методы. Google предоставила открытый доступ как к DeepSomatic, так и к высококачественному обучающему набору данных, созданному для него.
Проблема соматических вариантов
Генетика рака — сложная наука. Хотя секвенирование генома позволяет обнаружить генетические вариации рака, отличить реальные варианты от ошибок секвенирования сложно, и в этом случае инструмент на основе искусственного интеллекта мог бы оказать необходимую помощь. Большинство случаев рака обусловлено «соматической» мутацией, приобретённой после рождения, а не унаследованной «зародышевой» мутацией от родителей.
Соматические мутации возникают, когда факторы окружающей среды, такие как ультрафиолетовое излучение, повреждают ДНК, или когда во время репликации ДНК происходят случайные ошибки. Когда эти мутации изменяют нормальное поведение клеток, они могут вызывать неконтролируемую репликацию, что приводит к развитию и прогрессированию рака.
Выявление соматических мутаций сложнее, чем выявление унаследованных, поскольку они могут встречаться в опухолевых клетках с низкой частотой, иногда ниже, чем частота ошибок секвенирования.
Как работает DeepSomatic
В клинических условиях учёные секвенируют как опухолевые клетки из биопсии, так и нормальные клетки пациента. DeepSomatic выявляет различия, выявляя неунаследованные вариации в опухолевых клетках. Эти вариации выявляют факторы, стимулирующие рост опухоли.
Модель преобразует необработанные данные генетического секвенирования как из опухолевых, так и из нормальных образцов в изображения, представляющие различные точки данных, включая данные секвенирования и их выравнивание вдоль хромосомы. Свёрточная нейронная сеть анализирует эти изображения, различая стандартный референсный геном, нормальные наследственные варианты генома и соматические варианты, вызывающие рак, отфильтровывая ошибки секвенирования. Результатом является список мутаций, связанных с раком.
DeepSomatic также может работать в режиме «только опухоль», когда образцы нормальных клеток недоступны, что часто случается при раке крови, таком как лейкемия. Это делает инструмент применимым во многих исследовательских и клинических ситуациях.
Обучение более точного инструмента ИИ для исследования рака
Обучение точной модели ИИ требует высококачественных данных. Для своего инструмента ИИ Google и её партнёры из Института геномики Калифорнийского университета в Санта-Крузе и Национального института рака создали эталонный набор данных CASTLE. Они секвенировали опухолевые и нормальные клетки из четырёх образцов рака молочной железы и двух образцов рака лёгких.
Эти образцы были проанализированы с помощью трёх ведущих платформ секвенирования для создания единого точного референсного набора данных путём объединения выходных данных и устранения ошибок, специфичных для платформ. Данные показывают, что даже один и тот же тип рака может иметь существенно различающиеся мутационные сигнатуры, информация, которая может помочь предсказать ответ пациента на определённое лечение.
Модели DeepSomatic показали себя лучше других известных методов на всех трёх основных платформах секвенирования. Инструмент отлично справился с выявлением сложных мутаций, называемых инсерциями и делециями, или «инделами». Для этих вариантов DeepSomatic достиг 90% F1-оценки на данных секвенирования Illumina по сравнению с 80% для следующего по эффективности метода. Улучшение было ещё более значительным на данных Pacific Biosciences, где DeepSomatic набрал более 80%, в то время как следующий по эффективности инструмент набрал менее 50%.
ИИ хорошо показал себя при анализе сложных образцов. Тестирование включало образец рака молочной железы, закреплённый формалином и залитый парафином (FFPE). Этот распространённый метод может привести к повреждению ДНК и усложнить анализ. Он также был протестирован на данных полноэкзомного секвенирования (WES) – более доступного метода, секвенирующего только 1% генома, кодирующего белки. В обоих сценариях DeepSomatic превзошел другие инструменты, что свидетельствует о его пригодности для анализа низкокачественных или исторических образцов.
Инструмент ИИ для всех видов рака
Инструмент ИИ продемонстрировал, что может применять свои знания к новым типам рака, на которых он не был обучен. При анализе образца глиобластомы, агрессивного рака головного мозга, он успешно выявил несколько известных вариантов, вызывающих заболевание. В партнерстве с организацией Children’s Mercy в Канзас-Сити он проанализировал восемь образцов детской лейкемии и обнаружил ранее известные варианты, а также идентифицировал 10 новых, несмотря на работу только с образцами опухолей.
Google надеется, что исследовательские лаборатории и врачи будут использовать этот инструмент для лучшего понимания отдельных опухолей. Выявляя известные варианты рака, он может помочь в выборе существующих методов лечения. Обнаружение новых вариантов может привести к разработке новых методов лечения. Цель — развитие прецизионной медицины и предоставление пациентам более эффективных методов лечения.

