Ключевые шаги:
- Удаление соединений с нежелательными свойствами:
- Фильтры подструктур для удаления PAINS.
- Фильтры с использованием несовместимых с MedChem (REOS) SMARTS.
- Виртуальный скрининг, управляемый моделями машинного обучения и стыковка с использованием AutoDock Vina:
- Модели машинного обучения на отпечатках ECFP, построенные с использованием данных об активности USP30 из базы данных ChEMBL32 — выбор 10–20 тыс. соединений.
- Использование Qed [3] и выбора разнообразия (алгоритм MaxMin [4]) для скрининга (стыковки) разнообразных и более качественных структур
- Стыковка 7 тыс. лучших соединений с использованием AutoDock Vina.
- Окончательный выбор на основе расчетной энергии и эффективности лиганда (LE)
Открытие нековалентных ингибиторов USP30 с новыми хемотипами.
Ключевые решения/детали:
l Вся доступная библиотека малых молекул ГК Химрар 1.6M была отфильтрована для PAINS, REOS и MedChem (включая Lipinski Ro5), что привело к 950K структур
l Модель машинного обучения для первоначального скрининга была построена с использованием данных об активности для USP30 из ChEMBL32: модель логистической регрессии, построенная на 13 дескрипторах (включая, например, cLogP, NumHDonors, NumHAcceptors, MolWt, MaxPartialCharge, топологический индекс Kappa3), оказалась наиболее значимой для модели CatBoost (использующей все доступные дескрипторы), построенной на обучающем наборе (и, вероятно, переобученной).
l Модель логистической регрессии использовалась для фильтрации 100 тыс. структур с наибольшей вероятностью активности USP30 l Структуры с Qed [1] > 0,5 использовались для дальнейшей обработки
l Наконец, был выбран набор из 10 тыс. самых разнообразных соединений с использованием алгоритма MaxMin (ECFP2048)
l Скрининг на основе структуры
l Для моделирования были выбраны две структуры PDB
l 5OHP с субстратом диубиквитина и каталитической заменой C77A l 8D0A с ковалентным ингибитором малой молекулы (выпущен в 2023 г.)
l Структуры заметно различаются по конформациям петель, определяющим связывающий карман
l Стыковка AutoDock Vina была выполнена для каждой из моделей рецепторов
l Наконец, были сохранены соединения, которые показывают связывание (оцененное Vina) с <7 ккал/моль и имеющие LE >= 0,3 по крайней мере для одной модели рецептора, что привело к 2680 перспективным соединениям