کتابخانههای عظیمی از ترکیبات دارویی ممکن است درمانهای بالقوهای برای انواع بیماریها مانند سرطان یا بیماری قلبی داشته باشند. در حالت ایدهآل، دانشمندان مایلند هر یک از این ترکیبات را در برابر تمام اهداف ممکن آزمایش کنند، اما انجام این نوع صفحه نمایش بسیار وقت گیر است.
در سالهای اخیر، محققان استفاده از روشهای محاسباتی را برای غربالگری این کتابخانهها به امید تسریع در کشف دارو آغاز کردهاند. با این حال، بسیاری از این روشها نیز زمان زیادی میبرند، زیرا اکثر آنها ساختار سه بعدی هر پروتئین هدف را از روی توالی اسید آمینه آن محاسبه میکنند، سپس از آن ساختارها برای پیشبینی مولکولهای دارویی استفاده میکنند.
محققان MIT و دانشگاه تافتز اکنون یک رویکرد محاسباتی جایگزین بر اساس نوعی الگوریتم هوش مصنوعی که به عنوان مدل زبان بزرگ شناخته می شود، ابداع کرده اند. این مدل ها -; یکی از نمونه های شناخته شده ChatGPT – است. می تواند حجم عظیمی از متن را تجزیه و تحلیل کند و بفهمد کدام کلمات (یا در این مورد، اسیدهای آمینه) به احتمال زیاد با هم ظاهر می شوند. مدل جدید، معروف به ConPLex، میتواند پروتئینهای هدف را با مولکولهای دارویی بالقوه بدون نیاز به انجام مرحله محاسباتی فشرده محاسبه ساختار مولکولها مطابقت دهد.
با استفاده از این روش، محققان می توانند بیش از 100 میلیون ترکیب را در یک روز غربال کنند -; بسیار بیشتر از هر مدل موجود
این کار به نیاز به غربالگری سیلیکونی کاندیداهای بالقوه دارو میپردازد و مقیاسپذیری مدل، نمایشگرهای مقیاس بزرگ را برای ارزیابی اثرات خارج از هدف، استفاده مجدد از دارو، و تعیین تأثیر جهشها بر اتصال به دارو را قادر میسازد.
بانی برگر، استاد ریاضیات سیمونز، رئیس گروه محاسبات و زیست شناسی در آزمایشگاه علوم کامپیوتر و هوش مصنوعی MIT (CSAIL) و یکی از نویسندگان ارشد مطالعه جدید
لنور کاون، استاد علوم کامپیوتر در دانشگاه تافتس، همچنین نویسنده ارشد این مقاله است که این هفته در مجموعه مقالات آکادمی ملی علوم منتشر شد. روهیت سینگ، دانشمند تحقیقاتی CSAIL، و ساموئل اسلدزیسکی، دانشجوی کارشناسی ارشد MIT، نویسندگان اصلی مقاله و برایان برایسون، دانشیار مهندسی بیولوژیک در MIT و عضو موسسه راگون MGH، MIT، و هاروارد، همچنین یک نویسنده است. علاوه بر مقاله، محققان مدل خود را به صورت آنلاین در دسترس سایر دانشمندان قرار داده اند تا از آن استفاده کنند.
پیشگویی
در سالهای اخیر، دانشمندان محاسباتی پیشرفتهای زیادی در توسعه مدلهایی داشتهاند که میتوانند ساختار پروتئینها را بر اساس توالیهای اسید آمینه آنها پیشبینی کنند. با این حال، استفاده از این مدلها برای پیشبینی اینکه چگونه یک کتابخانه بزرگ از داروهای بالقوه ممکن است با یک پروتئین سرطانی تعامل داشته باشد، به عنوان مثال، چالش برانگیز است، عمدتاً به این دلیل که محاسبه ساختارهای سهبعدی پروتئینها به زمان و قدرت محاسباتی زیادی نیاز دارد.
یک مانع دیگر این است که این نوع مدلها سابقه خوبی برای از بین بردن ترکیبات معروف به طعمه ندارند، که بسیار شبیه به یک داروی موفق هستند اما در واقع به خوبی با هدف تعامل ندارند.
یکی از چالشهای دیرینه در این زمینه این است که این روشها شکننده هستند، به این معنا که اگر به مدل دارو یا مولکول کوچکی بدهم که تقریباً شبیه چیز واقعی به نظر میرسد، اما به روشی ظریف کمی متفاوت است، سینگ میگوید: «مدل هنوز ممکن است پیشبینی کند که آنها با هم تعامل خواهند داشت، حتی اگر اینطور نباشد.»
محققان مدلهایی طراحی کردهاند که میتوانند بر این نوع شکنندگی غلبه کنند، اما آنها معمولاً فقط برای یک دسته از مولکولهای دارویی طراحی شدهاند و برای نمایشگرهای مقیاس بزرگ مناسب نیستند زیرا محاسبات بیش از حد طول میکشد.
تیم MIT تصمیم گرفت یک رویکرد جایگزین را بر اساس یک مدل پروتئینی که برای اولین بار در سال 2019 ایجاد کردند، اتخاذ کند. مدل زبانی با کار با پایگاه داده ای از بیش از 20000 پروتئین، این اطلاعات را در نمایش های عددی معنی دار هر دنباله آمینو اسیدی رمزگذاری می کند که ارتباط ها را ثبت می کند. بین توالی و ساختار
اسلزیسکی میگوید: «با این مدلهای زبانی، حتی پروتئینهایی که دارای توالیهای بسیار متفاوت هستند، اما به طور بالقوه ساختارهای مشابه یا عملکردهای مشابهی دارند، میتوانند به روشی مشابه در این فضای زبانی نمایش داده شوند، و ما میتوانیم از آن برای پیشبینیهای خود استفاده کنیم.» می گوید.
محققان در مطالعه جدید خود از مدل پروتئینی برای تعیین اینکه کدام توالی پروتئین با مولکولهای دارویی خاص که هر دو دارای نمایشهای عددی هستند که توسط یک شبکه عصبی به فضای مشترک و مشترک تبدیل میشوند، برهمکنش خواهند داشت، استفاده کردند. آنها شبکه را در مورد برهمکنش های شناخته شده پروتئین-دارو آموزش دادند، که به آن اجازه داد تا بیاموزد که ویژگی های خاص پروتئین ها را با توانایی اتصال دارو، بدون نیاز به محاسبه ساختار سه بعدی هر یک از مولکول ها، مرتبط کند.
سینگ می گوید: «با این نمایش عددی با کیفیت بالا، مدل می تواند نمایش اتمی را به طور کامل اتصال کوتاه کند و از روی این اعداد پیش بینی کند که آیا این دارو متصل می شود یا خیر. “مزیت این این است که شما از نیاز به گذر از یک نمایش اتمی اجتناب می کنید، اما اعداد همچنان تمام اطلاعات مورد نیاز شما را دارند.”
مزیت دیگر این رویکرد این است که انعطافپذیری ساختارهای پروتئینی را در نظر میگیرد، که میتواند «تقوع» باشد و هنگام تعامل با یک مولکول دارو، شکلهای کمی متفاوت به خود بگیرد.
میل ترکیبی بالا
محققان برای اینکه مدلشان کمتر فریب مولکول های داروی فریبنده را بخورد، یک مرحله آموزشی بر اساس مفهوم یادگیری متضاد را نیز در نظر گرفتند. بر اساس این رویکرد، محققان نمونههایی از داروهای «واقعی» و جعلکنندهها را ارائه میکنند و به آن آموزش میدهند که بین آنها تمایز قائل شود.
محققان سپس مدل خود را با غربالگری کتابخانه ای از حدود 4700 مولکول دارویی کاندید برای توانایی آنها در اتصال به مجموعه ای از 51 آنزیم معروف به پروتئین کینازها آزمایش کردند.
از میان برترین ها، محققان 19 جفت دارو و پروتئین را برای آزمایش آزمایشی انتخاب کردند. آزمایشها نشان داد که از 19 مورد، 12 مورد دارای میل پیوندی قوی (در محدوده نانومولاری) بودند، در حالی که تقریباً تمام جفتهای احتمالی دارو-پروتئین دیگر هیچ میل ترکیبی نداشتند. چهار مورد از این جفتها با میل ترکیبی بسیار بالا و زیر نانومولاری (آنقدر قوی که غلظت کوچک دارو، در حد واحد در میلیارد، پروتئین را مهار میکند) متصل شدهاند.
در حالی که محققان در این مطالعه عمدتاً بر غربالگری داروهای مولکولی کوچک تمرکز کردند، اکنون در حال کار بر روی استفاده از این رویکرد برای انواع دیگر داروها مانند آنتی بادی های درمانی هستند. این نوع مدلسازی همچنین میتواند برای اجرای نمایشگرهای سمیت ترکیبات دارویی بالقوه مفید باشد، تا قبل از آزمایش آنها در مدلهای حیوانی، هیچ گونه عوارض جانبی ناخواستهای نداشته باشند.
“بخشی از دلیل گران بودن کشف دارو به این دلیل است که نرخ شکست بالایی دارد. اگر بتوانیم با گفتن اینکه این دارو به احتمال زیاد جواب نمی دهد، این نرخ های شکست را کاهش دهیم، می تواند به کاهش هزینه های دارو کمک زیادی کند. سینگ می گوید: کشف مواد مخدر.
این تحقیق توسط مؤسسه ملی بهداشت، بنیاد ملی علوم و بنیاد فیلیپ و سوزان راگون تأمین شده است.
منبع:
موسسه تکنولوژی ماساچوست
مرجع مجله:
سینگ، آر. و همکاران (2023) یادگیری متضاد در فضای زبان پروتئینی، تعاملات بین داروها و اهداف پروتئینی را پیش بینی می کند. PNAS. doi.org/10.1073/pnas.2220778120.