محققان دانشگاه تورنتو یک سیستم هوش مصنوعی ایجاد کردهاند که میتواند پروتئینهایی را که در طبیعت یافت نمیشوند با استفاده از انتشار مولد ایجاد کند، همان فناوری در پشت پلتفرمهای محبوب ایجاد تصویر مانند DALL-E و Midjourney.
این سیستم به پیشرفت زمینه زیستشناسی مولد کمک میکند، که با ایجاد کارآمدی و انعطافپذیری بیشتر در طراحی و آزمایش پروتئینهای درمانی کاملاً جدید، به توسعه دارو سرعت میبخشد.
مدل ما از نمایش های تصویری می آموزد تا پروتئین های کاملاً جدید را با سرعت بسیار بالایی تولید کند. همه پروتئینهای ما از نظر بیوفیزیکی واقعی به نظر میرسند، به این معنی که به شکلهایی جمع میشوند که آنها را قادر میسازد عملکردهای خاصی را در سلولها انجام دهند.
فیلیپ ام. کیم، استاد مرکز دانلی برای تحقیقات سلولی و بیومولکولی در دانشکده پزشکی U of T’s Temerty
امروز، مجله علوم محاسباتی طبیعت این یافتهها، اولین مورد در نوع خود، در یک مجله معتبر منتشر شد. آزمایشگاه کیم همچنین تابستان گذشته پیشچاپی از مدل را از طریق سرور دسترسی باز bioRxiv منتشر کرد، پیش از دو پیشچاپ مشابه در دسامبر گذشته، RF Diffusion توسط دانشگاه واشنگتن و Chroma توسط Generate Biomedicnes.
پروتئین ها از زنجیره ای از اسیدهای آمینه ساخته می شوند که به شکل های سه بعدی تا می شوند که به نوبه خود عملکرد پروتئین را دیکته می کنند. این اشکال در طی میلیاردها سال تکامل یافته و متنوع و پیچیده هستند، اما تعدادشان نیز محدود است. با درک بهتری از چگونگی تا شدن پروتئین های موجود، محققان شروع به طراحی الگوهای تاشویی کرده اند که در طبیعت تولید نشده اند.
اما به گفته کیم، یک چالش بزرگ، تصور چینهایی است که هم ممکن و هم کاربردی هستند. کیم که همچنین استاد بخش ژنتیک مولکولی و علوم کامپیوتر در U of T است، میگوید: «پیشبینی اینکه کدام چینها واقعی هستند و در ساختار پروتئینی کار میکنند بسیار سخت است. با ترکیب بازنماییهای مبتنی بر بیوفیزیک از ساختار پروتئین با روشهای انتشار از فضای تولید تصویر، میتوانیم شروع به رسیدگی به این مشکل کنیم.”
این سیستم جدید که محققان آن را ProteinSGM مینامند، از مجموعه بزرگی از نمایشهای تصویر مانند پروتئینهای موجود استخراج میشود که ساختار آنها را با دقت رمزگذاری میکند. محققان این تصاویر را به یک مدل انتشار مولد میرسانند، که به تدریج نویز اضافه میکند تا زمانی که هر تصویر به تمام نویز تبدیل شود. این مدل نحوه نویزتر شدن تصاویر را ردیابی میکند و سپس فرآیند را به صورت معکوس اجرا میکند و یاد میگیرد که چگونه پیکسلهای تصادفی را به تصاویر شفافی که مطابق با پروتئینهای کاملاً جدید هستند، تبدیل کند.
جین ساب (مایکل) لی، دانشجوی دکترا در آزمایشگاه کیم و اولین نویسنده این مقاله، میگوید که بهینهسازی مراحل اولیه این فرآیند تولید تصویر یکی از بزرگترین چالشها در ایجاد ProteinSGM بود. لی، که اهل ونکوور است، اما مدرک کارشناسی خود را در کره جنوبی و کارشناسی ارشد را در سوئیس گذرانده، میگوید: «یک ایده کلیدی، نمایش تصویری مناسب از ساختار پروتئین بود، به طوری که مدل انتشار میتواند یاد بگیرد که چگونه پروتئینهای جدید تولید کند. انتخاب U از T برای دکترای خود.
همچنین اعتبار سنجی پروتئین های تولید شده توسط ProteinSGM دشوار بود. این سیستم ساختارهای بسیاری را تولید می کند، اغلب بر خلاف هر چیزی که در طبیعت یافت می شود. لی میگوید تقریباً همه آنها بر اساس معیارهای استاندارد واقعی به نظر میرسند، اما محققان به اثبات بیشتری نیاز داشتند.
لی و همکارانش برای آزمایش پروتئین های جدید خود ابتدا به OmegaFold، نسخه بهبودیافته نرم افزار DeepMind AlphaFold 2 روی آوردند. هر دو پلتفرم از هوش مصنوعی برای پیش بینی ساختار پروتئین ها بر اساس توالی اسیدهای آمینه استفاده می کنند.
با OmegaFold، تیم تأیید کرد که تقریباً تمام توالیهای جدید آنها به ساختارهای پروتئینی مورد نظر و همچنین جدید تا میشوند. سپس آنها تعداد کمتری را برای ایجاد فیزیکی در لولههای آزمایش انتخاب کردند تا تأیید کنند که ساختارها پروتئین هستند و نه فقط رشتههای سرگردان از ترکیبات شیمیایی.
لی میگوید: «با بازیهای OmegaFold و آزمایشهای تجربی در آزمایشگاه، میتوانیم مطمئن باشیم که این پروتئینها به درستی تا شده هستند. دیدن تأیید این چینهای پروتئینی کاملاً جدید که در هیچ کجای طبیعت وجود ندارند شگفتانگیز بود.
کیم می گوید گام های بعدی بر اساس این کار شامل توسعه بیشتر ProteinSGM برای آنتی بادی ها و سایر پروتئین ها با بیشترین پتانسیل درمانی است. او می افزاید: «این یک منطقه بسیار هیجان انگیز برای تحقیق و کارآفرینی خواهد بود.
لی میگوید که مایل است شاهد حرکت زیستشناسی مولد به سمت طراحی مشترک توالیها و ساختارهای پروتئین، از جمله ترکیبهای زنجیره جانبی پروتئین باشد. بیشتر تحقیقات تا به امروز بر تولید ستون فقرات، ساختارهای شیمیایی اولیه که پروتئین ها را در کنار هم نگه می دارند، متمرکز شده است.
لی میگوید: «پیکربندیهای زنجیره جانبی در نهایت عملکرد پروتئین را تعیین میکنند، و اگرچه طراحی آنها به معنای افزایش تصاعدی در پیچیدگی است، اما ممکن است با مهندسی مناسب امکانپذیر باشد. ما امیدواریم که متوجه شویم.»
منبع:
مرجع مجله:
لی، جی اس، و همکاران (2023). مدلسازی مولد مبتنی بر امتیاز برای طراحی پروتئین de novo. علوم محاسباتی طبیعت. doi.org/10.1038/s43588-023-00440-3.