تیمی از محققان Baidu Research یک الگوریتم هوش مصنوعی توسعه دادهاند که میتواند به سرعت توالیهای واکسن mRNA COVID-19 بسیار پایدار را طراحی کند که قبلاً دست نیافتنی بودند. این الگوریتم که LinearDesign نام دارد، نشان دهنده یک جهش بزرگ در پایداری و کارایی توالی واکسن است و به افزایش ۱۲۸ برابری پاسخ آنتی بادی واکسن COVID-19 دست می یابد.
این تحقیق میتواند داروی mRNA را که رمزگذاری میکند برای طیف وسیعتری از پروتئینهای درمانی، مانند آنتیبادیهای مونوکلونال و داروهای ضد سرطان، اعمال کند، که کاربردهای گسترده و تأثیر گستردهای را دارد.
دکتر هی ژانگ، مهندس نرم افزار کارکنان در تحقیقات بایدو
از طریق همکاری با دانشگاه ایالتی اورگان، StemiRNA Therapeutics و مرکز پزشکی دانشگاه روچستر، مطالعه “الگوریتم برای طراحی بهینه mRNA، ثبات و ایمنی زایی را بهبود می بخشد” امروز از طریق پیش نمایش مقاله شتاب یافته (AAP) در مجله علمی Nature منتشر شد. این اولین باری است که یک شرکت فناوری چینی به عنوان اولین وابستگی در مقاله ای که در آن منتشر شده است، شناخته می شود طبیعت.
این مقاله نشان میدهد که چگونه میتوان با استفاده از یک رویکرد کلاسیک از پردازش زبان طبیعی (NLP)، با استفاده از یک راهحل ساده که برای درک کلمات و دستور زبان به کار رفته است، با یک مشکل پیچیده زیستشناسی مقابله کرد.
mRNA یا RNA پیامرسان به عنوان یک فناوری انقلابی برای ساخت واکسن و درمانهای بالقوه علیه سرطان و سایر بیماریها ظهور کرده است. mRNA به عنوان یک پیام رسان حیاتی که دستورالعمل های ژنتیکی را از DNA به ماشین های پروتئین سازی سلول حمل می کند، ایجاد پروتئین های خاص برای عملکردهای مختلف در بدن انسان را قادر می سازد. با مزایای متعدد در ایمنی، کارایی و تولید، mRNA به سرعت در فرآیند توسعه واکسن کووید-19 به کار گرفته شده است.
با این حال، بی ثباتی طبیعی mRNA منجر به بیان ناکافی پروتئین می شود که ظرفیت واکسن را برای تحریک پاسخ های ایمنی قوی تضعیف می کند. این بیثباتی همچنین چالشهایی را برای ذخیرهسازی و انتقال واکسنهای mRNA بهویژه در کشورهای در حال توسعه که منابع اغلب محدود هستند، ایجاد میکند.
تحقیقات قبلی نشان داده است که بهینه سازی پایداری ساختار ثانویه mRNA، هنگامی که با کدون های بهینه ترکیب شود، منجر به بهبود بیان پروتئین می شود. چالش در فضای طراحی mRNA است که به دلیل کدون های مترادف بسیار وسیع است. به عنوان مثال، تقریباً 10^632 mRNA وجود دارد که می توانند به همان پروتئین SARS-CoV-2 Spike ترجمه شوند، که چالش های غیرقابل حلی را برای روش های قبلی ارائه می دهد.
اگرچه NLP و زیست شناسی ممکن است در نگاه اول نامرتبط به نظر برسند، اما این دو زمینه ارتباط ریاضی قوی دارند. در زبان انسان، یک جمله از یک توالی کلمه و یک درخت نحوی زیرین با عبارات اسمی و فعل تشکیل شده است که با هم معنا را میرسانند. به همین ترتیب، یک رشته RNA دارای یک توالی نوکلئوتیدی و یک ساختار ثانویه مرتبط بر اساس الگوی تاخوردگی آن است.
محققان از تکنیکی در پردازش زبان به نام تجزیه شبکه استفاده کردند که پیوندهای بالقوه کلمه را در نمودار شبکه ای نشان می دهد و معقول ترین گزینه را بر اساس دستور زبان انتخاب می کند. به طور مشابه، آنها با استفاده از خودکار حالت محدود قطعی (DFA) نموداری را ایجاد کردند که به طور فشرده همه کاندیدهای mRNA را نشان می دهد. با استفاده از تجزیه شبکه به mRNA، یافتن mRNA بهینه شبیه به شناسایی محتملترین جمله در میان طیف وسیعی از گزینههای مشابه است.
با استفاده از این رویکرد، LinearDesign تنها 11 دقیقه طول می کشد تا پایدارترین توالی mRNA را که پروتئین Spike را کد می کند، تولید کند.
در یک مقایسه سر به سر، توالی های طراحی شده توسط LinearDesign نتایج قابل توجهی بهبود یافته را در مقایسه با توالی واکسن های موجود نشان دادند. برای توالیهای واکسن mRNA COVID-19، الگوریتم تا 5 برابر افزایش پایداری (نیمه عمر mRNA)، افزایش 3 برابری در سطح بیان پروتئین (در عرض 48 ساعت) و افزایش باورنکردنی 128 برابری را به دست آورد. پاسخ آنتی بادی برای توالیهای واکسن mRNA VZV، این مطالعه تا 6 برابر افزایش پایداری (نیمه عمر مولکول mRNA)، افزایش 5.3 برابری در سطح بیان پروتئین (48 ساعت) و افزایش 8 برابری در پاسخ آنتیبادی را گزارش کرد.
واکسنهایی که از طریق روش ما طراحی شدهاند ممکن است با همان دوز محافظت بهتری ارائه دهند و به طور بالقوه محافظت برابر با دوز کمتری داشته باشند که منجر به عوارض جانبی کمتری میشود. دکتر ژانگ افزود. در سال 2021، بایدو و سانوفی شراکتی را برای ادغام الگوریتم LinearDesign در خط لوله طراحی محصول Sanofi برای توسعه واکسن mRNA و دارو آغاز کردند.
بایدو یک پلت فرم محاسبات زیستی مبتنی بر PaddlePaddle به نام PaddleHelix ایجاد کرده است که مدل های بزرگ ERNIE-Bio-Computing را در بر می گیرد. این پلتفرم کاربرد هوش مصنوعی را در زمینههای مختلف مانند مولکولهای کوچک، پروتئینها/پپتیدها و RNA بررسی میکند و یک الگوی تحقیقاتی جدید برای هوش مصنوعی در علوم زیستی ارائه میدهد. مدل بزرگ بایدو ERNIE یک سیستم فناوری جامع مدل بزرگ را توسعه داده است که NLP، بینایی، متقابل مدال و محاسبات زیستی را پوشش میدهد. ربات ERNIE که اخیراً رونمایی شده است، یک مدل زبان بزرگ با دانش (LLM) که قادر به درک و تولید زبان انسانی است، بخشی از خانواده مدل بزرگ ERNIE است.
بایدو با حرکت رو به جلو، به بررسی کاربردهای هوش مصنوعی در علوم زیستی، گسترش دامنه و عمق فناوری فراگیر و حمایت از سلامت و رفاه کل بشریت ادامه خواهد داد.