شرکتهای داروسازی از هوش مصنوعی برای سادهسازی فرایند کشف داروهای جدید استفاده میکنند. سیستمهای یادگیری ماشینی میتوانند در عرض چند دقیقه مولکولهای جدیدی را پیشنهاد کنند که میتوانند برای درمان بیماریهای خاص مفید باشند. این کاری است که ممکن است برای انسان ماهها طول بکشد.
اما یک مانع بزرگ وجود دارد: اغلب مولکولهای جدیدی که این سیستمها پیشنهاد میکنند، تولید آنها در آزمایشگاه دشوار یا غیرممکن است. اگر شیمیدان نتواند مولکول را بسازد، خواص درمانی آن را نمیتوان آزمایش کرد.
محققان MIT راهحل جدیدی را ارائه دادهاند. آنها مدل یادگیری ماشینی را به گونهای محدود کردهاند که فقط مولکولهای قابل ساخت را پیشنهاد میکند. این روش تضمین میکند که مواد اولیه مورد نیاز برای ساخت مولکولها موجود هستند و واکنشهای شیمیایی بین این مواد مطابق با قوانین شیمی است.
محققان در MIT یک مدل یادگیری ماشینی جدید طراحی کرده اند که فقط ساختارهای مولکولی قابل سنتز را پیشنهاد می دهد. این بدان معنی است که مولکول هایی که این مدل پیشنهاد می کند، از مواد موجود در بازار ساخته می شوند و واکنش های شیمیایی آنها نیز با قوانین شیمی همخوانی دارد.
در مقایسه با سایر روش ها، مدل پیشنهادی محققان MIT، مولکول هایی را ارائه می دهد که امتیاز بالایی در ارزیابی های متداول دارند و گاهی بهتر از سایرین هستند. اما مهمتر از آن، این مولکول ها قابل سنتز هستند. سیستم آنها همچنین می تواند در کمتر از یک ثانیه، مسیر سنتز برای یک مولکول را پیشنهاد کند، در حالی که سایر روش ها ممکن است چند دقیقه زمان ببرد. این صرفه جویی در زمان در فضای جستجوی میلیاردها مولکول بالقوه بسیار مفید است.
به گفته کانر کولی، محقق ارشد این مطالعه، این فرآیند نحوه درخواست از این مدل ها برای تولید ساختارهای مولکولی جدید را بازتعریف می کند. به جای اینکه به فکر ساخت مولکول ها اتم به اتم یا پیوند به پیوند باشند، آنها در حال ساختن مولکول های جدید با استفاده از بلوک های سازنده و واکنش های شیمیایی هستند.
این تحقیق توسط وهنا گائو، دانشجوی کارشناسی ارشد، و روسیو مرکادو، فوق دکترا، به همراه کانر کولی انجام شده و این هفته در کنفرانس بین المللی بازنمایی های یادگیری ارائه خواهد شد.
ایجاد ساختار مولکولی
برای ایجاد یک ساختار مولکولی جدید، محققان از شبیهسازی فرایند سنتز مولکول استفاده میکنند. این کار به آنها اطمینان میدهد که مولکول مورد نظر را میتوان تولید کرد.
در این مدل، مجموعهای از بلوکهای ساختمانی پایدار (مواد شیمیایی موجود در بازار) و لیستی از واکنشهای شیمیایی معتبر برای کار با آنها ارائه میشود. این الگوهای واکنشی توسط متخصصان طراحی شدهاند. با محدود کردن ورودیها به مواد و واکنشهای خاص، محققان میتوانند فضای جستجوی مولکول جدید را محدود کنند.
مدل از این ورودیها برای ایجاد یک درخت استفاده میکند. در هر مرحله، بلوکهای ساختمانی را انتخاب و از طریق واکنشهای شیمیایی به هم متصل میکند، تا در نهایت مولکول مورد نظر را بسازد. در این فرایند، مولکول به تدریج پیچیدهتر میشود.
در نتیجه، مدل ساختار مولکولی نهایی و همچنین درختی از مواد و واکنشهای لازم برای سنتز آن را تولید میکند.
به جای طراحی مستقیم مولکول نهایی، این رویکرد به محققان امکان میدهد تا توالی عملیات را برای به دست آوردن آن مولکول طراحی کنند. این به آنها کمک میکند تا کیفیت ساختار مولکولی را تضمین کنند.
برای آموزش مدل، محققان یک ساختار مولکولی کامل و مجموعهای از بلوکهای سازنده و واکنشهای شیمیایی را به آن ارائه میدهند. پس از دیدن صدها هزار نمونه، مدل یاد میگیرد که به تنهایی این مسیرهای مصنوعی را ارائه دهد.
بهینه سازی مولکول
محققان توانستند با استفاده از یک مدل آموزش دیده، ویژگیهای خاصی را که میخواهند در یک مولکول نهایی به دست آورند، تعریف کنند و این مدل یک ساختار مولکولی قابل ساخت را پیشنهاد دهد.
آنچه شگفتانگیز بود این است که با استفاده از تعداد کمی از اجزای اصلی مولکول، میتوان بخش بزرگی از مولکولهای موجود را بازتولید کرد. به عبارت دیگر، برای ایجاد طیف وسیعی از مولکولهای ممکن، به تعداد زیادی از اجزای سازنده نیاز نیست.
محققان این مدل را آزمایش کردند و دریافتند که میتواند 51 درصد از مولکولهای موجود را بازتولید کند و هر بارسازی در کمتر از یک ثانیه انجام میشود. این تکنیک سریعتر از روشهای دیگر است زیرا مدل در تمام گزینهها برای هر مرحله در درخت جستجو نمیکند، بلکه فقط مجموعهای از مواد شیمیایی و واکنشهای مشخص را به کار میگیرد.
هنگامی که محققان از این مدل برای پیشنهاد مولکولهایی با ویژگیهای خاص استفاده کردند، ساختارهای مولکولی با کیفیت بالاتری را پیشنهاد داد که پیوندهای قویتری داشتند. این بدان معناست که این مولکولها میتوانند بهتر به پروتئینها بچسبند و فعالیتهای خاصی مانند توقف تکثیر ویروس را انجام دهند.
به عنوان مثال، هنگامی که محققان به دنبال مولکولهایی هستند که بتوانند به SARS-Cov-2 متصل شوند، مدل آنها چندین ساختار مولکولی را پیشنهاد کرده است که احتمالاً میتوانند بهتر از داروهای موجود با پروتئینهای ویروسی ارتباط برقرار کنند. اما همانطور که نویسندگان اذعان میکنند، این پیشنهادها فقط پیشبینیهای محاسباتی هستند.
گائو میگوید: «بسیاری از بیماریها برای درمان وجود دارند. امیدواریم روش ما بتواند این روند را تسریع کند، به طوری که دیگر نیاز نباشد میلیاردها مولکول را برای یک بیماری غربال کنیم. در عوض، ما میتوانیم ویژگیهای مورد نظر را مشخص کنیم و این میتواند پروسه یافتن داروی مناسب را تسریع کند.»
این مدل همچنین میتواند به بهبود فرآیند کشف داروهای موجود کمک کند. مرکادو میگوید اگر شرکتی مولکول خاصی را شناسایی کرده باشد که ویژگیهای مطلوب دارد، اما نمیتواند تولید شود، میتواند از این مدل برای پیشنهاد مولکولهای قابل سنتز که شبیه به آن هستند، استفاده کند.
حال که آنها رویکرد خود را تأیید کردهاند، تیم قصد دارد به بهبود الگوهای واکنش شیمیایی ادامه دهد تا عملکرد مدل را بیشتر افزایش دهند. با الگوهای اضافی، آنها میتوانند آزمایشهای بیشتری را روی اهداف بیماریهای خاص انجام دهند و در نهایت، این مدل را در فرآیند کشف دارو به کار گیرند.
ماروین سگلر که سرپرست تیمی است که در مایکروسافت ریسرچ کمبریج (بریتانیا) بر روی یادگیری ماشینی برای کشف دارو کار میکند، میگوید: «ایدهآل این است که ما الگوریتمهایی داشته باشیم که به طور خودکار مولکولها را طراحی کنند و همزمان و به سرعت درخت سنتز را به ما بدهند. این رویکرد زیبایی است که توسط پروفسور کولی و تیمش به عنوان یک گام بزرگ به جلو برای حل این مشکل معرفی شده است. اگرچه اثبات مفهومهای قبلی برای طراحی مولکول از طریق تولید درخت سنتز وجود داشته، ولی این تیم واقعاً موفق به انجام این کار شده و برای اولین بار عملکردی عالی را در مقیاس معنیدار نشان دادهاند. بنابراین این میتواند تأثیر واقعی در کشف مولکولی به کمک رایانه داشته باشد.»
این کار همچنین بسیار هیجانانگیز است زیرا میتواند در نهایت الگوی جدیدی را برای برنامهریزی سنتز به کمک رایانه فعال کند و احتمالاً الهامبخش بزرگی برای تحقیقات آینده در این زمینه خواهد بود.
این تحقیق تا حدی توسط دفتر تحقیقات نیروی دریایی ایالات متحده و کنسرسیوم یادگیری ماشینی برای کشف و سنتز دارویی پشتیبانی شده است.