محققان موسسه Koch برای تحقیقات سرطان یکپارچه در MIT و بیمارستان عمومی ماساچوست (MGH) از یک رویکرد یادگیری عمیق به عنوان ابزاری جدید برای تحلیل برنامههای بیان ژن در سلولهای سرطانی استفاده کردهاند. این روش جدید میتواند به برنامههای بیان ژن مرتبط با رشد و تمایز سلولی اولیه توجه کرده و در تشخیص سرطانهای اولیه ناشناخته کمک کند.
سالیل گارگ و جنیفر سی جانسون از موسسه Koch و دانشگاه ماساچوست، از این روش به عنوان یک ابزار جدید برای انتخاب درمانهای مؤثرتر و راهنمایی بهتر برای بیماران سرطانی یاد کردهاند. این ابزار هوش مصنوعی با حساسیت و دقت بالا، انواع سرطان را تشخیص میدهد.
این پژوهش که در مجله "کشف سرطان" منتشر شده است، نشان میدهد که ابزارهای یادگیری ماشینی میتوانند به افراد حوزه پزشکی کمک کنند تا با دقت بیشتری به نوع و شیوههای درمان سرطان نگاه کنند و تصمیمهای بهتری در زمینه درمان بیماران اتخاذ کنند.
یادگیری ماشین در توسعه علم پزشکی
تفاوت در بیان ژن در میان انواع مختلف تومورهای اولیه ناشناخته یک چالش مهم برای حل مسائل یادگیری ماشین است. سلولهای سرطانی به دلیل تغییرات گسترده در بیان ژنها، بهطور کامل متفاوت از سلولهای طبیعی عمل میکنند. این تفاوتها میتوانند تشخیص و درمان سرطان را تشویق کنند. با پیشرفتهای در زمینه پروفایلسازی تک سلولی و تلاشها برای فهرستبندی الگوهای بیان سلولی، حجم زیادی از داده وجود دارد که ممکن است حاوی اطلاعات مفیدی در مورد طبقهبندی سرطانهای مختلف باشد.
ساختن مدل یادگیری ماشینی که بتواند از تفاوتهای بین سلولهای سالم و سلولهای سرطانی در انواع مختلف استفاده کند، یک چالش است. مدل نباید بسیار پیچیده باشد که اطلاعات زیادی را فراگیرد و به نتیجهای ناپایدار منجر شود. همچنین، با سادهسازی مدل و محدود کردن تعداد ویژگیها، ممکن است مدل برخی اطلاعات مهم را از دست بدهد. تعادل میان سادگی و دقت مدل از اهمیت ویژهای برخوردار است.
برای ایجاد تعادل میان کاهش تعداد ویژگیها و استخراج اطلاعات مرتبط، تیم محققان مدل را بر روی علائم مسیرهای رشد در سلولهای سرطانی متمرکز کرد. این مسیرهای رشد نقش مهمی در تشکیل تومور و تغییرات در سلولهای سرطانی ایفا میکنند. همچنین، از دادههای دو اطلس مختلف، یعنی اطلس ژنوم سرطان (TCGA) حاوی دادههای بیان ژن برای 33 نوع تومور، و اطلس سلولی ارگانوژنز موش (MOCA) که شامل 56 مسیر مجزا از تومور است، برای مقایسه و شناخت ارتباط بین تومور و سلولهای جنینی استفاده شد.
تیم محققان در این مدل به دنبال تحلیل مشترک اطلاعات بر روی این دو اطلس بودند تا ارتباطات مهم بین مسیرهای رشد جنینی و ویژگیهای بیان ژنی در سلولهای سرطانی را شناسایی کنند. این اطلاعات میتوانند بهترین راهنمایی را برای تشخیص و درمان سرطانهای مختلف فراهم کنند.
در این راستا، مدل یادگیری ماشینی محققان را در انتخاب ویژگیهای مهم و مرتبط برای تمایز بین انواع مختلف سرطان و سلولهای جنینی یاری کرده است. این تحلیل میتواند به ارتقاء تشخیص و درمان سرطانها کمک کند و به محققان در درک بهتر مکانیسمهای مولکولی تومورها کمک کند.
مویسو توضیح میدهد: «ابزارهای تفکیک سلولی به طرز چشمگیری نحوه مطالعه بیولوژی سرطان را تغییر دادهاند، اما اینکه چگونه این انقلاب را برای بیماران تأثیرگذار کنیم، سؤال دیگری است. با ظهور اطلسهای سلولی رشدی، بهویژه آنهایی که بر مراحل اولیه اندامزایی مانند MOCA تمرکز دارند، میتوانیم ابزارهای خود را فراتر از اطلاعات بافتشناسی و ژنومی گسترش دهیم و درها را به روی روشهای جدید پروفایل و شناسایی تومورها و توسعه درمانهای جدید باز کنیم.
نقشه حاصل از همبستگی بین الگوهای بیان ژن رشدی در سلولهای تومور و جنینی سپس به یک مدل یادگیری ماشین تبدیل شد. محققان بیان ژن نمونههای تومور از TCGA را به اجزای جداگانهای که مربوط به یک نقطه زمانی خاص در مسیر رشد است، تجزیه کردند و به هر یک از این اجزا یک مقدار ریاضی اختصاص دادند. محققان سپس یک مدل یادگیری ماشینی به نام پرسپترون چند لایه توسعه ای (D-MLP) ساختند که یک تومور را برای اجزای رشدی آن نمره می دهد و سپس منشا آن را پیش بینی می کند.
طبقه بندی تومورهای سرطانی
با پس از آموزش، مدل D-MLP بر روی 52 نمونه جدید از سرطانهای اولیه ناشناخته اعمال شد که با استفاده از ابزارهای موجود قابل تشخیص نبودند. این موارد چالشبرانگیزترین حالاتی بودند که در MGH طی یک دوره چهار ساله در سال 2017 مشاهده شدند. به طرز هیجانانگیزی، این مدل تومورها را در چهار دسته طبقهبندی کرد و پیشبینیها و اطلاعات دیگری ارائه داد که میتواند تشخیص و درمان این بیماران را راهنمایی کند.
به عنوان مثال، یک نمونه از یک بیمار با سابقه سرطان سینه بود که علائم سرطان تهاجمی را در فضاهای مایع اطراف شکم نشان داد. انکولوژیستها در ابتدا نتوانستند توده توموری را پیدا کنند و نمیتوانستند سلولهای سرطانی را با استفاده از ابزارهایی که در آن زمان داشتند طبقهبندی کنند. با این حال، D-MLP به شدت سرطان تخمدان را پیشبینی کرد. شش ماه پس از اولین مراجعه بیمار، سرانجام تودهای در تخمدان پیدا شد که ثابت شد منشاء تومور است.
علاوه بر این، مقایسههای سیستماتیک این مطالعه بین سلولهای تومور و جنینی، بینشهای امیدوارکننده و گاهی شگفتانگیز را در مورد پروفایلهای بیان ژن انواع تومور خاص نشان داد. به عنوان مثال، در مراحل اولیه رشد جنینی، یک لوله روده ابتدایی تشکیل میشود که ریهها و سایر اندامهای مجاور آن از قسمت جلویی روده بیرون میآیند، و قسمت اعظم دستگاه گوارش از روده میانی و عقبی تشکیل میشود. این مطالعه نشان داد که سلولهای تومور مشتق شده از ریه، نه تنها به روده جلویی که انتظار میرود، شباهتهای قوی نشان میدهند، بلکه به مسیرهای رشدی که از روده میانی و عقبی مشتق شدهاند، شباهتهایی دارند. یافتههایی از این دست نشان میدهد که روزی میتوان از تفاوتها در برنامههای رشد به همان شیوهای که جهشهای ژنتیکی برای طراحی درمانهای شخصی یا هدفمند سرطان استفاده میشود، استفاده کرد.
در حالی که این مطالعه یک رویکرد قدرتمند برای طبقهبندی تومورها ارائه میدهد، دارای محدودیتهایی است. در کار آینده، محققان قصد دارند قدرت پیشبینی مدل خود را با ترکیب انواع دیگر دادهها، به ویژه اطلاعات بهدستآمده از رادیولوژی، میکروسکوپ و انواع دیگر تصویربرداری تومور، افزایش دهند.
گارگ میگوید: «بیان ژن رشدی تنها یک برش کوچک از همه عواملی را نشان میدهد که میتوان برای تشخیص و درمان سرطان استفاده کرد. "ادغام اطلاعات رادیولوژی، آسیبشناسی و بیان ژن با هم گام بعدی واقعی در پزشکی شخصی برای بیماران سرطانی است."