OpenAI، پیشگام در زمینه مدلهای GPT، به تازگی از سری جدیدی از مدلهای هوش مصنوعی به نام o1 رونمایی کرده است. این مدلها میتوانند قبل از ارائه پاسخ، بیشتر «فکر کنند» و برای انجام وظایف پیچیدهتر، بهویژه در زمینههای علوم، برنامهنویسی و ریاضیات طراحی شدهاند. اگرچه OpenAI بسیاری از ویژگیهای این مدل را هنوز فاش نکرده است، اما برخی اطلاعاتی که منتشر شده، نگاهی به قابلیتهای آن و استراتژیهای در حال تغییر OpenAI ارائه میدهد. در این مقاله، بررسی میکنیم که رونمایی از o1 چه معنایی برای جهتگیری OpenAI و توسعه هوش مصنوعی دارد.
o1: نسل جدید مدلهای استدلال OpenAI
مدل o1 نسل جدیدی از مدلهای هوش مصنوعی OpenAI است که برای حل مشکلات بهصورت متفکرانهتر طراحی شده است. این مدلها به گونهای آموزش دیدهاند که بتوانند تفکر خود را اصلاح کنند، استراتژیهای جدیدی را کشف کنند و از اشتباهات خود درس بگیرند.
OpenAI گزارش داده که o1 در زمینه استدلال به نتایج چشمگیری دست یافته و توانسته است 83 درصد از مسائل آزمون مقدماتی المپیاد ریاضی بینالمللی (IMO) را حل کند، در حالی که مدل قبلی یعنی GPT-4o تنها 13 درصد موفقیت داشته است. همچنین، این مدل در زمینه کدنویسی نیز عملکرد بهتری دارد و در مسابقات Codeforces به درصد 89 رسیده است. طبق گفته OpenAI، بهروزرسانیهای آینده این مدل با دانشجویان دکترا در زمینههایی مانند فیزیک، شیمی و زیستشناسی رقابت خواهد کرد.
استراتژی توسعه هوش مصنوعی OpenAI
OpenAI از ابتدا بر این باور بوده که برای دستیابی به قابلیتهای پیشرفته هوش مصنوعی، باید مدلهای بزرگتری را توسعه دهد. این شرکت با GPT-1 که 117 میلیون پارامتر داشت، مسیر را برای انتقال از مدلهای کوچک و تخصصی به سیستمهای بزرگ و چندمنظوره هموار کرد. هر نسخه بعدی، یعنی GPT-2، GPT-3 و آخرین مدل GPT-4 با 1.7 تریلیون پارامتر، نشان داد که افزایش اندازه مدل و دادهها میتواند عملکرد را بهطور قابل توجهی بهبود بخشد.
اما تحولات اخیر نشان میدهد که OpenAI در استراتژی خود برای توسعه هوش مصنوعی تغییرات قابل توجهی را آغاز کرده است. این شرکت در کنار ادامه بررسی مقیاسپذیری، به سمت ایجاد مدلهای کوچکتر و همهکارهتر نیز حرکت کرده است. به عنوان مثال، ChatGPT-4o mini نمونهای از این تغییر رویکرد است. معرفی مفهوم «تفکر طولانیتر» نیز نشاندهنده تغییر از وابستگی به الگوهای شناسایی در شبکههای عصبی به سمت پردازشهای شناختی پیچیدهتر است.
از واکنشهای سریع تا تفکر عمیق
OpenAI اعلام کرده که مدل o1 بهطور خاص طراحی شده تا قبل از ارائه پاسخ، زمان بیشتری را برای تفکر صرف کند. به نظر میرسد این ویژگی با نظریه فرآیند دوگانه در علوم شناختی هماهنگ است. این نظریه دو نوع تفکر را تمایز میدهد:
- سیستم 1: تفکر سریع و شهودی، که به تصمیمگیریهای خودکار و فوری مربوط میشود، مانند تشخیص چهره یا واکنش به یک رویداد ناگهانی.
- سیستم 2: تفکر آهسته و عمدی که برای حل مسائل پیچیده و تصمیمگیریهای متفکرانه به کار میرود.
تاریخچه نشان میدهد که شبکههای عصبی، که پایه و اساس اکثر مدلهای هوش مصنوعی هستند، بیشتر به تقلید از تفکر سیستم 1 پرداختهاند. این شبکهها سریع و مبتنی بر الگو هستند و در کارهایی که نیاز به پاسخهای فوری دارند، عملکرد خوبی دارند. اما زمانی که بحث به استدلال منطقی و تفکر عمیقتر میرسد، اغلب کم میآورند. این محدودیت به بحثهای زیادی در جامعه هوش مصنوعی دامن زده است: آیا ماشینها واقعاً میتوانند فرآیندهای آهستهتر و منطقیتر سیستم 2 را شبیهسازی کنند؟
برخی از دانشمندان هوش مصنوعی، مانند جفری هینتون، بر این باورند که با پیشرفتهای کافی، شبکههای عصبی میتوانند رفتارهای متفکرانهتری از خود نشان دهند. در عوض، گری مارکوس برای یک رویکرد ترکیبی استدلال میکند که شبکههای عصبی را با استدلال نمادین ترکیب میکند تا پاسخهای سریع و شهودی را با تفکر تحلیلی متعادل سازد. این رویکرد در مدلهایی مانند AlphaGeometry و AlphaGo آزمایش شده که از استدلال عصبی و نمادین برای حل مسائل پیچیده ریاضی و بازیهای استراتژیک استفاده میکنند.
مدل o1 OpenAI نشاندهنده این تمایل به توسعه مدلهایی است که به سمت تفکر عمیقتر و حل مسائل میروند و از هوش مصنوعی مبتنی بر الگو به سمت ماشینهایی با قابلیتهای شناختی مشابه انسان تغییر مسیر میدهند.
آیا OpenAI استراتژی عصبی-نمادین گوگل را دنبال میکند؟
برای سالها، گوگل به دنبال توسعه مدلهایی مانند AlphaGeometry و AlphaGo بوده است که در انجام کارهای پیچیده استدلالی برتری دارند. این مدلها با ترکیب تشخیص الگوهای بصری از شبکههای عصبی و منطق ساختاریافته از موتورهای استدلال نمادین، توانستهاند نتایج قابل توجهی به دست آورند. در این ترکیب، شبکههای بزرگ زبانی (LLM) به ایجاد بینشهای سریع و شهودی کمک میکنند، در حالی که موتورهای نمادین استدلالهای منطقی و دقیقتری ارائه میدهند.
انتقال گوگل به سمت سیستمهای عصبی-نمادین با دو چالش اصلی روبرو بود: اول، دسترسی محدود به مجموعه دادههای بزرگ برای آموزش شبکههای عصبی در استدلال پیشرفته و دوم، نیاز به ترکیب شهود با منطق دقیق برای حل مسائل بسیار پیچیده. در حالی که شبکههای عصبی در شناسایی الگوها و ارائه راهحلهای استثنایی موفق هستند، اما در توضیح جزئیات یا مدیریت عمق منطقی لازم برای مسائل پیچیده ریاضی معمولاً دچار مشکل میشوند. موتورهای استدلال نمادین این نقص را با ارائه راهحلهای منطقی و ساختارمند برطرف میکنند، هرچند که این کار ممکن است به هزینههایی در سرعت و انعطافپذیری منجر شود.
با ترکیب این دو رویکرد، گوگل توانسته است مدلهای خود را بهبود بخشد و به AlphaGeometry و AlphaGo این امکان را بدهد که در بالاترین سطح بدون نیاز به دخالت انسان رقابت کنند. به عنوان مثال، AlphaGeometry موفق به کسب مدال نقره در المپیاد بینالمللی ریاضیات (IMO) شد و AlphaGo قهرمانان جهانی در بازی Go را شکست داد. این موفقیتها نشان میدهد که OpenAI ممکن است به سمت اتخاذ استراتژی مشابهی در زمینه عصبی-نمادین پیش برود تا در توسعه هوش مصنوعی از گوگل جلوتر بیفتد.
o1 و مرز بعدی هوش مصنوعی
اگرچه جزئیات دقیق عملکرد مدل o1 OpenAI هنوز فاش نشده، اما یک نکته واضح است: این شرکت به شدت بر روی انطباق متنی تمرکز کرده است. این به معنای توسعه سیستمهای هوش مصنوعی است که میتوانند پاسخهای خود را بر اساس پیچیدگی و ویژگیهای هر مسئله تنظیم کنند. به جای اینکه تنها به عنوان حلکنندههای همهمنظوره عمل کنند، این مدلها میتوانند استراتژیهای تفکر خود را برای مدیریت بهتر پروژههای مختلف، از تحقیقات علمی تا کارهای روزمره، بهینهسازی کنند.
یکی از پیشرفتهای جالب میتواند ظهور هوش مصنوعی خودانعکاسی باشد. برخلاف مدلهای سنتی که فقط بر دادههای موجود تکیه میکنند، تأکید o1 بر استدلال متفکرانهتر نشان میدهد که هوش مصنوعی در آینده ممکن است از تجربیات خود بیاموزد. این موضوع میتواند به توسعه مدلهایی منجر شود که رویکردهای حل مسئله خود را به مرور زمان اصلاح کنند و آنها را سازگارتر و انعطافپذیرتر کنند.
پیشرفت OpenAI با o1 همچنین به تغییر در روشهای آموزشی اشاره دارد. عملکرد این مدل در کارهای پیچیدهای مانند آزمون واجد شرایط IMO نشان میدهد که ممکن است به سمت آموزشهای تخصصیتر و متمرکز بر مسائل خاص حرکت کنیم. این توانایی میتواند به ایجاد مجموعه دادههای مناسبتر و استراتژیهای آموزشی برای توسعه قابلیتهای شناختی عمیقتر در سیستمهای هوش مصنوعی منجر شود، بهطوریکه آنها در زمینههای عمومی و تخصصی عملکرد بهتری داشته باشند.
عملکرد برجسته این مدل در زمینههایی مانند ریاضیات و کدنویسی نیز فرصتهای هیجانانگیزی برای آموزش و تحقیق ایجاد میکند. ممکن است معلمان هوش مصنوعی بتوانند پاسخها را ارائه دهند و به راهنمایی دانشآموزان در فرآیند استدلال کمک کنند. هوش مصنوعی همچنین میتواند با کاوش در فرضیههای جدید، طراحی آزمایشها، یا حتی مشارکت در اکتشافات در زمینههایی مانند فیزیک و شیمی به دانشمندان در تحقیقات کمک کند.
جمع بندی
سری o1 OpenAI نسل جدیدی از مدلهای هوش مصنوعی را معرفی میکند که برای انجام وظایف پیچیده و چالشبرانگیز طراحی شدهاند. هرچند بسیاری از جزئیات این مدلها هنوز فاش نشده، اما آنها نشاندهنده تغییر OpenAI به سمت پردازش شناختی عمیقتر هستند که فراتر از مقیاسگذاری صرف شبکههای عصبی میرود. با ادامه اصلاح این مدلها، ممکن است وارد مرحله جدیدی در توسعه هوش مصنوعی شویم که در آن این سیستمها نهتنها وظایف را انجام میدهند، بلکه در حل مسائل و در فرآیندهای آموزشی و تحقیقی نیز مشارکت میکنند و به طور بالقوه تحولاتی در این حوزهها ایجاد میکنند.