آموزش مدل هوش مصنوعی سریعتر و ارزان تر باالگوریتم JEST DeepMind

  • 1403/4/23
  • چت بات ها
  • 1920
  • 0
  • 0
image

هوش مصنوعی در حال حاضر پیشرفت‌های بسیار چشمگیری را به دست آورده است و در زمینه‌های مختلف مانند پزشکی، آموزش، امور مالی، هنر و ورزش تغییرات زیادی را به وجود آورده است. این پیشرفت‌ها اصلًا ناشی از توانایی بهبود یافته هوش مصنوعی در یادگیری از مجموعه‌های بزرگتر اطلاعات و ساخت مدل‌های پیچیده‌تر با میلیاردها پارامتر است. این پیشرفت‌ها باعث ایجاد کشف‌های علمی قابل توجه، فرصت‌های تجاری جدید و رشد صنعتی شده است، اما باید توجه داشت که هزینه‌های بالایی نیز دارد، به‌ویژه با توجه به تأثیرات مالی و زیست‌محیطی آموزش این مدل‌های بزرگ.

تا به حال، تلاش‌های انجام شده برای پایدار کردن هوش مصنوعی مولد بیشتر بر توسعه سخت‌افزارهای بهبود یافته برای آموزش هوش مصنوعی و توسعه مدل‌های کوچکتر با پارامترهای کمتر تمرکز داشته است. اما شرکت Google DeepMind با رویکردی نوآورانه بهبود کارایی الگوریتم آموزش هوش مصنوعی مولد را مورد بررسی قرار داده است. آنها الگوریتم جدیدی به نام JEST (انتخاب مثال مشترک) را معرفی کرده‌اند که سرعت آن 13 برابر بیشتر از روش‌های فعلی است و ده برابر بیشتر از آنها انرژی مصرف می‌کند.

در این مقاله، چالش‌های آموزش هوش مصنوعی و نحوه برخورد الگوریتم JEST با این چالش‌ها مورد بررسی قرار می‌گیرد. علاوه بر این، ما مفاهیم گسترده‌تر و جهت‌گیری‌های تحقیقاتی آینده را برای الگوریتم JEST در نظر می‌گیریم و تأثیر بالقوه آن را فراتر از افزایش سرعت، بهبود کارایی و سازگاری با محیط زیست در آموزش هوش مصنوعی مورد بررسی قرار می‌دهیم.

چالش های آموزش هوش مصنوعی با هزینه های بالا

آموزش مدل‌های هوش مصنوعی مولد به دلیل هزینه‌های بالا و تأثیرات زیست محیطی قابل توجه، چالش‌های مهمی را دارد.

اولاً، هزینه‌های مالی این آموزش‌ها بسیار بالاست. برای مثال، آموزش یک مدل بزرگ مانند GPT-3 از OpenAI که دارای 175 میلیارد پارامتر است، تقریباً 4.6 میلیون دلار هزینه دارد. برآورد می‌شود که آموزش ChatGPT-4 برای OpenAI حدود 100 میلیون دلار هزینه داشته باشد. این هزینه‌ها به‌خصوص به دلیل نیاز به منابع محاسباتی بزرگ، پردازش گسترده داده‌ها و طولانی بودن زمان آموزش، بسیار بالاست.

ثانیاً، مصرف انرژی در فرآیند آموزش هوش مصنوعی مولد بسیار زیاد است. آموزش این مدل‌ها نیازمند استفاده از هزاران پردازنده گرافیکی و مصرف چندین گیگاوات ساعت انرژی است. مراکز داده که برای آموزش هوش مصنوعی زیرساخت محاسباتی را فراهم می‌کنند، سالانه حدود 200 تراوات ساعت برق مصرف می‌کنند که تقریباً 1 درصد از تقاضای جهانی برق را تشکیل می‌دهد. گزارش McKinsey پیش‌بینی می‌کند که مصرف برق مراکز داده در ایالات متحده از 17 گیگاوات در سال 2017 به 35 گیگاوات تا سال 2030 افزایش خواهد یافت که نیاز به خروجی معادل 9 سد هوور برای تأمین این تقاضای اضافی دارد.

سوماً، مصرف بالای انرژی در آموزش مدل‌های هوش مصنوعی مولد موجب انتشار گازهای گلخانه‌ای و تشدید تغییرات آب و هوا می‌شود. یک مطالعه انجام شده توسط دانشگاه ماساچوست آمهرست نشان داد که آموزش یک مدل هوش مصنوعی بزرگ ممکن است معادل انتشار دی‌اکسید کربن پنج خودرو در طول عمر آن باشد. به‌طور خاص، آموزش یک مدل هوش مصنوعی می‌تواند بیش از 626,000 پوند CO2 منتشر کند که معادل ردپای کربن 315 پرواز فرا آبه زبان ساده و قابل فهم:

آموزش مدل‌های هوش مصنوعی مولد به دلیل هزینه‌های بالا و تأثیرات زیست محیطی قابل توجه، چالش‌های مهمی را دارد.

اولاً، هزینه‌های مالی آموزش این مدل‌ها بسیار زیاد است. برای مثال، آموزش مدل GPT-3 از شرکت OpenAI با 175 میلیارد پارامتر، تقریباً 4.6 میلیون دلار هزینه دارد. برآورد می‌شود که آموزش مدل ChatGPT-4 حدود 100 میلیون دلار هزینه داشته باشد. عمده این هزینه‌ها به دلیل نیاز به منابع محاسباتی بزرگ، پردازش گسترده داده‌ها و طولانی بودن زمان آموزش است.

ثانیاً، مصرف انرژی در آموزش مدل‌های هوش مصنوعی بسیار زیاد است. آموزش این مدل‌ها نیازمند استفاده از هزاران پردازنده گرافیکی و مصرف چندین گیگاوات ساعت انرژی است. مراکز داده‌ای که برای آموزش هوش مصنوعی زیرساخت محاسباتی را فراهم می‌کنند، سالانه حدود 200 تراوات ساعت برق مصرف می‌کنند که تقریباً 1 درصد از تقاضای جهانی برق را تشکیل می‌دهد. گزارش‌ها نشان می‌دهند که مصرف برق مراکز داده در ایالات متحده از 17 گیگاوات در سال 2017 به 35 گیگاوات تا سال 2030 افزایش خواهد یافت که نیاز به تأمین انرژی معادل 9 سد برق بزرگ برای پاسخگویی به این تقاضای اضافی دارد.

سوماً، مصرف بالای انرژی در آموزش مدل‌های هوش مصنوعی مولد باعث انتشار گازهای گلخانه‌ای و تشدید تغییرات آب و هوا می‌شود. مطالعات نشان می‌دهند که آموزش یک مدل هوش مصنوعی بزرگ می‌تواند معادل انتشار دی‌اکسید کربن پنج خودرو در طول عمر آن باشد. به‌طور خاص، آموزش یک مدل هوش مصنوعی می‌تواند بیش از 626,000 پوند CO2 منتشر کند که معادل ردپای کربن 315 پرواز فرا آمریکایی است.

این چالش‌ها در درجه اول از دو منبع اصلی ناشی می‌شوند: تکیه بر سخت‌افزار محاسباتی پر انرژی و ناکارآمدی الگوریتم‌های آموزشی فعلی. در حالی که جامعه هوش مصنوعی گام‌هایی در توسعه سخت‌افزارهای کم مصرف برداشته است، باید بیشتر به تولید الگوریتم‌های هوشمندتر تمرکز کنیم که می‌توانند استفاده از داده‌ها را بهینه کنند و زمان آموزش را کاهش دهند. الگوریتم JEST که به تازگی معرفی شده است، تحقیقاتی پیشگام در جهت هوشمندتر شدن الگوریتم‌های آموزشی است. با انتخاب هوشمندانه داده‌های مهم، JEST کارایی آموزش هوش مصنوعی را به طور قابل توجهی افزایش می‌دهد و راه‌هایی را برای آموزش پایدارتر و مقرون به صرفه‌تر مدل‌های هوش مصنوعی مولد هموار می‌سازد.

آشنایی با الگوریتم JEST

JEST، یک الگوریتم یادگیری است که برای بهبود آموزش مدل‌های هوش مصنوعی مولد چندوجهی طراحی شده است. برای درک عملکرد JEST، می‌توانید آموزش هوش مصنوعی را مثل حل یک پازل پیچیده تصور کنید، جایی که هر قطعه (نقطه داده) به تشکیل تصویر کامل (مدل هوش مصنوعی) کمک می‌کند. JEST مشابه یک حل‌کننده حرفه‌ای پازل عمل می‌کند و فرآیند را بهبود می‌بخشد. همانند یک حل‌کننده پازل که بخش‌های مهم و متمایز را انتخاب می‌کند، JEST دسته‌های ارزشمند داده را از مجموعه داده شناسایی و انتخاب می‌کند و اطمینان حاصل می‌کند که هر دسته نقش مهمی در توسعه هوش مصنوعی دارد.

JEST از یک مدل هوش مصنوعی کوچکتر برای ارزیابی کیفیت دسته‌های داده استفاده می‌کند. سپس این دسته‌ها بر اساس اثربخشی آنها در آموزش مدل رتبه‌بندی می‌شوند. با استفاده از این دسته‌های دقیقاً انتخاب شده، JEST آن‌ها را به صورت استراتژیک در آموزش مدل می‌بندد. همانند یک حل‌کننده پازل که قطعات پازل را برای حداکثر کردن کارایی و انسجام مرتب می‌کند، JEST با اولویت‌بندی و انتخاب دسته‌های یادگیرنده‌تر، روند آموزش را به طور قابل توجهی سریعتر می‌کند.

بخش کلیدی رویکرد JEST، یادگیری متضاد چندوجهی است. این تکنیک بر تطبیق انواع مختلف داده مانند متن و تصویر تمرکز دارد. JEST از یک روش مبتنی بر یادگیری متضاد چندوجهی برای ارزیابی تأثیربخشی یک نمونه داده چندوجهی در آموزش مدل استفاده می‌کند. به علاوه از امکان یادگیری جمعی نمونه‌های داده برای انتخاب یک دسته کوچک از داده‌ها از یک "سوپر دسته" بزرگتر نیز استفاده می‌شود. این فرآیند به JEST کمک می‌کند تا دسته‌هایی که چالش‌هاو فرصت‌های یادگیری غنی را ارائه می‌دهند، را انتخاب و اولویت‌بندی کند.

آموزش هوش مصنوعی سبزتر ، سریعتر و ارزانتر

در حال بررسی مفاهیم آینده JEST (انتخاب نمونه مشترک)، می‌توانیم ببینیم که مشارکت در آن بیش از ارتقای سرعت آموزش هوش مصنوعی، کاهش هزینه‌ها و بهبود پایداری زیست محیطی است. در ادامه به بررسی این می‌پردازیم که چگونه JEST می‌تواند به بهبود و تحول حوزه هوش مصنوعی کمک کند:

1. بهبود عملکرد و دقت مدل پیشرفته: رویکرد نوآورانه JEST با انتخاب و اولویت‌بندی داده‌ها، منجر به آموزش سریع‌تر و بهبود عملکرد مدل می‌شود. با تمرکز بر دسته‌های آموزنده‌تر داده، JEST تضمین می‌کند که مدل‌های هوش مصنوعی بر روی ورودی‌های با کیفیت بالا آموزش دیده‌اند و دقت و استحکام آن‌ها را افزایش می‌دهد. این مزیت در کاربردهایی که دقت و قابلیت اعتماد بسیار مهم است، مانند تشخیص پزشکی، پیش‌بینی مالی و سیستم‌های مستقل، بسیار حائز اهمیت است.

2. شناسایی و کاهش تعصب در داده‌ها: هوش مصنوعی می‌تواند به داده‌های تبعیض‌آمیز حساس باشد که در آن گروه‌ها یا دیدگاه‌های خاصی کمتر نمایش داده شده یا به طور نادرست نمایش داده شوند. رویکرد انتخاب داده JEST شامل ارزیابی کیفیت و آموزنده بودن دسته‌های داده است. با اولویت‌بندی نمونه‌های داده‌های متنوع و معرف، JEST می‌تواند به سیستم‌های هوش مصنوعی کمک کند تا از مجموعه داده‌های متعادل‌تری آموزش ببینند و در نتیجه سوگیری‌ها در داده‌های آموزشی کاهش یابد. به عنوان مثال، در برنامه‌های هوش مصنوعی مراقبت‌های بهداشتی، JEST می‌تواند دسته‌های داده‌ای را انتخاب کند که فاکتورهای جمعیت‌شناختی مختلف را در بر می‌گیرد و اطمینان حاصل می‌کند که مدل‌های تشخیصی پزشکی بر روی جمعیت‌های مختلف بیماران آموزش داده شده‌اند. این انتخاب خطر تعصب‌هایجنسیتی، نژادی یا اجتماعی-اقتصادی را کاهش می‌دهد و تأثیر نامناسبی بر گروه‌های خاص ندارد.

JEST (انتخاب نمونه مشترک) یک روش نوآور است که به تسهیل نوآوری و تحقیق در حوزه هوش مصنوعی کمک می‌کند. این روش با کاهش نیاز به منابع محاسباتی و زمان طولانی برای آموزش مدل‌های هوش مصنوعی، محدودیت‌ها را برای محققان و نوآوران کاهش می‌دهد. با استفاده از JEST، امکان دسترسی به یک اکوسیستم پویا و پر از فعالیت در حوزه هوش مصنوعی فراهم می‌شود، به طوری که تیم‌ها و سازمان‌های کوچکتر نیز به راحتی می‌توانند راه حل‌های پیشرفته هوش مصنوعی را آزمایش و به کار بگیرند. همچنین، بهبود بهره‌وری که JEST ارائه می‌دهد، منابعی را آزاد می‌کند که می‌توانند به سمت کاوش در حوزه‌های جدید هوش مصنوعی، مانند معماری‌های جدید، الگوریتم‌های پیشرفته و چارچوب‌های اخلاقی هوش مصنوعی هدایت شوند.

علاوه بر این، JEST به توسعه فراگیر هوش مصنوعی کمک می‌کند. توسعه هوش مصنوعی باید شامل دیدگاه‌ها و ورودی‌های متنوعی باشد تا به طور مؤثر تعصبات و نگرانی‌های اخلاقی را کاهش دهد. JEST قابلیت انتخاب داده‌ها بر اساس ارزش اطلاعاتی و نمایندگی آن‌ها را داراست و این باعث تشویق رویکردهای فراگیر در تنظیم مجموعه داده می‌شود. توسعه‌دهندگان هوش مصنوعی می‌توانند با مشارکت تیم‌های چند رشته‌ای، از جمله کارشناسان در اخلاق، علوم اجتماعی و زمینه‌های خاص دامنه، معیارهای انتخاب داده‌ها را تعریف کنند و به این ترتیب تضمین کنند که JEST به طور مؤثر به سوگیری‌ها و ملاحظات اخلاقی پاسخ می‌دهد. این رویکرد مشترک توسعه فراگیرتر و مسئولانه‌تر در فناوری‌های هوش مصنوعی را تقویت می‌کند.

نتیجه گیری

الگوریتم JEST که توسط DeepMind معرفی شده است، به طور قابل توجهی به پیشرفت در آموزش هوش مصنوعی مولد اشاره می‌کند. این الگوریتم با افزایش سرعت فرآیندهای آموزشی و کاهش مصرف انرژی، صرفه‌جویی قابل توجهی در هزینه‌ها به ارمغان می‌آورد و نگرانی‌های زیست محیطی مرتبط با توسعه هوش مصنوعی را حل می‌کند. علاوه بر این مزایا، JEST قابلیت بهبود دقت مدل، کاهش تعصبات موجود در داده‌ها، تقویت نوآوری و تشویق توسعه فراگیر هوش مصنوعی را دارا است. با استمرار در اصلاح و استفاده از JEST، آینده هوش مصنوعی بازتعریف می‌شود و به سمت راه‌حل‌های هوش مصنوعی کارآمدتر، پایدارتر و از نظر اخلاقی مسئولانه‌تر پیش می‌رود.

 

تگ ها