نگاهی عمیق تر

۵ دلیل برای اینکه جی‌پی‌تی ۴ (GPT-4) می‌تواند از ChatGPT پیشی بگیرد

شرکت OpenAI به تازگی از نسخه جدید و پیشرفته مدل هوش مصنوعی خود به نام جی‌پی‌تی ۴ (GPT-4) رونمایی کرد که پیشرفته‌ترین سیستم OpenAI است و پاسخ‌های ایمن‌تر و مفیدتری تولید می‌کند.

جی‌پی‌تی ۴ (GPT-4) خلاقانه‌تر از قبل شده و با هدف ایجاد مشارکت بیشتر با کاربر ارتقا پیدا کرده است. در حال حاضر، دامنه فعالیت‌های آن همه چیز را، از یک داوطلب مجازی برای افراد کم‌بینا گرفته تا یک ربات یادگیری زبان در دولینگو (Duolingo) را دربرمی‌گیرد.

اما چه چیزی جی‌پی‌تی ۴ (GPT-4) را از نسخه‌های قبلی همچون ChatGPT و GPT-3.5 متمایز می‌کند؟ در ادامه پنج تفاوت اصلی بین این سیستم‌های محبوب را بررسی می‌کنیم.

 

۱. جی‌پی‌تی ۴ (GPT-4) می‌تواند تصاویر را ببیند و درک کند

چشمگیرترین تغییر در این سیستم یادگیری ماشین (machine learning) این است که چندوجهی است، به این معنی که می‌تواند بیش از یک وجه یا بعد از اطلاعات را درک کند. ChatGPT و GPT-3 محدود به متن بودند: آنها می‌توانستند بخوانند و بنویسند؛ هرچند همین موارد برای بسیاری از اپلیکیشن‌ها، بیش از اندازه نیاز کاربران محسوب می‌شود.

با این حال، این امکان وجود دارد که به جی‌پی‌تی ۴ (GPT-4) تصاویری را به عنوان ورودی داد که آنها را برای یافتن اطلاعات مرتبط پردازش می‌کند.

البته می‌توانید به سادگی از GPT-4 بخواهید آنچه را که در یک تصویر است، توصیف کند، اما نکته مهم درمورد GPT-4 این است که درک آن فراتر از توصیف تصویر است. 

در ویدیوی Be My Eyes، که برای توصیف بهتر خدمات GPT-4 ساخته شده است، به خوبی‌مشخص می‌شود که جی‌پی‌تی ۴ (GPT-4) چگونه می‌تواند در انتخاب لباس و استایل، شناسایی اشیاء، نحوه رسیدن به یک دستگاه خاص در باشگاه برای افراد کم‌بینا، ترجمه نوشته روی یک برچسب، و خواندن نقشه به افراد کمک کند.

 

امکان آپلود عکس به عنوان ورودی بصری

جی‌پی‌تی ۴ (GPT-4) می‌تواند تصاویر را به عنوان ورودی بپذیرد و شرح دهد، و سپس طبقه‌بندی و تجزیه و تحلیل کند.

برای مثال، اگر تصویری مانند نمونه زیر را به عنوان ورودی به جی‌پی‌تی ۴ (GPT-4) بدهیم، و این سؤال را مطرح کنیم که «با این مواد چه چیزی می‌توانم درست کنم؟» دستور پخت غذاهایی را به شما می‌دهد که در طبخ آنها از این موارد اولیه داخل تصویر استفاده شده است.

امکان آپلود تصویر به عنوان ورودی بصری در GPT-4
امکان آپلود تصویر به عنوان ورودی بصری در GPT-4 – منبع: openai

برای مثال، خروجی یا پاسخ جی‌پی‌تی ۴ (GPT-4) برای این تصویر به این صورت است:

«گزینه‌های زیادی برای آشپزی با استفاده از مواد درون تصویر وجود دارد. برخی از این گزینه‌ها عبارتند از:

  • پنکیک یا وافل
  • کرپ
  • تست فرانسوی
  • املت یا فریتاتا
  • کیش
  • کاسترد یا پودینگ 
  • کیک یا کاپ کیک
  • کلوچه، نان یا بیسکویت

 

۲. فریب دادن جی‌پی‌تی ۴ (GPT-4) دشوارتر است

با وجود همه توانایی‌های فوق‌العاده ربات‌های چت امروزی، به راحتی می‌شود آنها را گمراه کرد. این موضوع درمورد ChatGPT صدق می‌کرد و کاربران در مواردی موفق شدند آن را گمراه کنند. 

جی‌پی‌تی ۴ (GPT-4) در مورد بسیاری از پیام‌های مخرب ورودی آموزش دیده است که به کمک کاربران OpenAI در یکی دو سال گذشته اطلاعات لازم جمع‌آوری شده است.

با در نظر گرفتن این موارد، این مدل جدید در ارائه واقعیت، فرمان‌پذیری و امتناع از خارج شدن از مسیر اصلی خود بسیار بهتر از مدل‌های قبلی عمل کرده است.

شرکت OpenAI این مدل را اینگونه توصیف می‌کند که GPT-3.5 «اجرای آزمایشی» از یک نمونه پیشرفته و جدید بود، و این شرکت درس‌هایی را که از تجربه کاربری نمونه‌های قبلی به دست آورده، در نسخه جدید به کار گرفته است که به‌طور بی‌سابقه‌ای پایدار بود.

 

۳. جی‌پی‌تی ۴ (GPT-4) حافظه طولانی‌تری دارد

زمانی که این مدل‌های زبانی بزرگ مکالمات واقعی با کاربران برقرار می‌کنند، در حجم اطلاعاتی که می‌توانند پردازش کنند و به خاطر بسپارند دارای محدودیت هستند. این محدودیت در GPT-3.5 و نسخه قدیمی ChatGPT به عدد ۴۰۹۶ توکن رسید که حدود ۸۰۰۰ کلمه یا تقریباً ۴ الی ۵ صفحه از یک کتاب است. به همین دلیل، وقتی کمی به عقب برمی‌گردیم و حجم اطلاعات از این میزان بیشتر می‌شود، همه اطلاعات قبلی را به خاطر نمی‌آورد.

جی‌پی‌تی ۴ (GPT-4) دارای حداکثر تعداد توکن ۳۲۷۶۸ است که چیزی حدود ۶۴ هزار کلمه یا ۵۰ صفحه متن است که کل یک نمایشنامه یا داستان کوتاه را پوشش می‌دهد.

این به این معنی است که در مکالمه یا تولید متن، به طور تقریبی می‌تواند تا ۵۰ صفحه یا بیشتر را در حافظه خود ثبت کند. بنابراین آنچه را که ۲۰ صفحه قبل درباره آن صحبت می‌کردید به یاد می‌آورد. همچنین این قابلیت را دارد که در نوشتن یک داستان یا مقاله، به اتفاقاتی اشاره کند که ۳۵ صفحه پیش رخ داده‌اند.

 

۴. جی‌پی‌تی ۴ (GPT-4) تعداد زبان‌های بیشتری را پوشش می‌دهد

دنیای هوش مصنوعی تحت سلطه انگلیسی‌زبانان است و همه چیز، از داده‌ها گرفته تا آزمایش و مقالات تحقیقاتی، به زبان انگلیسی است. اما مسلماً قابلیت‌های مدل‌های زبانی بزرگ در هر زبان نوشتاری قابل اجرا است و باید در دسترس باشد.

جی‌پی‌تی ۴ (GPT-4) توانایی پاسخگویی به هزاران سوال چندگزینه‌ای با دقت بالا را به ۲۶ زبان دنیا، از ایتالیایی گرفته تا اوکراینی و کره‌ای دارد. این مدل زبانی بزرگ در پردازش و پاسخ به زبان‌های رومی و ژرمنی بهترین عملکرد را دارد.

هرچند آزمایش اولیه توانایی‌های زبانی جی‌پی‌تی ۴ (GPT-4) امیدوارکننده است، اما همچنان محدودیت‌هایی دارد.

یکی از محدودیت‌های موجود این است که از ابتدا، معیارهای تست از زبان انگلیسی ترجمه شدند و دیگر اینکه سوالات چندگزینه‌ای بیانگر گفتار معمولی افراد نیستند.

اما همچنان در مکالمه با افراد غیر انگلیسی‌زبان لحن دوستانه‌تری دارد که برای این قابلیت باید به سازندگان GPT-4 تبریک گفت، چرا که GPT-4 برای این موضوع آموزش داده نشده بود. 

 

۵. جی‌پی‌تی ۴ (GPT-4) شخصیت‌های متفاوتی دارد

هدایت‌پذیری یک مفهوم جالب در هوش مصنوعی است که به ظرفیت بات برای تغییر رفتار خود در صورت درخواست اشاره دارد. این قابلیت از این نظر می‌تواند مفید باشد که مثلاً در نقش یک شنونده دلسوز یا خطرناک ظاهر شود؛ مانند زمانی که افراد بات چت را متقاعد می‌کنند که در نقش شیطان ظاهر شود یا افسرده باشد.

جی‌پی‌تی ۴ (GPT-4) این امکان را به کاربران می‌دهد که شخصیت کلاسیک بات ChatGPT را که لحن و سبک ثابتی دارد، به چیزی تغییر دهند که بیشتر با نیازهایشان سازگار است.

این قابلیت را می‌توان با وارد کردن دستورهایی همچون «وانمود کن که افسرده هستی» یا «طوری پاسخ بده که انگار در یک مصاحبه تلویزیونی حاضر شده‌ای و به سؤالات مجری پاسخ می‌دهی» فعال کرد.

تفاوت‌های بسیار بیشتری بین GPT-4 و نسخه‌های قبلی آن وجود دارد. بدون شک با گذشت زمان و استفاده کاربران از این جدیدترین مدل زبانی، جزئیات بیشتری درباره آن یاد خواهیم گرفت.

دسترسی به جی‌پی‌تی ۴ (GPT-4) به‌زودی از طریق سرویس پولی OpenAI ChatGPT Plus اضافه خواهد شد و احتمالاً به‌زودی یک نسخه آزمایشی رایگان خواهد داشت.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا