۵ دلیل برای اینکه جیپیتی ۴ (GPT-4) میتواند از ChatGPT پیشی بگیرد

شرکت OpenAI به تازگی از نسخه جدید و پیشرفته مدل هوش مصنوعی خود به نام جیپیتی ۴ (GPT-4) رونمایی کرد که پیشرفتهترین سیستم OpenAI است و پاسخهای ایمنتر و مفیدتری تولید میکند.
جیپیتی ۴ (GPT-4) خلاقانهتر از قبل شده و با هدف ایجاد مشارکت بیشتر با کاربر ارتقا پیدا کرده است. در حال حاضر، دامنه فعالیتهای آن همه چیز را، از یک داوطلب مجازی برای افراد کمبینا گرفته تا یک ربات یادگیری زبان در دولینگو (Duolingo) را دربرمیگیرد.
اما چه چیزی جیپیتی ۴ (GPT-4) را از نسخههای قبلی همچون ChatGPT و GPT-3.5 متمایز میکند؟ در ادامه پنج تفاوت اصلی بین این سیستمهای محبوب را بررسی میکنیم.
۱. جیپیتی ۴ (GPT-4) میتواند تصاویر را ببیند و درک کند
چشمگیرترین تغییر در این سیستم یادگیری ماشین (machine learning) این است که چندوجهی است، به این معنی که میتواند بیش از یک وجه یا بعد از اطلاعات را درک کند. ChatGPT و GPT-3 محدود به متن بودند: آنها میتوانستند بخوانند و بنویسند؛ هرچند همین موارد برای بسیاری از اپلیکیشنها، بیش از اندازه نیاز کاربران محسوب میشود.
با این حال، این امکان وجود دارد که به جیپیتی ۴ (GPT-4) تصاویری را به عنوان ورودی داد که آنها را برای یافتن اطلاعات مرتبط پردازش میکند.
البته میتوانید به سادگی از GPT-4 بخواهید آنچه را که در یک تصویر است، توصیف کند، اما نکته مهم درمورد GPT-4 این است که درک آن فراتر از توصیف تصویر است.
در ویدیوی Be My Eyes، که برای توصیف بهتر خدمات GPT-4 ساخته شده است، به خوبیمشخص میشود که جیپیتی ۴ (GPT-4) چگونه میتواند در انتخاب لباس و استایل، شناسایی اشیاء، نحوه رسیدن به یک دستگاه خاص در باشگاه برای افراد کمبینا، ترجمه نوشته روی یک برچسب، و خواندن نقشه به افراد کمک کند.
امکان آپلود عکس به عنوان ورودی بصری
جیپیتی ۴ (GPT-4) میتواند تصاویر را به عنوان ورودی بپذیرد و شرح دهد، و سپس طبقهبندی و تجزیه و تحلیل کند.
برای مثال، اگر تصویری مانند نمونه زیر را به عنوان ورودی به جیپیتی ۴ (GPT-4) بدهیم، و این سؤال را مطرح کنیم که «با این مواد چه چیزی میتوانم درست کنم؟» دستور پخت غذاهایی را به شما میدهد که در طبخ آنها از این موارد اولیه داخل تصویر استفاده شده است.

برای مثال، خروجی یا پاسخ جیپیتی ۴ (GPT-4) برای این تصویر به این صورت است:
«گزینههای زیادی برای آشپزی با استفاده از مواد درون تصویر وجود دارد. برخی از این گزینهها عبارتند از:
- پنکیک یا وافل
- کرپ
- تست فرانسوی
- املت یا فریتاتا
- کیش
- کاسترد یا پودینگ
- کیک یا کاپ کیک
- کلوچه، نان یا بیسکویت
۲. فریب دادن جیپیتی ۴ (GPT-4) دشوارتر است
با وجود همه تواناییهای فوقالعاده رباتهای چت امروزی، به راحتی میشود آنها را گمراه کرد. این موضوع درمورد ChatGPT صدق میکرد و کاربران در مواردی موفق شدند آن را گمراه کنند.
جیپیتی ۴ (GPT-4) در مورد بسیاری از پیامهای مخرب ورودی آموزش دیده است که به کمک کاربران OpenAI در یکی دو سال گذشته اطلاعات لازم جمعآوری شده است.
با در نظر گرفتن این موارد، این مدل جدید در ارائه واقعیت، فرمانپذیری و امتناع از خارج شدن از مسیر اصلی خود بسیار بهتر از مدلهای قبلی عمل کرده است.
شرکت OpenAI این مدل را اینگونه توصیف میکند که GPT-3.5 «اجرای آزمایشی» از یک نمونه پیشرفته و جدید بود، و این شرکت درسهایی را که از تجربه کاربری نمونههای قبلی به دست آورده، در نسخه جدید به کار گرفته است که بهطور بیسابقهای پایدار بود.
۳. جیپیتی ۴ (GPT-4) حافظه طولانیتری دارد
زمانی که این مدلهای زبانی بزرگ مکالمات واقعی با کاربران برقرار میکنند، در حجم اطلاعاتی که میتوانند پردازش کنند و به خاطر بسپارند دارای محدودیت هستند. این محدودیت در GPT-3.5 و نسخه قدیمی ChatGPT به عدد ۴۰۹۶ توکن رسید که حدود ۸۰۰۰ کلمه یا تقریباً ۴ الی ۵ صفحه از یک کتاب است. به همین دلیل، وقتی کمی به عقب برمیگردیم و حجم اطلاعات از این میزان بیشتر میشود، همه اطلاعات قبلی را به خاطر نمیآورد.
جیپیتی ۴ (GPT-4) دارای حداکثر تعداد توکن ۳۲۷۶۸ است که چیزی حدود ۶۴ هزار کلمه یا ۵۰ صفحه متن است که کل یک نمایشنامه یا داستان کوتاه را پوشش میدهد.
این به این معنی است که در مکالمه یا تولید متن، به طور تقریبی میتواند تا ۵۰ صفحه یا بیشتر را در حافظه خود ثبت کند. بنابراین آنچه را که ۲۰ صفحه قبل درباره آن صحبت میکردید به یاد میآورد. همچنین این قابلیت را دارد که در نوشتن یک داستان یا مقاله، به اتفاقاتی اشاره کند که ۳۵ صفحه پیش رخ دادهاند.
۴. جیپیتی ۴ (GPT-4) تعداد زبانهای بیشتری را پوشش میدهد
دنیای هوش مصنوعی تحت سلطه انگلیسیزبانان است و همه چیز، از دادهها گرفته تا آزمایش و مقالات تحقیقاتی، به زبان انگلیسی است. اما مسلماً قابلیتهای مدلهای زبانی بزرگ در هر زبان نوشتاری قابل اجرا است و باید در دسترس باشد.
جیپیتی ۴ (GPT-4) توانایی پاسخگویی به هزاران سوال چندگزینهای با دقت بالا را به ۲۶ زبان دنیا، از ایتالیایی گرفته تا اوکراینی و کرهای دارد. این مدل زبانی بزرگ در پردازش و پاسخ به زبانهای رومی و ژرمنی بهترین عملکرد را دارد.
هرچند آزمایش اولیه تواناییهای زبانی جیپیتی ۴ (GPT-4) امیدوارکننده است، اما همچنان محدودیتهایی دارد.
یکی از محدودیتهای موجود این است که از ابتدا، معیارهای تست از زبان انگلیسی ترجمه شدند و دیگر اینکه سوالات چندگزینهای بیانگر گفتار معمولی افراد نیستند.
اما همچنان در مکالمه با افراد غیر انگلیسیزبان لحن دوستانهتری دارد که برای این قابلیت باید به سازندگان GPT-4 تبریک گفت، چرا که GPT-4 برای این موضوع آموزش داده نشده بود.
۵. جیپیتی ۴ (GPT-4) شخصیتهای متفاوتی دارد
هدایتپذیری یک مفهوم جالب در هوش مصنوعی است که به ظرفیت بات برای تغییر رفتار خود در صورت درخواست اشاره دارد. این قابلیت از این نظر میتواند مفید باشد که مثلاً در نقش یک شنونده دلسوز یا خطرناک ظاهر شود؛ مانند زمانی که افراد بات چت را متقاعد میکنند که در نقش شیطان ظاهر شود یا افسرده باشد.
جیپیتی ۴ (GPT-4) این امکان را به کاربران میدهد که شخصیت کلاسیک بات ChatGPT را که لحن و سبک ثابتی دارد، به چیزی تغییر دهند که بیشتر با نیازهایشان سازگار است.
این قابلیت را میتوان با وارد کردن دستورهایی همچون «وانمود کن که افسرده هستی» یا «طوری پاسخ بده که انگار در یک مصاحبه تلویزیونی حاضر شدهای و به سؤالات مجری پاسخ میدهی» فعال کرد.
تفاوتهای بسیار بیشتری بین GPT-4 و نسخههای قبلی آن وجود دارد. بدون شک با گذشت زمان و استفاده کاربران از این جدیدترین مدل زبانی، جزئیات بیشتری درباره آن یاد خواهیم گرفت.
دسترسی به جیپیتی ۴ (GPT-4) بهزودی از طریق سرویس پولی OpenAI ChatGPT Plus اضافه خواهد شد و احتمالاً بهزودی یک نسخه آزمایشی رایگان خواهد داشت.