داده‌های مدل هوش مصنوعی سورا از کجا می‌آید؟

چالش‌های قانونی OpenAI و اطلاعات میرا موراتی درباره داده‌های هوش مصنوعی سورا

اسفند ۲۸, ۱۴۰۲آخرین به روز رسانی: اسفند ۲۸, ۱۴۰۲

۰ ۱۵ خواندن این مطلب 1 دقیقه زمان میبرد

داده‌های مدل هوش مصنوعی سورا از کجا می‌آید؟

مدیر ارشد فناوری OpenAI، میرا موراتی، در مصاحبه‌ای با وال استریت ژورنال در ۱۳ مارس، درباره منابع اطلاعاتی مدل زبانی سورا (Sora)، مدل هوش مصنوعی تولید کننده ویدئو این شرکت، بحث و گفت‌وگو کرد.

میرا موراتی اشاره کرد که این شرکت از ترکیبی از داده‌های در دسترس عموم و داده‌های دارای مجوز برای آموزش Sora استفاده کرده است. با این حال، زمانی که از میرا موراتی در مورد منابع خاصی مانند پلتفرم‌های رسانه‌های اجتماعی مانند یوتیوب، اینستاگرام یا فیس بوک پرسیده شد، موراتی اطلاعات دقیقی نداشت. او بعداً در مصاحبه خود با وال استریت ژورنال تأیید کرد که از داده‌های Shutterstock برای آموزش سورا استفاده شده است.

میرا موراتی، که از سال ۲۰۱۸ با OpenAI کار می‌کند، پروژه‌های مهمی از جمله DALL-E 3، Whisper و GPT-4 را در شرکت رهبری کرده است. او در نوامبر ۲۰۲۳، پس از جدایی سم آلتمن، برای مدت کوتاهی به عنوان مدیرعامل موقت فعالیت کرد.

چالش‌های قانونی OpenAI

OpenAI با اقدامات قانونی مرتبط با داده‌های آموزشی مدل‌های هوش مصنوعی خود مواجه شده است. نویسندگان سارا سیلورمن، ریچارد کادری و کریستوفر گلدن در جولای ۲۰۲۳، شکایتی علیه این شرکت تنظیم کردند و ادعا کردند که ChatGPT بر اساس محتوای دارای حق چاپ محتوا تولید می‌کند.

علاوه بر این، در ماه دسامبر، نیویورک تایمز از مایکروسافت و OpenAI به دلیل نقض کپی رایت شکایت و آنها را متهم کرد که از محتوای روزنامه برای آموزش چت ربات‌های هوش مصنوعی استفاده می‌کنند. یک شکایت دسته‌جمعی دیگر در کالیفرنیا ادعا کرد که OpenAI به طور غیرقانونی اطلاعات شخصی کاربران را از اینترنت برای آموزش ChatGPT بدون رضایت حذف کرده است.

علیرغم این چالش‌ها، OpenAI همچنان در حال بررسی و خلق تجربه‌های جدید در مدل‌های هوش مصنوعی و داده‌های آموزشی آن‌هاست.

برچسب ها