دادههای مدل هوش مصنوعی سورا از کجا میآید؟
چالشهای قانونی OpenAI و اطلاعات میرا موراتی درباره دادههای هوش مصنوعی سورا
مدیر ارشد فناوری OpenAI، میرا موراتی، در مصاحبهای با وال استریت ژورنال در ۱۳ مارس، درباره منابع اطلاعاتی مدل زبانی سورا (Sora)، مدل هوش مصنوعی تولید کننده ویدئو این شرکت، بحث و گفتوگو کرد.
میرا موراتی اشاره کرد که این شرکت از ترکیبی از دادههای در دسترس عموم و دادههای دارای مجوز برای آموزش Sora استفاده کرده است. با این حال، زمانی که از میرا موراتی در مورد منابع خاصی مانند پلتفرمهای رسانههای اجتماعی مانند یوتیوب، اینستاگرام یا فیس بوک پرسیده شد، موراتی اطلاعات دقیقی نداشت. او بعداً در مصاحبه خود با وال استریت ژورنال تأیید کرد که از دادههای Shutterstock برای آموزش سورا استفاده شده است.
میرا موراتی، که از سال ۲۰۱۸ با OpenAI کار میکند، پروژههای مهمی از جمله DALL-E 3، Whisper و GPT-4 را در شرکت رهبری کرده است. او در نوامبر ۲۰۲۳، پس از جدایی سم آلتمن، برای مدت کوتاهی به عنوان مدیرعامل موقت فعالیت کرد.
چالشهای قانونی OpenAI
OpenAI با اقدامات قانونی مرتبط با دادههای آموزشی مدلهای هوش مصنوعی خود مواجه شده است. نویسندگان سارا سیلورمن، ریچارد کادری و کریستوفر گلدن در جولای ۲۰۲۳، شکایتی علیه این شرکت تنظیم کردند و ادعا کردند که ChatGPT بر اساس محتوای دارای حق چاپ محتوا تولید میکند.
علاوه بر این، در ماه دسامبر، نیویورک تایمز از مایکروسافت و OpenAI به دلیل نقض کپی رایت شکایت و آنها را متهم کرد که از محتوای روزنامه برای آموزش چت رباتهای هوش مصنوعی استفاده میکنند. یک شکایت دستهجمعی دیگر در کالیفرنیا ادعا کرد که OpenAI به طور غیرقانونی اطلاعات شخصی کاربران را از اینترنت برای آموزش ChatGPT بدون رضایت حذف کرده است.
علیرغم این چالشها، OpenAI همچنان در حال بررسی و خلق تجربههای جدید در مدلهای هوش مصنوعی و دادههای آموزشی آنهاست.