توسط گروه فناوری‌های نوین پژوهشگاه فضای مجازی

ایران ابهامات روبات مقاله‌نویس گاردین را بررسی کرد

تاریخ انتشار

دوشنبه ۲۴ شهريور ۱۳۹۹ ساعت ۱۳:۲۶

ایران ابهامات روبات مقاله‌نویس گاردین را بررسی کرد

آی‌تی‌من- به تازگی روزنامه گاردین یادداشتی را منتشر کرده که نویسنده آن یک روبات بوده است. این امر نشان دهنده پیشرفت هوش مصنوعی در دنیا به شمار می‌رود.

به این روبات که GPT-3 نام دارد، دستور داده شد تا در مقاله ای خوانندگان را متقاعد کند روبات‌ها بی‌آزار و صلح آمیز هستند و به این ترتیب یک مغز رایانشی با استفاده از ژنراتور زبان OpenAI مقاله ای هزار کلمه ای در این باره نوشت.

موضوع انتخاب شده برایGPT-3 ، متقاعد کردن انسان‌ها برای نترسیدن از روبات‌ها بوده است. هر چند از زمان انتشار این مقاله هیاهوی بسیاری در فضای مجازی به راه افتاده است، ولیکن ملاحظاتی که در سرمقاله گاردین قید شده است ابهامات و مسائلی را به وجود آورده که گروه علوم و فناوری‌های نوین پژوهشگاه فضای مجازی به آن پرداخته است.

در یادداشت تحلیلی این گروه آمده است: «گاردین مقاله‌ای را در تاریخ ۱۸ شهریور در سایت رسمی خود منتشر کرده است که به ادعای این نشریه، محتوای آن توسط پروژهGPT-3 (جدیدترین نسخه از پروژه مبدل زبانی بدون‌ نظارت آزمایشگاه OpenAI) تولید شده است. به گفته گاردین برای تولید این مقاله، ابتدا پاراگرافی نمونه (که همان بخش ابتدایی مقاله منتشر شده است) به GPT-3 داده شده است و GPT-3 این مقاله را با چندین پاراگراف در مورد موضوع تعیین شده ادامه داده است.

این موضوع ابهامات و مسائلی به همراه دارد.

اول اینکه ، قضاوت دقیق خوب بودن GPT-3 برای خوانندگان دشوار است. آیا به دلیل تلفیق پاراگراف‌ها است که متن انسجام بیشتری دارد؟ (طبق گفته گاردین از GPT-3 حدود ۸ خروجی گرفته شده که در نهایت با تلفیق پاراگراف‌های منتخب از این ۸ متن، مقاله مورد نظر منتشر شده است) آیا بدون ویرایش‌های انسانی انجام گرفته، انسجام آن کمتر یا بیشتر می‌توانست باشد؟

دوم، در مورد انتخاب محتوا که هوش مصنوعی انسان را نسبت به بی خطر بودن خود متقاعد کند؛ ممکن است کسانی که اطلاعات زیادی در مورد GPT-3 ندارند این باور را داشته باشند که این سیستم در واقع این باور را دارد. اما کارمندان گاردین به همین راحتی می توانستند موضوعی کاملا مخالف را برای آن انتخاب کنند.

فقط با خواندن یادداشت‌های پایان سرمقاله می‌توان درک کرد که کارکنان گاردین در خلق این قطعه چه نقشی داشته‌اند.

البته این مسئله ارزش پروژه GPT-3 را زیر سوال نمی‌برد چرا که همان کاری را که از آن خواسته‌اند انجام می‌دهد. مسئله اینجاست که هیچ تلاشی برای آموزش خوانندگان در مورد آنچه GPT-3 انجام می‌دهد ارایه نشده است.

همچنین بخشی از مقاله که به طور گسترده در رسانه‌های اجتماعی در حال پخش است همان قسمتی ‌است که توسط گاردین (با نقل از‌هاوکینگ) نوشته شده است و نهGPT-3 .

سوم: مقاله در پایان به یکباره در مورد مقاله‌های رد شده GPT-3 شروع به صحبت می‌کند. سردبیران گاردین بوده‌اند که این تصمیم را گرفته‌اند و آنها این امکان را داشته‌اند که صدای مقاله تولیدی را منسجم‌تر کنند. هدف آنها از این تصمیمات تحریریه چه بوده است؟

چهارم: در حوزه پژوهشی خلاقیت محاسباتی، گاهی اوقات در مورد «ضریب گزینش» صحبت می‌شود. منظور از این ضریب عبارت است از تعداد دفعات اجرای یک سیستم قبل از اینکه انسان بخواهد نتایج را به اشتراک بگذارد. اگر کسی می‌خواد سیستمی کاملاً خودمختار و ایده‌آل را ارایه دهد، این ضریب باید به صفر برسد.

می‌توان ضریب گزینش ۸ را برای این آزمایشGPT-3 استنباط کرد که زیاد است. حتی ابزارهای مبتنی بر هوش‌مصنوعی پشتیبانی از خلاقیت، ضرایب ۲ تا ۵ را هدف خود قرار می‌دهند.

البته ابهامات ذکر شده در بالا به معنای نفی پیشرفت انجام گرفته در GPT-3 که از ۱۷۵ میلیارد پارامتر در شبکه عصبی خود بهره می‌برد و یک رکورد چشمگیر به حساب می‌آید نیست.

طبق ارزیابی انجام گرفته توسط تیمی از دانشجویان دانشگاه برکلی، GPT-3 توانسته به ۴۳ درصد دقت میانگین در حل مسائل مختلف برسد که فاصله نسبتا مناسبی از آستانه شانس ۲۰ درصدی حل مسائل بنچمارک در نظر گرفته شده در این پژوهش به حساب می‌آید.

در تصاویر منتشره دقت عملکرد GPT-3 به تفکیک ۵۷ حوزه‌ دانشی مورد آزمون نشان داده شده است که بر این اساس GPT-3 با اینکه در حوزه‌هایی چون سیاست خارجی آمریکا، روانشناسی دبیرستان، بازار، امنیت کامپیوتر و مدیریت دقت خوبی از خود نشان دهد، ولی در زمینه‌هایی چون فیزیک و ریاضی دبیرستان و دانشگاه نزدیک به آستانه شانس عمل کرده است.

از دیگر ضعف‌های مهم برشمرده شده برای GPT-3 عدم دانش در مورد تشخیص صلاحیت علمی خود در زمینه‌های مختلف است. با این حساب این خطر وجود دارد که این هوش مصنوعی در حوزه‌هایی که عملکرد خوبی ندارد ورود کرده و تصمیم‌گیری کند. همچنین عدم فهم و توانایی تفکیک مناسب میان مسائل قانونی و مسائل اخلاقی، چالش دیگری ست که انتظار می‌رود در نسخه‌های بعدی این پروژه با جدیت دنبال شود.

مرجع : مهر