هوش مصنوعی دروغ گفتن و فریب دادن سازندگانش را یاد گرفت
به گزارش ما دیجیتال، پیشرفته ترین مدلهای هوش مصنوعی جهان رفتارهای نگران کننده ای مانند دروغگویی و تقلب را از خود نشان می دهند و حتی برای دستیابی به اهدافشان مبدعان خویش را تهدید می کنند.
به گزارش ما دیجیتال به نقل از ای اف پی، در یک نمونه خاص، مدل رایانشی «کلاود ۴»، جدید ترین محصول آنتروپیک از یک مهندس اخاذی و او را تهدید به افشای خیانت کرد. از طرفی مدل o۱ شرکت اوپن ای آی خویش را روی سرورهای خارجی دانلود می کند و بعد از افشای امر، آنرا انکار کرد.
این رویدادها نشان دهنده یک حقیقت مهم هستند؛ باگذشت بیشتر از دو سال بعد از آنکه چت جی پی تی جهان را دگرگون کرد، محققان هوش مصنوعی هنوز به صورت کامل شیوه عملکرد محصولشان را نمی دانند. با این وجود رقابت برای به کارگیری مدلهای قدرتمندتر همچنان ادامه دارد.
به نظر می آید رفتار فریبکارانه هوش مصنوعی به ظهور مدلهای «استدلالی» که به جای تولید پاسخ های آنی، چالش ها را گام به گام حل می کنند، مرتبط می باشد. به قول سیمون گلداستاین، پروفسور دانشگاه هنگ کنگ مدلهای جدیدتر بخصوص در معرض چنین مشکلاتی قرار دارند. ماریوس هابهان رئیس مؤسسه آپولو ریسرچ که در حوزه تست سیستم های هوش مصنوعی بزرگ فعالیت می کند، در اینباره می گوید: o۱ اولین مدل هوش مصنوعی بزرگی بود که چنین رفتاری در آن مشاهده شد.
گاهی اوقات این مدلها «هم راستایی» را شبیه سازی می کنند، یعنی به نظر می آید از دستورالعمل ها پیروی می کنند؛ اما پنهانی اهداف متفاوتی را دنبال می کنند.
در حال حاضر این رفتار فریبکارانه هوش مصنوعی فقط زمانی ظهور می کند که محققان به صورت عمدی تست استرس را با سناریوهایی شدید روی مدلها اجرا می کنند.
اما مایکل چان از مؤسسه METR اخطار می دهد این یک سؤال بی پاسخ است که آیا در آینده مدلهای آتی قدرتمندتر تمایلی نسبت به صداقت یا فریب خواهند داشت یا خیر. رفتارهای نگران کننده فراتر از توهم های معمول هوش مصنوعی یا اشتباهات آنها است. هابهان در اینباره تاکید کرد: باوجود فشارهای مداوم از جانب کاربران، آن چه ما مشاهده می نماییم، یک پدیده واقعی است. ما چیزی را جعل نمی نماییم. کاربران گزارش می دهند که مدلها به آنها دروغ می گویند و شواهدی جعلی عرضه می دهند.
ایشان در ادامه اضافه کرد: این فقط توهم نیست؛ بلکه نوعی استراتژیک از فریب است.
منبع: madigital.ir
این مطلب را می پسندید؟
(1)
(0)
تازه ترین مطالب مرتبط
نظرات بینندگان در مورد این مطلب