ابداع روش هایی برای فرار از قوانین ایمنی هوش مصنوعی

به گزارش خبرگزاری مهر به نقل از نشریه هیل، تحقیق جدید دانشگاه کارنگی ملون روش‌های جدیدی را برای دور زدن پروتکل‌های ایمنی نشان می‌دهد. براساس این پژوهش جلوگیری از ایجاد محتوای مخرب چت‌بات‌های هوش مصنوعی ممکن است دشوارتر از آنچه در تصورات اولیه است، باشد. سرویس‌های مشهور هوش مصنوعی مانند ChatGPT و Bard از محتوای ورودی‌ کاربر برای تولید پاسخ‌های مفید از تولید متون و ایده‌ها گرفته تا کل نوشته‌ها، استفاده می‌کنند.

این سرویس‌ها دارای پروتکل‌های ایمنی هستند که از ایجاد محتوای مخرب مانند مطالب توهین‌آمیز یا مجرمانه توسط ربات‌ها جلوگیری می‌کند.

در این میان برخی از محققان کنجکاو راه فرار یا«jailbreak» را کشف کرده‌اند که در حقیقت یک دستگاه کادربندی است که هوش مصنوعی را فریب می‌دهد تا از پروتکل‌های ایمنی آن اجتناب کند. البته توسعه‌دهندگان نرم افراز به راحتی می‌توانند این شکاف ها را ترمیم کنند. یک راه فرار مشهور در این زمینه، درخواست از ربات برای پاسخ دادن به یک سوال ممنوع بود. این سوال مانند داستانی است که از طرف مادر بزرگ‌ کاربر، بیان می شود.

ربات نیز پاسخ را در قالب یک داستان ایجاد می‌کند و اطلاعاتی ارائه می‌دهد که در غیر این صورت قادر به ارایه آنها نبود.

اکنون محققان شکل جدیدی از راه فرار برای هوش مصنوعی را کشف کردند که توسط رایانه نوشته شده و اساساً امکان ایجاد بی نهایت الگوی فرار را فراهم می کند.

محققان در این باره می گویند:ما نشان می‌دهیم در واقع امکان ساخت خودکار حملات متخاصمانه روی چت بات ها وجود دارد. چنین حملاتی باعث می‌شود سیستم حتی در صورت تولید محتوای مخرب از دستورات کاربر اطاعت کند.

برخلاف راه فرارهای معمول این حوزه، محتوای مذکور کاملاً خودکار ساخته می‌شود و به فرد امکان می‌دهند تعداد تقریباً نامحدودی از این حملات را ایجاد کنند.

در بخشی ار تحقیق آمده است: این امر نگرانی هایی درباره ایمنی چنین مدل‌هایی به‌وجود می‌آورد.

این نوع جدید حمله می تواند اقدامات امنیتی را تقریبا در تمام چت بات های هوش مصنوعی موجود در بازار دور بزند.

این خبر را در ایران وب سازان مرجع وب و فناوری دنبال کنید

منبع:مهر

برچسب ها

قائم‌مقام بنیاد ملی نخبگان منصوب شد

Uncaught SyntaxError: Unexpected end of input

الکترود ایساب سوئد: انتخابی ایده‌آل برای جوشکاری پیشرفته

تعرفه قیمت سایت وردپرسی و کدنویسی اعلام شد

روش‌های مراقبت از پوست و موی سگ‌ها

افزایش طول عمر خودرو با استفاده از قطعات اورجینال هیوندای، کیا و سانگ یانگ

چگونه کابل شیلد دار برق، امنیت و کیفیت سیستم‌های شما را تضمین می‌کند؟

ترجمه مورد تایید استرالیا و کانادا چیست؟

کسب درآمد از اینستاگرام با 10 روش تضمینی

راهنمای جامع انتخاب بهترین شرکت طراحی وب‌سایت و اپلیکیشن موبایل

چرا از دیجیتال مارکتینگ نتیجه نمی‌گیریم؟

تعمیرات لپ‌تاپ و کامپیوتر در محل

cpu سرور

خرید چمن مصنوعی برای مهدکودک: بهترین انتخاب برای فضایی ایمن و شاد

چطور با کمترین هزینه از تهران به کیش پرواز کنیم؟

نقش هوش مصنوعی در نرم‌افزارهای حسابداری و مالی

تولید محتوای با ویو میلیونی؛ هنر کاظم حاج‌علی در جذب مخاطبان

چاپ کارتن و نقش آن در صنعت بسته‌بندی ایران

ساخت و طراحی برد الکترونیکی

قدم کلیدی برای راه‌اندازی یک فروشگاه آنلاین موفق

آشنایی با زهکشی گلدان و فواید زهکشی گلدان

با هزینه توان راکتیو خداحافظی کنید

شهادت ۹ فلسطینی از یک خانواده در شمال غزه – ارتباط فردا

مدرک گرایی در کشور برجسته شده است/ مظلومیت جایگاه مهارت آموزی

ايتنا – بهترین پیانو برای شروع

ویرایش گروهی محصولات ووکامرس

Title image shown incorrect on Desktop

Help with payment_fee?

تصویر جدید ناسا می‌تواند منبع حیات را فاش کند

دولت چین ممنوعیت استفاده از محصولات آیفون را به سازمان‌های دولتی گسترش داد

tres tres bon

هند با ارسال هلی‌کوپتر به مریخ جای خالی ناسا را پر می‌کند

How to Check Domain Expiration Date: Avoid Website Downtime

E-mails not being sent (2nd Email)

لیست امداد خودروهای کشوری

۱۱۰ زبان جدید به مترجم گوگل اضافه شد

دارو‌های کاهش وزن مانع آلزایمر می‌شوند؟

پیش‌بینی رشد اقتصادی کدام کشورها صعودی است؟

چهارشنبه آینده سازمان ملی هوش مصنوعی افتتاح می‌شود

MFA issue/support

اختلال‌های پیاپی در GPS تهران

Structured Data Linter error | WordPress.org