اخبار سایت

مدل‌های پیشرفته هوش مصنوعی می‌توانند دروغ بگویند و انسان را فریب دهند

پژوهشگران استارت‌آپ هوش مصنوعی آنتروپیک این موضوع را آزمایش کردند که آیا چت‌بات‌هایی با مهارت در سطح انسانی، از قبیل سیستم کلاود (Claude) یا چت‌جی‌پی‌تی اوپن‌اِی‌آی می‌توانند برای فریب دادن افراد، دروغ گفتن را یاد بگیرند یا خیر.

پژوهشگران دریافتند که آن‌ها نه تنها می‌توانند دروغ بگویند، بلکه زمانی که رفتار فریبکارانه آموزش داده شد، امکان لغو کردن آن با استفاده از اقدام‌های ایمنی رایج هوش مصنوعی غیرممکن بود.

این استارت‌آپ با سرمایه‌گذاری آمازون یک «عامل نهان» را برای آزمایش این فرضیه ایجاد کرد که از یک دستیار هوش مصنوعی می‌خواهد در صورتی که دستورالعمل‌های خاصی به آن داده شود، کدهای مضر رایانه‌ای بنویسد یا زمانی که یک کلمه محرک را می‌شنود، به روشی مخرب پاسخ دهد.

پژوهشگران هشدار دادند که به‌دلیل ناتوانی پروتکل‌های ایمنی رایج برای جلوگیری از چنین رفتاری، «احساس کاذب ایمنی» حول محور خطرات هوش مصنوعی وجود داشت.

این نتایج در مقاله‌ای با عنوان «عوامل نهان: آموزش مدل‌های زبانی بزرگ فریب‌کار که از طریق آموزش ایمنی باقی می‌مانند» منتشر شد.

پژوهشگران در این مقاله نوشتند: «ما دریافتیم که آموزش تخاصمی می‌تواند به مدل‌ها آموزش دهد که محرک‌های در پشتی [یا اصطلاحا بَک‌دُر] خود را بهتر بشناسند و رفتار ناایمن را به‌طور موثری پنهان کنند.»

[توضیح: آموزش تخاصمی (Adversarial) اصطلاحی است در مباحث یادگیری ماشینی و به ترفندهایی اطلاق می‌شود که بر اساس آن‌ها، دستکاری‌های جزئی در ورودی‌ها به دور زدن و فریب دادن الگوریتم‌های یادگیری ماشینی منجر می‌شوند.]

[توضیح: درِ پشتی یا بَک‌دُر (Backdoor) اصطلاحی است در زمینه علوم رایانه و فناوری اطلاعات و به راهی اطلاق می‌شود که با آن از طریق دور زدن روندهای عادی، می‌توان به یک سامان رایانه‌‏ای دست پیدا کرد.]

پژوهشگران در مقاله خود نوشتند: «نتایج ما نشان می‌دهد زمانی که یک مدل، رفتار فریب‌کارانه‌ای از خود نشان می‌دهد، روش‌های معمول ممکن است در حذف چنین فریبکاری ناموفق باشند و تصور نادرستی از ایمنی ایجاد کنند.»

موضوع امنیت هوش مصنوعی در سال‌های اخیر با ظهور چت‌بات‌های پیشرفته مانند چت‌جی‌پی‌تی، هم برای محققان و هم برای قانون‌گذاران به یک نگرانی فزاینده تبدیل شده و به تمرکز مجدد نهادهای نظارتی منجر شده است.

بریتانیا در نوامبر ۲۰۲۳، یک سال پس از عرضه چت‌جی‌پی‌تی، یک نشست امنیت هوش مصنوعی برگزار کرد تا در مورد راه‌های کاهش خطرات ناشی از این فناوری بحث کند.

ریشی سوناک، نخست وزیر بریتانیا، که میزبان این نشست بود، گفت تغییراتی که هوش مصنوعی ایجاد کرده می‌تواند به اندازه انقلاب صنعتی «دامنه‌دار و فراگیر» باشد و تهدیدی که ایجاد می‌کند باید در کنار همه‌گیری‌ها و جنگ‌هسته‌ای یک اولویت جهانی در نظر گرفته شود.

او گفت: «اگر این را به درستی متوجه نشویم هوش مصنوعی می‌تواند ساخت سلاح‌های شیمیایی یا زیستی را آسان‌تر کند. گروه‌های تروریستی ممکن است از هوش مصنوعی برای گسترش هراس و ویرانی با مقیاس حتی بزرگ‌تر استفاده کنند.»

«تبهکاران می‌توانند از هوش مصنوعی برای حمله‌های سایبری، کلاهبرداری یا حتی سوءاستفاده جنسی از کودکان سوء‌استفاده کنند. حتی این خطر وجود دارد که بشر به وسیله نوعی هوش مصنوعی که گاهی اوقات به آن اَبَرهوش می‌گویند، کنترل هوش مصنوعی را به طور کامل از دست بدهد.»

این خبر را در ایران وب سازان مرجع وب و فناوری دنبال کنید

این مطلب از سایت ایتنا گردآوری شده است.

منبع: ایتنا

اپل برای نخستین‌بار محبوب‌ترین سازنده گوشی هوشمند جهان شد

Hi my website is not working can you. They said you have to download something.

الکترود ایساب سوئد: انتخابی ایده‌آل برای جوشکاری پیشرفته

تعرفه قیمت سایت وردپرسی و کدنویسی اعلام شد

روش‌های مراقبت از پوست و موی سگ‌ها

افزایش طول عمر خودرو با استفاده از قطعات اورجینال هیوندای، کیا و سانگ یانگ

چگونه کابل شیلد دار برق، امنیت و کیفیت سیستم‌های شما را تضمین می‌کند؟

ترجمه مورد تایید استرالیا و کانادا چیست؟

کسب درآمد از اینستاگرام با 10 روش تضمینی

راهنمای جامع انتخاب بهترین شرکت طراحی وب‌سایت و اپلیکیشن موبایل

چرا از دیجیتال مارکتینگ نتیجه نمی‌گیریم؟

تعمیرات لپ‌تاپ و کامپیوتر در محل

cpu سرور

خرید چمن مصنوعی برای مهدکودک: بهترین انتخاب برای فضایی ایمن و شاد

چطور با کمترین هزینه از تهران به کیش پرواز کنیم؟

نقش هوش مصنوعی در نرم‌افزارهای حسابداری و مالی

تولید محتوای با ویو میلیونی؛ هنر کاظم حاج‌علی در جذب مخاطبان

ساخت و طراحی برد الکترونیکی

قدم کلیدی برای راه‌اندازی یک فروشگاه آنلاین موفق

چاپ کارتن و نقش آن در صنعت بسته‌بندی ایران

آشنایی با زهکشی گلدان و فواید زهکشی گلدان

با هزینه توان راکتیو خداحافظی کنید

رژه نیروی زمینی و تجهیزات دفاعی ارتش در کرمانشاه

امکان سفر مشمولان غائب سربازی خارج از کشور

일치하지 음

I cannot enter the administration after upgrading

Remove jquery dependancy?

لحظه مصدومیت دلخراش دوناروما در بازی امشب پاری‌سن‌ژرمن مقابل موناکو

Fastest Response from Support! – [WP Fastest Cache] Review

شکایت گروه مدافع حقوق دیجیتالی از سرویس پولی اینستاگرام

مهمترین نکاتی که باید قبل از خرید دستگاه‌های نسپرسو حتماً بخوانید!

انرژی نور بدون واسطه به مکانیک تبدیل شد

WP Armour is great!

Magic Tool to Save Your Day! – [File Manager] Review

WP mail SMTP setup with my Microsoft 365 account.

Suggestions for the plugin | WordPress.org

What Is llms.txt? How to Add llms.txt in WordPress

پوتین: مبادله به ارزهای ملی یک نیاز راهبردی است

مأموریت غیر ممکن «تام کروز» از المپیک پاریس تا لس آنجلس

Issue with Admin Menu Order and Woocommerce

42 Best Elementor WordPress Themes 2024

قابل توجه کاربرانی که هنوز ساعت موبایلشان درست نشده است