امکان درز اطلاعات از طریق پلتفرم‌های هوش مصنوعی وجود دارد؟

گروهی از محققان دانشگاه‌های آمریکا و سوئیس، با همکاری گوگل و شرکت زیرمجموعه آن DeepMind با انجام یک تحقیق مشترک به بررسی امکان درز اطلاعات از طریق پلتفرم‌های مبتنی بر هوش مصنوعی پرداختند.

مدل‌های مولد هوش مصنوعی مورد استفاده در این پلتفرم‌ها بر روی تعداد بسیار زیادی از تصاویر با توضیحات از پیش تعیین شده آموزش دیده بودند. ایده این بود که شبکه‌های عصبی پس از پردازش حجم عظیمی از داده‌های آموزشی قادر به تولید تصاویر جدید و منحصر به فرد هستند.

با این حال، مطالعه جدید نشان داده است که این تصاویر همیشه منحصر به فرد نیستند، به گونه‌ای که در برخی موارد، شبکه عصبی دقیقا تصویری را مطابق با تصویر استفاده شده در آموزش قبلی بازتولید می‌کند.

این مطالعه دیدگاه‌هایی را به چالش می‌کشد که معتقد هستند مدل‌های هوش مصنوعی که برای تولید تصاویر استفاده می‌شوند، داده‌های آموزشی خود را ذخیره نمی‌کنند، و اینکه داده‌های آموزشی می‌تواند در صورت عدم افشا، خصوصی باقی بمانند.

نتایج سیستم‌های یادگیری عمیق می‌تواند برای افراد غیرمتخصص شگفت‌انگیز باشد، اما در واقع هیچ سحر و جادویی در این موضوع وجود ندارد، زیرا همه شبکه‌های عصبی کار خود را بر اساس یک اصل یعنی آموزش و با استفاده از مجموعه‌ای بزرگ از داده‌ها و توضیحات دقیق هر تصویر مانند مجموعه‌ای از تصاویر گربه‌ها و سگ‌ها انجام می‌دهند.

پس از آموزش، شبکه عصبی تصویر جدیدی را نمایش می‌دهد و از او خواسته می‌شود تا مشخص کند که این تصویر گربه است یا سگ. از این نکته کوچک، توسعه‌دهندگان این مدل‌ها به سناریو‌های پیچیده‌تر منتقل می‌شوند و با استفاده از الگوریتمی که روی تصاویر بسیاری از گربه‌ها آموزش داده شده، تصویری از یک حیوان خانگی که وجود ندارد، می‌سازند. این آزمایش‌ها نه تنها با تصاویر، بلکه با متن، ویدئو و حتی صدا نیز انجام می‌شود.

نقطه شروع برای همه شبکه‌های عصبی، مجموعه‌ای از داده‌های آموزشی است. شبکه‌های عصبی نمی‌توانند اشیاء جدیدی را از خود ایجاد کنند. به عنوان مثال، برای ایجاد تصویری از یک گربه، الگوریتم باید هزاران عکس یا نقاشی واقعی از گربه‌ها را مطالعه کند.

تلاش های زیاد برای محرمانه نگه داشتن مجموعه داده‌ها

محققان در مقاله خود توجه ویژه‌ای به مدل‌های یادگیری ماشینی داشته اند. آن‌ها به شرح زیر عمل کرده اند: داده‌های آموزشی (اعم از تصاویر افراد، ماشین ها، خانه‌ها و…) را با اضافه کردن نویز تحریف می‌کنند. سپس شبکه عصبی برای بازیابی این تصاویر به حالت اولیه آموزش داده می‌شود.

این روش امکان تولید تصاویر با کیفیت قابل قبول را فراهم می‌کند، اما یک نقطه ضعف بالقوه آن در مقایسه با الگوریتم‌ها در شبکه‌های رقابتی مولد، تمایل بیشتر آن به درز داده‌ها است؛ به گونه‌ای که داده‌های اصلی را می‌توان حداقل به سه روش مختلف از آن استخراج کرد:

– استفاده از پرسش‌های خاص برای وادار کردن شبکه عصبی برای خارج کردن یک تصویر منبع خاص و نه چیزی منحصر به فرد که بر اساس هزاران تصویر ایجاد شده است.

– تصویر اصلی حتی اگر تنها بخشی از آن موجود باشد قابل بازسازی است.

– به سادگی می‌توان تعیین کرد که آیا یک تصویر خاص در داده‌های آموزشی گنجانده شده است یا خیر.

بسیاری از اوقات، شبکه‌های عصبی تنبل هستند و به جای تولید یک تصویر جدید، اگر دارای چندین تکرار از یک تصویر باشد، چیزی از مجموعه آموزشی را تولید می‌کنند؛ بنابراین اگر تصویری بیش از صد بار در مجموعه آموزشی تکرار شود، احتمال لو رفتن آن به شکل تقریباً اصلی بسیار زیاد است.

با این حال، محققان راه‌هایی را برای بازیابی تصاویر آموزشی نمایش داده اند که تنها یک بار در مجموعه اصلی ظاهر شده است؛ به گونه‌ای که از بین ۵۰۰ تصویری که محققان آزمایش کرده اند، این الگو به طور تصادفی سه مورد از آن‌ها را ایجاد کرده است.

در ژانویه ۲۰۲۳، سه هنرمند از پلتفرم‌های تولید تصویر مبتنی بر هوش مصنوعی به دلیل استفاده از تصاویر آنلاین خود برای آموزش مدل هایشان بدون رعایت حق چاپ شکایت کردند.

یک شبکه عصبی در واقع می‌تواند سبک یک هنرمند را کپی کند و در نتیجه او را از درآمد محروم کند. این مقاله تاکید دارد که در برخی موارد، الگوریتم‌ها می‌توانند به دلایل مختلف دست به سرقت علمی واقعی بزنند و نقاشی‌ها، عکس‌ها و تصاویر دیگری تولید کنند که تقریباً مشابه کار افراد واقعی است؛ بنابراین محققان توصیه‌هایی را برای تقویت خصوصی سازی مجموعه آموزشی اصلی ارائه کرده اند:

۱- حذف تکرار در گروه‌های آموزشی.

۲- پردازش مجدد تصاویر آموزشی، به عنوان مثال با اضافه کردن نویز یا تغییر روشنایی. این باعث می‌شود احتمال نشت داده‌ها کمتر شود.

۳- تست الگوریتم با استفاده از تصاویر آموزشی ویژه و سپس بررسی عدم بازتولید ناخواسته آن با دقت.

منبع: باشگاه خبرنگاران جوان

این خبر را در ایران وب سازان مرجع وب و فناوری دنبال کنید

این مطلب از سایت ایتنا گردآوری شده است.

منبع: ایتنا

«وویس‌باکس» متا به‌دلیل خطرهای احتمالی عرضه نخواهد شد

حسادت آیفون ۱۴ پرو به پیکسل ۷ پرو!

الکترود ایساب سوئد: انتخابی ایده‌آل برای جوشکاری پیشرفته

تعرفه قیمت سایت وردپرسی و کدنویسی اعلام شد

روش‌های مراقبت از پوست و موی سگ‌ها

افزایش طول عمر خودرو با استفاده از قطعات اورجینال هیوندای، کیا و سانگ یانگ

چگونه کابل شیلد دار برق، امنیت و کیفیت سیستم‌های شما را تضمین می‌کند؟

ترجمه مورد تایید استرالیا و کانادا چیست؟

کسب درآمد از اینستاگرام با 10 روش تضمینی

راهنمای جامع انتخاب بهترین شرکت طراحی وب‌سایت و اپلیکیشن موبایل

چرا از دیجیتال مارکتینگ نتیجه نمی‌گیریم؟

تعمیرات لپ‌تاپ و کامپیوتر در محل

cpu سرور

خرید چمن مصنوعی برای مهدکودک: بهترین انتخاب برای فضایی ایمن و شاد

چطور با کمترین هزینه از تهران به کیش پرواز کنیم؟

نقش هوش مصنوعی در نرم‌افزارهای حسابداری و مالی

تولید محتوای با ویو میلیونی؛ هنر کاظم حاج‌علی در جذب مخاطبان

چاپ کارتن و نقش آن در صنعت بسته‌بندی ایران

ساخت و طراحی برد الکترونیکی

قدم کلیدی برای راه‌اندازی یک فروشگاه آنلاین موفق

آشنایی با زهکشی گلدان و فواید زهکشی گلدان

با هزینه توان راکتیو خداحافظی کنید

آموزش: با این نرم‌افزار فایل‌های پاک شده از گوشی را برگردانید

تلاش برای افزایش بودجه‌های پژوهشی با ‏همکاری مجلس

number of cache files/ pages cached

شکایت از ناسا برای سقوط زباله فضایی روی یک خانه

Stored reCAPTCHA Spam Submissions?

8 گزارش روابط عمومی نمونه ها و الگوها برای نشانک گذاری برای الهام

German translations are not taken

سنگین ترین سیاه‌چاله فضایی کشف شد

مزایای شگفت‌انگیز حرکت رو به عقب: گاهی جهت قدم‌ها را تغییر دهید

ارائه تسهیلات کسر خدمت، معافیت‌ها و وام خوداشتغالی برای سربازان

رونق بازار سیاه اجاره گذرنامه به دلیل بلاتکلیفی واردات آیفون

اعلام نتایج ارزشیابی حوزه تحقیقات و فناوری دانشگاه علوم توانبخشی

رونمایی از نانوکاتالیست‌های استراتژیک پتروشیمی‌ها

علی داوودی به مدال برنز یک ضرب رسید

اعلام آمادگی دانش بنیان‌ها برای ساخت کمک داور ویدیوئی

11+ HTML tags (& attributes) that you should know in 2024

خیالتان از بنزین راحت باشد!

Tried to Purchase on site stated contact you. HOW

حرفی نزنیم که برای زیست بوم فناوری و نخبگان دلسرد کننده باشد

نمایشگاه پژوهش و فناوری ۱۴۰۲ افتتاح شد