هوش مصنوعی دیپ‌ مایند گوگل، نحوه انجام بازی‌های ویدیویی را آموزش می‌بیند

دیپ‌ماند، شرکت انگلیسی زیرشاخه‌ی گوگل، به‌تازگی شیوه‌ای جدید برای آموزش نحوه‌ی انجام بازی‌های ویدئویی به هوش مصنوعی توسعه داده است؛ بدین صورت که به‌جای تلاش برای انجام فرآیند طافت‌فرسای تغذیه‌ی اطلاعات، تنها تعدادی ویدئوی یوتیوب به آن‌ها نمایش داده می‌شود.

جدیدترین شیوه‌ی آموزشی دیپ‌مایند به‌منظور حل مشکلی که هوش مصنوعی در انجام جستجو و کاوش با آن مواجه می‌شود، طراحی شده است. عملکرد هوش مصنوعی در اکتشاف مکان‌های جدید یا تشخیص مسیر درست به‌شدت ضعیف است و توسعه‌دهندگان هوش مصنوعی در یافتن راه‌هایی برای دادن پاداش به هوش مصنوعی در محیط‌هایی که امکان موفقیت پایین است، با چالش روبه‌رو هستند. برای مثال، هوش مصنوعی آلفاگو گوگل با هدف پیروزی در گو (نوعی بازی با قواعد بسیار مشخص) طراحی شد. با این حال، هنگام معرفی بازی‌هایی همچون پیتفال یا انتقام مونتزوما که هر دو نیازمند اکتشاف هستند، هوش مصنوعی به‌سختی می‌تواند تصمیم بگیرد چه کاری باید انجام دهد.

تصمیم گرفتن برای انسان‌ها یک توانایی بدیهی به‌حساب می‌آید. اگر ما مشغول انجام یک بازی باشیم، می‌توانیم به کمک ادراک خود موانع را تشخیص دهیم و مسیر پیش رو را تقریبا به‌راحتی پیدا کنیم؛ درحالی‌که همین مسئله‌ی به ظاهر ساده می‌تواند برای هوش مصنوعی چالش بسیار بزرگی محسوب شود. پژوهشگران در این باره می‌نویسند:

از آنجایی که شمار مسیرهای عملی ممکن به‌صورت نمایی در تعداد تصاویر جداکننده‌ی پاداش‌ها افزایش می‌یابد، انجام چنین وظایفی با استفاده از شیوه‌های اکتشافی ابتدایی ساده عملا غیر ممکن است. برای مثال، دستیابی به پاداش محیط نخست در بازی انتقام مونتزوما تقریبا نیازمند طی کردن ۱۰۰ قدم محیطی است یا به عبارت دیگر ۱۰۰ به توان ۱۸ توالی عمل ممکن.

مقاله‌ی مرتبط:

در حال حاضر، توسعه‌دهندگان از طریق تغذیه‌ی هوش مصنوعی با مجموعه داده‌های عظیمی از تصاویر اطلاعاتی که به نحو بی‌نقصی پیکربندی شده‌اند، این مشکل را حل می‌کنند. با این حال، این رویکرد در موقعیت‌هایی که چنین مجموعه داده‌هایی با دقت بالا در دسترس نیستند، کارساز نیست. با شیوه‌ی جدید دیپ‌مایند، هوش مصنوعی در ابتدا تصاویر نویزدار را دریافت می‌کند و به نحوه‌ی پیکربندی آن‌ها به شکلی که بعدا امکان تولید داده از آن‌ها فراهم باشد، پی می‌برد. اگر به این هوش مصنوعی ویدئویی از بازی کردن پیتفال یا انتقام مونتزوما توسط انسان نمایش دهید، می‌تواند به جداسازی حرکاتی که موجب موفقیت انسان شده است، بپردازد و از آن‌ها تقلید کند.

این مسئله به پژوهشگران امکان می‌دهد برای انجام سریع‌تر بازی یا دریافت امتیازهای بیشتر، پاداش تعیین کنند و در عین حال مبنایی را برای شروع آموزش هوش مصنوعی در نظر بگیرند. چنین کاری به سادگی بارگذاری چندین ویدئوی یوتیوب درون شبکه‌ی عصبی انجام می‌شود؛ زیرا این شیوه، آموزش یک‌باره را ایجاد می‌کند.

این فناوری به‌محض آنکه به نحو مناسبی توسعه یابد، می‌تواند به یک ربات امکان بدهد با بهره‌گیری از نشانه‌های تهیه‌شده توسط تصاویر مریخ‌نورد، محیط‌های جدید نظیر سطح مریخ را بررسی کند یا به‌سادگی از طریق تماشای ویدئویی تشریحی در یوتیوب، برای محیطی کاری آموزش داده شود.





منبع: زومیت