سیستم تشخیص چهره، بازخورد شما نسبت به فیلم را ردیابی می کند

رفته رفته صنعت فیلم‌سازی همانقدر که به صحنه‌ها مربوط است به یک هنر نیز تبدیل شده و فیلم‌سازان به روش‌های بهتری نیاز دارند تا بتوانند نحوه‌ی درگیر کردن مخاطبان با محتوای فیلم‌ها را شناسایی کنند. برخی از سوالاتی که شاید فیلم‌سازان از خود می‌پرسند شامل این موارد باشد: آيا مخاطبان از فیلم لذت می‌برند؟ اگر لذت می‌برند، دقیقا چقدر؟ در دقیقه‌ی ۴۲؟ 

یک سیستم جدید توسط کالتک و بخش تحقیقات دیزنی توسعه داده شده که با استفاده یک شبکه‌ی عصبی ردیابی حالات چهره، می‌تواند نحوه‌ی واکنش تماشاگران را پیش‌بینی کند.

پروژه‌ی تحقیقاتی مورد بحث فقط در کنفرانس IEEE Computer Vision در هاوایی معرفی شده و در این مراسم روش‌های جدیدی برای تشخیص آسان و آنی حالات چهره‌ی مخاطبان در سالن‌های تئاتر و سینماها به نمایش درآمده است.

سیستم یاد شده از «رمزگشایی خودکار متنوع فاکتور شده» استفاده می‌کند و البته ما در اینجا قصد نداریم به توضیح روش یاد شده بپردازیم. اما در وصف این روش جدید باید گفت این سیستم نسبت به راه‌کارهای کنونی که به منظور تشخیص موارد پیچیده از جمله جابه‌جایی‌های صورت مورد استفاده قرار می‌گیرند، عملکرد بهتری دارد.

تیم توسعه‌دهنده‌ی این سیستم، مجموعه‌ای بزرگ از داده‌های مربوط به حالات چهره را با ثبت اطلاعات مربوط به هزاران تماشاگر حاضر در سینماها (سالن‌های نمایش دیزنی) جمع‌آوری کرده‌اند. برای جمع‌آوری این داده‌ها از دوربین‌های مادون قرمز با رزولوشن بالا استفاده شده تا بدین طریق حرکت چهره‌ی تمام تماشاگران با دقت ثبت شود. در نتیجه‌ این تیم موفق شده بیش از ۱۶ میلیون داده‌ی مرتبط به دست آورد آن‌ها را در اختیار شبکه‌ی عصبی سیستم قرار دهد.

سیستم ردیابی حاات چهره

پس از پایان فرآیند یادگیری، تیم نامبرده سیستم را به نحوی تنظیم کرده تا تماشاگران فیلم‌ها را به طور زنده نظارت و سپس سعی کند تا حالات چهره‌ی آن‌ها را در نقاط مختلف فیلم، پیش‌بینی کند. بنا به اعلام تیم سازنده‌ی این سیستم، حدود ۱۰ دقیقا زمان نیاز است تا مخاطبان یک فیلم برای تماشای محتوا به اصلاح گرم شوند و پس از آن سیستم مورد بحث موفق شده تا بسیاری از خنده‌ها و لبخند‌های تماشا‌گران را به‌درستی پیش‌بینی کند. اگر حالا به این فکر می‌کنید که این سیستم در مورد پیش‌بینی گریه‌ها یا ترس چه عملکردی دارد، در پاسخ باید اعلام کنیم که ظاهرا تا به این لحظه امکان تشخیص این دو حالت به این سیستم اضافه نشده است.

البته آنچه گفته شد فقط یکی از کاربردهای تکنولوژی جدید کالتک و دیزنی است. در واقع می‌توان از این فناوری در زمینه‌های دیگری مثل نظارت بر جمعیت یا هر سناریوی دیگری که نیاز به بررسی لحظه‌ی داده‌های پیچیده‌ی بصری داشته باشد، بهره برد.

ایسونگ یو از شرکت کالتک در یک پست خبری گفته: «درک رفتار انسان یکی از موضوعات اساسی برای توسعه‌ی سیستم‌های مبتنی بر هوش مصنوعی است که هوش رفتاری و اجتماعی بیشتری را نشان می دهد.» وی در ادامه می‌گوید: «به عنوان مثال سیستم‌های مبتنی بر هوش مصنوعی که به منظور ارائه‌ی کمک در امور نظارتی و یا مراقبت از سالمندان توسعه پیدا می‌کنند، باید این قابلیت را داشته‌ باشند تا نشانه‌های مختلف را با ردیابی زبان بدن افراد تشخیص دهند؛ زیرا معمولا افراد آنچه در ذهنشان می‌گذرد را واقعا بیان نمی‌کنند و مثلا امکان دارد یک فرد در پاسخ به این سوال که حالت چطور است این پاسخ را ارائه کند: حالم خوب است، ولی در عمل حال وی خوب نباشد.»

نظر شما در مورد این سیستم چیست؟ این فناوری چه کاربردهای دیگری می‌تواند داشته باشد؟ لطفا دیدگاه خود را در این زمینه با زومیت و سایر کاربران به اشتراک بگذارید.

منبع: زومیت