آیا می‌توان به فناوری تشخیص چهره تفاوت نژادها را آموخت؟

شرکت‌های تکنولوژی به مرحله بعدی پیشرفت نگاه می‌کنند؛ پیشرفتی که با چهره‌ی انسان گره‌ خورده است. اکنون اگر میل به صحبت‌کردن در قالب صورت یک حیوان را داشته‌ باشید، آیفون X به وسیله‌ی قابلیت تشخیص چهره‌ی خود این کار را برای شما انجام می‌دهد. قابلیت تشخیص چهره‌ی آیفون X به شما این اجازه را می‌دهد تا در کسری از ثانیه، قفل دستگاه خود را باز کنید. در شعبه‌ی هانگژو رستوران کی‌اف‌سی، می‌توانید پول ساندویچ مرغ‌تان را با خندین به دوربین، پرداخت کنید و حداقل در یکی از چهار دپارتمان پلیس در ایالات متحده آمریکا، از این تکنولوژی برای تشخیص چهره مظنونین استفاده می‌شود.

اما نکته‌ای که بعضی مواقع رخ می‌نماید، کامل‌نبودن این تکنولوژی است. آیفون X همیشه در تشخیص چهره‌ها خوب عمل نمی‌کند و پلیس ممکن است به‌دلیل کارکرد نادرست این فناوری، فردی را اشتباهاً بازداشت کند. برای اینکه این نرم‌افزار همواره در تشخیص چهره موفق باشد، باید تمام اجزای الگوریتم به درستی کار کند. در وحله‌ی نخست، نرم‌افزار باید وجود چهره در عکس را تشخیص دهد. اگر قصد داشته باشید در میان عکسی از ازدحام مردم،‌ چهره‌ی کودکی را تشخیص دهید، باید نرم‌افزار، چهره‌ها را براساس سن مرتب‌سازی کند. در نهایت شما به الگوریتمی نیاز دارید که هر چهره را با عکسی دیگر که در پایگاه داده قرار دارد، مقایسه کند؛ احتمالاً با روشنایی‌ متفاوت و زاویه‌های متغیر.

iPhone X Face ID

برای بهبود این الگوریتم‌ها، پژوهشگران باید از نظرسنجی‌ها و جمعیت‌شناسی دانشمندان استفاده کنند. هنگامی که به نرم‌افزار تشخیص چهره، در مورد نژاد، جنسیت و سن آموزش داده شود، برخی از وظایف به‌طرز مشخصی بهتر اجرا می‌شوند. انیل جین، پژوهشگر بیومتریک دانشگاه ایالتی میشیگان می‌گوید:

این نتیجه‌ای شگفت‌آور نیست. [واضح است که] اگر شما زیرشاخه‌های جمعیت را مدل‌سازی کنید، نتایج بهتری خواهید داشت.

نتایج بهتر همان‌ چیزی است که باعث دستگیر نشدن اشتباه افراد توسط پلیس می‌شود.

رسیدن به این مورد خیلی هم ساده نیست. داده‌های جمعیت‌شناختی ممکن است که به دقت الگوریتم‌ها کمک کند، اما استفاده از آن‌ها را پیچیده‌تر می‌کند.

نمونه‌ی اخیر این مورد را می‌توان در پژوهش دانشگاه‌ها یافت. پژوهشگران دانشگاه سورِی بریتانیا و جیانگنان چین برای بهبود عملکرد الگوریتمی تلاش می‌کنند که در اپلیکیشن‌های به‌خصوصی برای تشخیص چهره استفاده می‌شود. مبنای کارکرد این الگوریتم براساس مدل‌های سه‌بعدی است. توسط این الگوریتم، تصاویر سلفی شما در کسری از ثانیه به مدل سه‌بعدی دیجیتالی تبدیل می‌شود. از این رو، شما می‌توانید زوایای مختلف صورت‌تان را در عکس‌های سلفی مشاهده کنید. آیفون X و اپلیکیشن اسنپ‌چت از همین مدل سه‌بعدی استفاده می‌کنند.

پژوهشگران چند ساز و کار پایه‌ای را برای الگوریتم‌شان تعریف کرده‌اند. آن‌ها برای تسریع این روند، میانگین چهره افراد را مشخص می‌کنند. برای نمونه، میانگین طول بینی، مردمک چشم و اندازه‌ی گونه را از طریق مدل سه‌بعدی، اسکن می‌کردند. سپس برای تسریع روند محاسبه این فواصل، این مدل را تبدیل به مدلی دو بعدی از سر و صورت می‌کردند؛ با این کار روند زمان‌بری که در گذشته برای اسکن سر طی می‌شد، تا حد ممکن کاهش یافته است. پس از گردآوری اطلاعات بالا، آن‌ها فارغ از نژاد، جنسیت یا سن، اقدام به محاسبه‌ی میانگین چهره‌ها می‌کنند.

تشخیص هوشمند

الگوی آن‌ها از ۹۴۲ چهره تشکیل می‌شود که توسط پژوهشگران چین و بریتانیا گرد‌آوری شده بود. حال مسئله نژاد‌ها رخ می‌نماید و آن‌ها به‌جای آن‌که به یک‌باره اقدام به میانگین‌گیری تمام این چهره‌ها کنند، مدل‌ها را براساس نوع نژاد تفکیک کردند. در ادامه‌ی این روند، آن‌ها برای نژاد‌های آسیایی، سفید پوست و سیاه‌ پوست، اقدام به تعریف میانگین‌های اختصاصی کردند. با وجود اینکه در بین مدل‌ها تنها ۱۰ چهره‌ی سیاه‌پوست، ۱۰۰ چهره سفید پوست و ۸۰۰ چهره آسیایی قرار داشت، نتیجه‌ی کار الگوریتم تشخیص چهره به‌طرز ملموسی دقیق‌تر شد.

ژنهوا فنگ، دانشمند علوم رایانه می‌گوید:

[این موضوع فقط به] نوع نژاد‌ها مربوط نبود. اگر شما مدل یک نوزاد را نیز داشتید، می‌توانستید چهره‌ی سه‌بعدی نوزاد را بهتر بسازید.[همین‌طور] اگر مدلی برای افراد کهنسال داشتید، می‌توانستید مدل سه‌بعدی بهتری از آن چهره بسازید.

بنابراین اگر صریحاً نرم‌افزار بیومتریک را درباره‌ی دسته‌های اجتماعی مختلفی برنامه‌ریزی کنید، نتیجه‌ی کار بسیار بهتر می‌شود. امروزه الگوریتم‌های رایج تشخیص چهره، از اسکن‌های دو‌ بعدی استفاده می‌کنند؛ زیرا کار کردن با مدل‌های سه‌بعدی به‌مراتب دشوارتر است.

هنگامی که به نرم‌افزار تشخیص چهره، در مورد نژاد، جنسیت و سن آموزش داده شود، برخی از وظایف به‌طرز مشخصی بهتر اجرا می‌شوند.

در بین معدود الگوریتم‌های اسکن سه‌بعدی چهره، مدل «شخص‌محور» رایج‌ترین آن‌ها است. در این مدل براساس اینکه افراد درون عکس چه جنسیت و سنی دارند، نرم‌افزار شروع به تفکیک و دسته‌بندی می‌کند. محققان باور دارند که برای الگوریتم‌های یادگیری ماشینی دو بعدی که حضور یک فرد در دو عکس را تأیید می‌کنند، با از بین‌بردن مشخصه‌های ظاهری مانند رنگ پوست، نژاد، جنسیت و…، همچنان می‌توان به نتایج دقیقی دست پیدا کرد.

حال اگر در مورد نژاد به یک الگوریتم آموزش دهید، آیا آن را نژاد پرست می‌کنید؟ پاسخ خیر است!

الوندرا نلسون، جامعه‌شناس دانشگاه کلمبیا است که درباره‌ی اصول اخلاقی تکنولوژی‌های جدید تحصیل کرده است. دانشمندان علوم اجتماعی برای چگونگی ساختار جوامع، همواره در حال طبقه‌بندی داده‌های جمعیت‌شناسی هستند. به عنوان مثال، جامعه‌شناسان اغلب رفتارهای جنسیتی یا نژادی را تحلیل می‌کنند. نلسون می‌گوید:

ما در جهانی زندگی می‌کنیم که از نژاد برای هر چیزی استفاده می‌شود.

با این حال، نلسون در ادامه به استفاده دانشمندان از نژاد به‌جای دیگر مشخصه‌ها اشاره می‌کند. به‌باور او، ممکن است متغیرهای دیگر با پتانسیل کمتر برای تبعیض یا تعصب، به‌همان اندازه تأثیرگذار باشند که شاخصه‌های جنسیتی و نژادی مؤثر هستند.

نلسون به محققان درباره‌ی تأثیر احتمالی کارهایشان گوشزد می‌کند؛ به‌ویژه آن‌دسته کارهایی که ممکن است توسط دولت‌ها و نهادهای قدرت‌مند مورد استفاده قرار گیرد. سال گذشته، اف‌بی‌آی فیلم‌های نظارتی‌ را که برای رصد اعتراضات سیاه‌پوستان بالتیمور ثبت کرده بود، منتشر کرد؛ پلیس ایالتی این شهر از سال ۲۰۱۱ میلادی از تکنولوژی تشخیص چهره استفاده می‌کند.

نلسون به عنوان کلام آخر می‌گوید:

از آنجایی که این کار از لحاظ فنی پیچیده‌تر می‌شود، محققان [علاوه‌ بر] جنبه فنی، باید به جنبه‌ی اخلاقی نیز بپردازند.

منبع: زومیت