گوگل دوپلکس و نگاهی عمیق‌تر به قابلیت‌ها و مسیر پیش روی این سرویس

گوگل پس از گذشت یک ماه از کنفرانس I/O و معرفی سیستم هوش مصنوعی دوپلکس خود، تعداد محدودی خبرنگار را در یک رستوران تایلندی در شمال منهتن جمع کرد تا توضیحات بیشتری در مورد عملکرد و برنامه‌های پیش رو برای این سرویس ارائه کند. این شرکت در جلسه‌ی کوچک خود در این رستوران، تعداد کمی خبرنگار از رسانه‌های مشهور (مانند تک‌کرانچ) را گردهم جمع کرد تا در کنار برخی کارمندان خود، قابلیت‌های این سرویس را شبیه‌سازی کند.

این جلسه نشان داد که اهالی مانتین ویو برای ارائه‌ی توضیحات بیشتر در مورد سرویس جدید خود، اهداف آن و عملکرد عوامل پشت صحنه‌ی دوپلکس آماده هستند. در همان ابتدای جلسه صاحب رستوران فانتزی تایلندی در نیویورک به کارمندان گوگل و خبرنگاران گفت که این فناوری کمک شایانی به سیستم رزرواسیون آنها خواهد کرد که روزانه پذیرای بیش از ۱۰۰ تماس تلفنی رزرو هستند.

معرفی انجام شده توسط ساندار پیچای در کنفرانس ماه گذشته، بیش از توضیح در مورد Duplex، سوالات پیرامون آن را افزایش داد. اولین نگرانی‌ها نیز در مورد ارزش‌های اخلاقی شکل گرفت که توسط این سیستم زیر پا گذاشته خواهد شد. منتقدین معتقد بودند که این سرویس برای فریب دادن کارمندان کسب‌وکارها با این تصور که با فردی واقعی صحبت می‌کنند،‌ طراحی شده است.

گوگل دوپلکس

مقاله‌های مرتبط:

نکته‌ی قابل ذکر این که دوپلکس تنها نگاهی اولیه به پروژه‌ای در حال اجرا توسط گوگل است. شرکتی که تاکنون به‌خاطر سرّی نگاه داشتن بسیاری اطلاعات پروژه‌ها از مردم و کاربران، سابقه‌ی خوبی ندارد. در نتیجه شفاف‌سازی این شرکت در مورد پروژه‌ی در حال اجرا، کلید موفقیت آنها خواهد بود. راه‌حل اصلی، آزمایش واقعی قابلیت‌های این سیستم است تا مانند خودروهای خودران، تمامی پیچ‌وخم‌های اجرایی آن مشخص شود.

گوگل در روز برگزاری این جلسه‌ در یک پست وبلاگی نوشت:

ما هنوز تصمیمی برای عرضه‌ی عمومی این قابلیت نداریم. البته با برگزاری جلسه‌ی معرفی بیشتر قصد داریم در این مورد شفاف‌سازی کنیم و هرگونه بازخورد از طرف کاربران و خبرنگاران را نیز با کمال میل می‌پذیریم. نکته‌ی مهم این است که تجربه‌ی مناسب هم برای کاربران و هم برای کسب‌وکارها رقم بخورد. ما به آهستگی روند توسعه‌ی این قابلیت را پیش می‌بریم و در این مسیر از بازخوردها و نکات دریافت شده استفاده می‌کنیم.

طبیعت گوگل در معرفی محصولات جدید، جلب توجه با استفاده از هر روش ممکن است. به‌همین دلیل آنها دوپلکس را در کنفرانس I/O که یکی از مهم‌ترین رویدادهای شرکت است، معرفی کردند. با این کار آنها علاوه بر قرار گرفتن در مرکز توجه، دیدی کلی نسبت به سرویس خود ارائه کردند. ساندار پیچای در زمان معرفی دوپلکس گفت: «آن‌چه که می‌شنوید، دریافت نوبت توسط دستیار گوگل است»:

دستیار گوگل: سلام، من برای تنظیم یک نوبت آرایش زنانه برای یک مشتری تماس می‌گیرم. ام، لطفا تاریخ سوم می را بررسی کنید.

منشی: حتما، لطفا چند لحظه صبر کنید.

دستیار گوگل: اوهوم.

مکث در میان مکالمه و کلمات نامفهوم، وجه تمایز دوپلکس با رقبای مشابه است

در این لحظه بود که حضار جلسه با ناباوری به پاسخ دستیار گوگل خندیدند و بلافاصله عملکرد آن را تشویق کردند. قطعا حضار از لحن پاسخگویی دستیار گوگل به وجد آمدند؛ اما در نهایت ذهن آنها، نمی‌توانست قبول کند که این صدا از یک دستیار هوشمند کاملا اتوماتیک خارج می‌شود. کلمه‌ی «اوهوم» مانند تزئینی روی یک محصول زیبا عمل کرد. این صداها عموما برای ایجاد وقفه و سپس ادامه‌ی مکالمات به کار می‌روند. همین نکات ریز باعث شد که منشی آرایشگاه، متوجه نشود که در حال صحبت با یک ربات است.

گوگل دوپلکس

در زبان‌شناسی به کلمات و عبارات مشابه «اوهوم»، اختلالات صحبت کردن می‌گویند که مانند مکثی در میان صحبت‌ها استفاده می‌شوند. این نوع از اختلالات در صحبت‌های انسان‌ها طبیعی است و استفاده از آن در هوش مصنوعی دوپلکس، افزودنی جذابی است که آن را به محصولی قابل توجه تبدیل می‌کند. علاوه بر آن این عبارات نوعی راه‌حل مودبانه در زمان اجرای وظایف سیستم هستند.

به‌عنوان مثال اگر دوپلکس با پاسخی نامشخص در زمان رزرو کردن رستوران برای میهمانی پنج نفره روبرو شود، درخواست خود را بار دیگر با کمی تغییر و استفاده از عبارتی همچون «ام، برای پنج نفر» تکرار می‌کند. این نوع از صحبت کردن به احتمال زیاد سردرگمی را در سمت منشی انسانی رستوران یا هر محل دیگر حل می‌کند و علاوه بر آن، با اضافه کردن یک بخش کوچک به صحبت‌ها و کلمات، حس واقعی بودن آن را بیش از پیش منتقل می‌کند.

خبرنگار تک‌کرانچ که در جلسه‌ی اخیر گوگل حضور داشته اعلام می‌کند که این بخش‌های کوچک و نامفهوم در صحبت کردن دوپلکس کاملا وجود داشته‌اند. او در مورد دموهای پخش شده در رستوران تایلندی نیز می‌گوید که پاسخ‌های کاملا طبیعی و واقعی بوده‌اند.

به‌هر حال گوگل دوپلکس یک پروژه‌ی درحال اجرا و بهبود است. یکی از نکاتی که در روز ارائه‌ی اولیه به آن اشاره نشد، نحوه‌ی عملکرد این سیستم در برابر قانون Two Party Consent است. این قانون در بسیاری از ایالت‌های آمریکا اجرا می‌شود و ضبط کردن مکالمات تلفنی را تنها با کسب مجوز از هر دو طرف درگیر در مکالمه مجاز می‌داند. ایالت‌هایی همچون کنتیکت، فلوریدا، ایلینویز، مریلند، ماساچوست، مونتانا، نیوهمپشایر، پنسیلوانیا، واشنگتن و کالیفرنیا این قانون را اجرا می‌کنند.

گوگل دوپلکس

مجوز ضبط مکالمه توسط هر دو طرف، یکی از چالش‌های قانونی دوپلکس است

برخی کارشناسان معتقدند این چالش‌های قانونی فراتر از دوپلکس هستند و به‌طور کلی ماشین‌های سخنگو را تحت تاثیر قرار می‌دهند. سوال اصلی این است که حتی در صورت موافق بودن کاربر با ضبط شدن صدا، آیا ماشین بودن یک طرف این مکالمه موجب بی‌اعتبار شدن قانون نخواهد شد؟ به‌هر حال در آینده این سرویس تنها در ایالت‌های مجاز آمریکا اجرا خواهد شد اما مدیر بخش دستیار گوگل اعلام کرده که آنها تلاش می‌کنند عملکرد این سیستم در هر مکان، پیرو قوانین موجود در آنجا باشد.

شفاف‌سازی عملکرد دوپلکس در ارائه‌ی اولیه مشخص نبود؛ اما گوگل از همان ابتدا اعلام کرد که این موارد را به‌مرور به سیستم اضافه خواهد کرد. البته انگیزه آنها برای اضافه کردن این موارد، تنها نگرانی از واکنش‌های قانونی نبود. واکنش‌هایی که عموما در برابر ارتباط میان انسان و ربات ایجاد می‌شود. این شرکت در همان روزهای اولیه‌ی معرفی در یک پست وبلاگی نوشت:

گوگل دوپلکس به‌‌‌گونه‌ای طراحی شده تا طبیعی به نظر برسد و تجربه‌ی دلپذیری از مکالمه ایجاد کند. تجربه‌ی مناسب کاربران و کسب‌وکارها در استفاده کردن از این سرویس، هدف نهایی ما است. برای رسیدن به این هدف، شفاف‌سازی یکی از نیازهای اساسی است. ما می‌خواهیم در مورد هدف تماس شفاف باشیم تا شرکت مخاطب متوجه موضوع اصلی آن باشد. ما در ماه‌های آینده تجربه‌های جدیدی در این مورد خواهیم داشت.

سوال اصلی خبرنگاران، نوع شفاف‌سازی پیاده‌سازی شده توسط این سیستم بود. یکی از سخنگوهای گوگل در پاسخ به این سوال در جلسه‌ی اخیر گفت:

همان‌طور که از روز اول گفته شد، ما بحث و گفتگو و نگرانی‌ها پیرامون گوگل دوپلکس را درک می‌کنیم. شفاف‌سازی در فناوری بسیار مهم است. ما عبارت‌های شفاف‌سازی را در طراحی این سرویس لحاظ کرده و اطمینان حاصل می‌کنیم که سیستم، کاملا قابل شناسایی باشد. بخشی که در کنفرانس I/O نشان دادیم تنها یک دموی اولیه از فناوری بود و قطعا ما در مسیر توسعه‌ی این سرویس، از بازخوردها استفاده خواهیم کرد.

دستیار گوگلدر نسخه‌ی کنونی دوپلکس، دستیار صوتی در ابتدای تماس خود را به‌عنوان گوگل اسیستنت معرفی کرده و سپس به ضبط شدن صدا اشاره می‌کند. اگرچه این مکالمه اشاره‌ای به هوش مصنوعی بودن دوپلکس نمی‌کند اما اگر آشنایی کلی با دستیار گوگل داشته باشید، در همان ابتدا متوجه این حقیقت می‌شوید. گوگل، مکالمه را به‌منظور پیاده‌سازی در سیستم صوت به متن و همچنین کنترل کیفیت سرویس به‌منظور پیشرفت‌های آتی ضبط می‌کند.

نسخه‌ی کنونی ابتدا خود را به‌عنوان دستیار معرفی کرده و اعلام می‌کند که مکالمه ضبط می‌شود

در حال حاضر دوپلکس تنها یک بار در ابتدای مکالمه‌ی تلفنی به ماشین بودن خود اشاره می‌کند و در صورتی که منشی متوجه این عبارت نشود، آن را تکرار نمی‌کند. مورد بعدی این است که تنها روش برای رد کردن درخواست ضبط مکالمه، قطع کردن آن است که البته روش مناسبی برای ارتباط با مشتری نیست. البته معاون فناوری گوگل اسیستنت، اسکات هافمن گفته که در حال پیاده‌سازی روندی برای حل این مسئله هستند. با پیاده‌سازی این راه‌حل، در صورت رد درخواست برای ضبط کردن مکالمه از طرف منشی، دستیار گوگل این تصمیم را پذیرفته و اعلام می‌کند که مکالمه ضبط نخواهد شد. البته آنها هنوز در حال تصمیم‌گیری بین قطع کردن تماس یا لغو سیستم ضبط مکالمه در این شرایط هستند.

در جلسه‌ی ارائه‌ی دمو برای خبرنگاران، اکثر آنها تلاش کردند که سیستم را دچار اشتباه کنند یا پاسخ‌هایی خارج از عرف به دوپلکس بدهند. به‌هرحال در چنین مواردی دوپلکس تماس را با احترام پایان داد. در شرایط دیگر نیز که سیستم دچار سردرگمی می‌شد، یکی از اپراتورهای حاضر در جلسه، مدیریت آن را به دست گرفته و چالش را رفع می‌کرد. گوگل اعلام کرده که این اپراتورها در مراحل آزمایشی و در ابتدای عرضه‌ی این سیستم حضور خواهند داشت تا از مشکلات احتمالی پیشگیری کنند. سوال جالب این که این گروه از اپراتورها تا پیش از پایانی شدن ارائه‌ی دوپلکس، چند نفر خواهند شد؟

google assistant

در جلسه‌ی آزمایشی با حضور خبرنگاران، آنها موفق به کشف برخی محدودیت‌های این سرویس شدند. به‌عنوان مثال وقتی از دوپلکس خواسته شد که چهار رقم آخر شماره تلفن خود را تکرار کند، او کل شماره را تکرار کرد. اگرچه این مشکل، اساسی نیست اما ضعف‌های کلی سیستم را در تشخیص ریزه‌کاری‌های مکالمه‌ی انسانی نشان می‌دهد. در مثالی دیگر، آدرس ایمیل از دوپلکس پرسیده شد و در پاسخ، دستیار گوگل اعلام کرد که اجازه‌ی انشار چنین اطلاعاتی را از سمت کاربر ندارد. نکته‌ی دیگر این که سیستم در مواجه با منشی تلفنی و خدمات تلفن گویا دچار سردرگمی می‌شود.

گوگل اعلام کرده که دوپلکس در حال حاضر توانایی انجام چهار وظیفه از پنج وظیفه‌ی اتوماتیک محول شده را دارد. این اعداد، دقت ۸۰ درصد را نشان می‌دهد که نسبتا خوب است اما گوگل تلاش می‌کند تا آمار را بهبود ببخشد. مدیر بخش دستیار گوگل می‌گوید که سیستم آنها باید با حداقل تلف کردن زمان کسب‌وکار مورد نظر عمل کند. او می‌خواهد کسب‌وکارها تجربه‌ی مناسبی از این تماس داشته باشند و صحبت کردن با یک دستیار هوشمند، دردسری جدید در کنار چالش‌های دیگر روزمره‌شان نباشد.

دقت اجرای فرامین در دوپلکس در حال حاضر ۸۰ درصد پیش‌بینی شده است

همان‌طور که در روز معرفی اعلام شد، آزمایشات پیشرفته در تابستان سال جاری روی این سرویس انجام خواهد شد. مرحله‌ی بعدیِ تماس‌های دوپلکس، سوال در مورد ساعات کاری، سپس رزرو رستوران و تنظیم وقت برای آرایشگاه‌ها است. این مراحل با آزمایش‌کنندگان واقعی و گلچین شده‌ی گوگل انجام خواهد شد. 

آمارها نشان می‌دهد شرکت‌ها با اشتیاق به‌دنبال این سرویس هستند. طبق اعلام گوگل بر اساس تحقیقات انجام شده در ماه آوریل، ۶۰ درصد از کسب‌وکارهای کوچک که خدمات نیاز به رزرواسیون ارائه می‌دهند،‌ سیستم آنلاین برای این منظور ندارند. عرضه شدن دوپلکس هم برای کاربرانی که وقت برای برقراری تماس ندارند و هم این کسب‌وکارها مفید خواهد بود.

سیستم رزرواسیون هوشمند دوپلکس مسیری طولانی را طی کرده و امروز به آزمایش‌های اولیه رسیده است. این سیستم ترکیبی از فناوری‌های تبدیل صوت به متن،‌ متن به صوت و شبکه‌ی عصبی پردازش صوت گوگل به نام WaveNet است. اگرچه دموهای اولیه‌ی این سیستم بر خلاف تصور عموم، زنده نبودند، اما واقعی بودند. به هر حال خبرها در این حوزه امیدوارکننده هستند و با نزدیک شدن به زمان عرضه‌ی نهایی دوپلکس،‌ هیجان پیرامون این سرویس روز به روز افزایش می‌یابد.

منبع: زومیت