چگونه اپل با صدای سوزان بنت به سیری جان بخشید

گوینده‌ی معروف، سوزان بنت در مصاحبه‌ای که در ماه اکتبر سال ۲۰۱۳ با سی‌ان‌ان (CNN) کرد، درباره‌ی ضبط صدا برای شرکت اپل که بعدا در دستیار صوتی معروف اپل سیری (Siri) از آن استفاده شد، سخن گفت.

مقاله‌های مرتبط:

در مصاحبه‌ی جدیدی که در جمعه‌ی گذشته در وبسایت تایپ فورم (Typeform) منتشر شد، بِنِت درباره‌ی جزئیات بیشتری از ضبط صدا توسط اپل صحبت کرد. همچنین توضیح داد که چرا قرارداد پنج ساله‌ای که از طرف اپل به او پیشنهاد شده بود را رد کرد. بنت پس از حاضر نشدن فردی که برای مصاحبه ضبط صدا به اپل دعوت شده بود، به عنوان صدای رسمی اپل استخدام شد. به دلیل فعالیت محرمانه‌ی اپل، سوزان بنت فکر می‌کرد صدا را برای یک پیامگیر هوشمند تلفنی ضبط می‌کند.

در قسمتی از این مصاحبه با سوزان بنت آمده است:

من از این که به عنوان صدای دستیار صوتی اپل انتخاب شدم، بسیار خوشحال هستم؛ ولی مساله‌ای که در این رابطه من را آزار می‌دهد، عدم توجه کاربران به صدای دستیار صوتی است. آن ها صرفا هنگام کار با سیری به دنبال اطلاعات مورد نظرشان هستند.

او در ادامه گفت:

وقتی صدای ناشناخته من برای مردم صدای سیری‌ شد که در طول روز با آن سروکار دارند و مثل یک انسان با آن صحبت می‌کنند، ناگهان انگار من همان سیری بودم. ما انسان‌ها این مساله که ابدی باشیم را دوست داریم.

فرایند ضبط صدا برای سیری «ترکیب» نامیده می‌شود. کلمات و جمله‌هایی که در ابتدا ضبط شده‌اند توسط یک سیستم به یکدیگر متصل می‌شوند و جمله‌های جدید را می‌سازند. به این ترتیب نیازی نبود بنت تمام جمله‌هایی که توسط سیری گفته می‌شود را ضبط کند.

او در مصاحبه گفت:

من فکر می‌کردم برای یک شرکت تبدیل متن به گفتار این صدا‌ها را ضبط می‌کردم و در واقع این کار کاملا برای من جدید بود. من واقعا هیچ ایده‌ای نداشتم که چرا این صدا‌ها را ضبط می‌کردم و فکر می‌کردم آن‌ها برای تبدیل متن به گفتار در یک سیستم تلفنی جدید باشد.

siri

در نهایت سوزان بنت بیش از هزاران کلمه و جمله را برای ساختن تمام ترکیب های معنی دار در زبان انگلیسی، ضبط کرد. او در این باره گفت «در زبان انگلیسی بیش از یک میلیون کلمه وجود دارد، پس شاید بتوانید تصور کنید این کار چقدر طول کشید و چه‌قدر طاقت فرسا بود.» در ادامه اضافه کرد «سیری اولین صدای ترکیبی بود که کاملا طبیعی به نظر می‌رسید.»

ضبط صدای سوزان بنت برای اولین بار از سال ۲۰۰۵ شروع شد. قبل از این که آیفون متولد شود. در ابتدا روند ضبط صدا حدود یک ماه طول کشید و پس از آن چند ماه در سال های ۲۰۱۱ و ۲۰۱۲ برای تکمیل صدا‌های ضبط شده ادامه پیدا کرد.

سوزان بنت برای ضبط صدا ۵ روز در هفته و روزی ۴ ساعت در استدیوی ضبط صدا حضور پیدا می‌کرد و در طی کل این مدت هیچ ایده‌ای نداشت که واقعا سیری چه چیز‌هایی قرار است بگوید؛ چون صداها بعدا برای به وجود آمدن صدای سیری با یکدیگر ترکیب شدند.

به عقیده‌ی بنت شخصیت شوخ و در عین حال فرمان‌بردار سیری باعث محبوبیت آن شده است. او گفت: «قبل از سیری صداهای ترکیبی خیلی مصنوعی و ربات گونه به نظر می‌رسیدند که باعث می‌شد خیلی بین مردم محبوب پیدا نکنند.»

اپل بعدا افراد دیگری را برای آموزش زبان‌ها و لهجه‌های جدید استخدام کرد که بعضی از آن‌ها شامل جان بریگز، اولین صدای مرد سیری با لهجه‌ی انگلیسی و کارن یاکوبسن، صدای رسمی سیری در استرالیا می‌شود.

در نهایت سوزان یک قرارداد پنج ساله که از طرف اپل به او پیشنهاد شده بود را رد کرد. او بعدا علت عدم همکاری بیشتر با اپل را روند کاملا غیرخلاقانه‌ی ضبط صدای سیری عنوان کرد.

از iOS 7 به بعد صدا‌ی اولیه‌ی سیری در آیفون‌های جدید تغییر کرد. اپل هیچ وقت تایید نکرد که صدای سیری صدای سوزان بنت بوده است و هیچ مبلغی بیش از مبلغ مشخص ساعتی قرارداد به او پرداخت نکرد. ولی شناخته شدن سوزان بنت به عنوان صدای سیری در معروف شدن او و برای ادامه‌ی شغل حرفه‌ای او به عنوان گوینده بسیار موثر واقع شد.

منبع: زومیت