چگونه اپل با صدای سوزان بنت به سیری جان بخشید
اپل روند ضبط صدای سیری، دستیار صوتی خود را سالها پیش از معرفی آیفون آغاز کرده بود. در ادامه با چگونگی ضبط صدا از قول گویندهی آن بیشتر آشنا شوید.
گویندهی معروف، سوزان بنت، در مصاحبهای که در ماه اکتبر سال ۲۰۱۳ با سیانان کرد، دربارهی ضبط صدا برای شرکت اپل که بعدا در دستیار صوتی معروف اپل سیری از آن استفاده شد، سخن گفت.
در مصاحبهی جدیدی که در جمعهی گذشته در وبسایت تایپ فرم منتشر شد، بِنِت دربارهی جزئیات بیشتری از ضبط صدا توسط اپل صحبت کرد. همچنین توضیح داد چرا قرارداد پنجسالهای را که از طرف اپل به او پیشنهاد شده بود، رد کرد. بنت پس از حاضر نشدن فردی که برای مصاحبه ضبط صدا به اپل دعوت شده بود، بهعنوان صدای رسمی اپل استخدام شد. به دلیل فعالیت محرمانهی اپل، سوزان بنت فکر میکرد صدا را برای یک پیامگیر هوشمند تلفنی ضبط میکند.
در قسمتی از این مصاحبه با سوزان بنت آمده است:
من از اینکه بهعنوان صدای دستیار صوتی اپل انتخاب شدم، بسیار خوشحال هستم؛ ولی مسئلهای که در این رابطه من را آزار میدهد، عدم توجه کاربران به صدای دستیار صوتی است. آنها صرفا هنگام کار با سیری به دنبال اطلاعات مورد نظرشان هستند… وقتی صدای ناشناخته من برای مردم صدای سیری شد که در طول روز با آن سروکار دارند و مثل یک انسان با آن صحبت میکنند، ناگهان انگار من همان سیری بودم. ما انسانها این مسئله را که ابدی باشیم، دوست داریم.
فرایند ضبط صدا برای سیری «ترکیب» نامیده میشود. کلمات و جملههایی که در ابتدا ضبط شدهاند توسط یک سیستم به یکدیگر متصل میشوند و جملههای جدید را میسازند. به این ترتیب نیازی نبود بنت تمام جملههایی را که توسط سیری گفته میشود، ضبط کند.
او در مصاحبه گفت:
من فکر میکردم برای یک شرکت تبدیل متن به گفتار این صداها را ضبط میکردم و در واقع این کار کاملا برای من جدید بود. من واقعا هیچ ایدهای نداشتم که چرا این صداها را ضبط میکردم و فکر میکردم آنها برای تبدیل متن به گفتار در یک سیستم تلفنی جدید باشد.
در نهایت سوزان بنت بیش از هزاران کلمه و جمله را برای ساختن تمام ترکیبهای معنیدار در زبان انگلیسی، ضبط کرد. او در این باره گفت: «در زبان انگلیسی بیش از یک میلیون کلمه وجود دارد، پس شاید بتوانید تصور کنید این کار چقدر طول کشید و چقدر طاقتفرسا بود… سیری اولین صدای ترکیبی بود که کاملا طبیعی به نظر میرسید.»
ضبط صدای سوزان بنت برای اولین بار از سال ۲۰۰۵ شروع شد؛ قبل از اینکه آیفون متولد شود. در ابتدا روند ضبط صدا حدود یک ماه طول کشید و پس از آن چند ماه در سالهای ۲۰۱۱ و ۲۰۱۲ برای تکمیل صداهای ضبطشده ادامه پیدا کرد.
سوزان بنت برای ضبط صدا، ۵ روز در هفته و روزی ۴ ساعت در استودیوی ضبط صدا حضور پیدا میکرد و در طی کل این مدت هیچ ایدهای نداشت که واقعا سیری چه چیزهایی قرار است بگوید؛ چون صداها بعدا برای به وجود آمدن صدای سیری با یکدیگر ترکیب شدند.
به عقیدهی بنت شخصیت شوخ و در عین حال فرمانبردار سیری باعث محبوبیت آن شده است. او گفت: «قبل از سیری صداهای ترکیبی خیلی مصنوعی و ربات گونه به نظر میرسیدند که باعث میشد خیلی بین مردم محبوب پیدا نکنند.»
اپل بعدا افراد دیگری را برای آموزش زبانها و لهجههای جدید استخدام کرد که بعضی از آنها عبارتند از جان بریگز، اولین صدای مرد سیری با لهجهی انگلیسی و کارن یاکوبسن، صدای رسمی سیری در استرالیا.
در نهایت سوزان یک قرارداد پنجساله را که از طرف اپل به او پیشنهاد شده بود، رد کرد. او بعدا علت عدم همکاری بیشتر با اپل را روند کاملا غیرخلاقانهی ضبط صدای سیری عنوان کرد.
از iOS 7 به بعد، صدای اولیهی سیری در آیفونهای جدید تغییر کرد. اپل هیچوقت تأیید نکرد که صدای سیری صدای سوزان بنت بوده است و هیچ مبلغی بیش از مبلغ مشخص ساعتی قرارداد به او پرداخت نکرد. ولی شناخته شدن سوزان بنت بهعنوان صدای سیری در معروف شدن او و برای ادامهی شغل حرفهای او بهعنوان گوینده بسیار مؤثر واقع شد.