140

Posted on Mon 07 November 2016

شرکت Adobe در جریان کنفرانس Max ، تکنولوژی جدیدی به اسم پروژه VoCo رو معرفی کرده که برای ادیت کلماتی که در یک فایل صوتی گفته شده به کار میره و به فتوشاپ برای گفتار معروف شده!

این تکنولوژی اینجوری کار میکنه که فایل صوتی (که فعلا حداقل باید 20 دقیقه از صدای شخص موردنظر باشه) رو به عنوان داده ورودی میگیره. این صوت رو به کوچکترین واحد کلامی که بهش واج میگن، تجزیه میکنه و براساس اون یه مدل از صدای اون شخص تولید میکنه.

در مرحله بعدی این برنامه به کاربر یه تکست باکس میده که کلماتی که شخص موردنظر تو فایل صوتی گفته رو اونجا به صورت متنی نشون میده. کاربر میتونه ازادانه هر جای صحبت شخص رو ادیت کنه. اگه کلماتی که جایگزین میشن قبلا تو اون 20 دقیقه بودن صرفا کلمات جابجا میشن ولی اگه کلمات جدید کلا تو اون 20 دقیقه نبودن براساس اون مدلی که این برنامه از صوت شخص ساخته، برنامه میتونه براساس واج ها کلمه موردنظر رو با صدای شخص بسازه!

چنین تکنولوژیی کاربردهای زیادی داره ولی کاربردهای مضرش از الان تو ذهن همه اومده بنابراین ادوبی از الان به فکر استفاده های مضرش هست و با چیزایی مثل واترمارک کردن صوت و حتی تشخیص چنین کاربردهای مضری، میخواد جلوی چنین استفاده هایی رو بگیره.
ممبع

HTML Comment Box is loading comments...