دانلود مقاله استفاده از داده های چالش MGB-2 برای ایجاد چند حالته جدید
موضوع انگلیسی:Using the MGB-2 challenge data for creating a new multimodal
زبان: انگلیسی
فرمت فایل: pdf
تعداد صفحه:10
سال انتشار:2021
چکیده
تشخیص نقش بلندگو یک جزء مهم در تجزیه و تحلیل چند رسانه ای برای برنامه هایی مانند نام بلندگو ، بلندگو است
diarization و خلاصه ویدئو. عدم وجود مجموعه داده های دارای برچسب برای این کار ، ارزیابی الگوریتم ها را محدود کرده است. در این صفحه،
ما یک مجموعه داده جدید چند حالته برای تشخیص نقش گوینده در برنامه های تلویزیونی عربی ارائه می دهیم. مجموعه داده به طور مصنوعی با استفاده از
داده های ارائه شده توسط مجموعه داده چالش پخش چند ژانری. ما همچنین الگوریتم خود را برای پردازش و ایجاد توضیح می دهیم
بخشهای بلندگو و رونوشتهای مربوط به آنها از اسناد صوتی. رونوشت گفتاری و بخش های گوینده
به طور خودکار برای نقش گوینده خود در ارائه دهنده ، گزارشگر یا سخنران مهمان یادداشت می شوند. بر اساس این حاشیه نویسی مصنوعی،
ما برای برچسب زدن نقش سخنران اهمیت در نظر گرفتن اطلاعات چندوجهی برای پیشبینی سخنران را نشان میدهیم
نقش. ما رویکردهای تشخیص نقش گوینده تک و چند حالته را در بخش های بلندگو استخراج شده از تلویزیون ارائه می دهیم
برنامهها، با خطوط پایه طبقهبندی صوتی و متنی بر روی برچسبگذاری نقش سخنران سهطرفه مجری، گزارشگر و مهمان