هوش مصنوعی whisper
بررسی کلی
آخرین آپدیت: 1402/04/15
محصول جدید شرکت OpenAI، هوش مصنوعی whisper بوده که ابزاری برای تبدیل صوت به متن است. این ابزار هوشمند به صورت متن باز ارائه میشود و برنامه نویسان میتوانند تغییرات دلخواه را روی آن اعمال کنند. یکی از ویژگیهای جذاب این ابزار برای ما ایرانیان، پشتیبانی از زبان فارسی است. ابزار whisper به برنامه نویسان امکان تبدیل فایلهای صوتی به فرمتهای مختلف متنی مانند اس آر تی (srt) و تکست (txt) را فراهم میکند.
هوش مصنوعی whisper
خیلی از مواقع ملزم به تبدیل فایل صوتی به متن هستیم. تصور کنید که چندین ساعت و حتی چندین روز را اختصاص به تایپ فایلهای صوتی کنیم! چه شرایط سخت و طاقت فرسایی به نظر میرسد.
هوش مصنوعی وارد این حوزه نیز شده است و ابزارهایی را توسعه داده تا افراد بتوانند بدون تایپ، فایلهای صوتی خود را به متن تبدیل کنند. یکی از ابزارهای بسیار کاربردی در این زمینه که در اسفند ماه ۱۴۰۱ توسعه یافته، ابزار هوش مصنوعی whisper است.
whisper توسط بزرگترین شرکت هوش مصنوعی، OpenAI سازنده chatGPT، توسعه یافته است. این ابزار به کاربران کمک میکند تا فایلهای صوتی خود را در کمترین زمان ممکن به متن تبدیل کنند. از آن جایی که این ابزار به صورت اپن سورس طراحی شده است، برنامه نویسان میتوانند تغییرات دلخواه را روی آن اعمال کرده و برای استفاده شخصی و حرفهای خود استفاده کنند.
مزیت ها و قابلیت های ابزار whisper
جالب است بدانید که ابزار هوش مصنوعی whisper از بیش از ۹۸ زبان زنده دنیا پشتیبانی میکند که زبان فارسی نیز جزو این زبانها است. همچنین این ابزار میتواند بین زبانها ترجمه نیز انجام دهد.
برخلاف سیستمهای رونویسی قدیمی، whisper یک راه حل هوش مصنوعی است. این ابزار بر روی بیش از ۶۸۰ هزار ساعت گفتار به زبانهای مختلف آموزش داده شده است. بنابراین دقت بالایی از این ابزار انتظار میرود.
در مورد دقت تبدیل صوت به متن باید بگوییم که در زبان انگلیسی حدود ۴.۲ خطا وجود دارد؛ این عدد بسیار خوبی است. در واقع میتوانیم ادعا کنیم که درصد خطای این برنامه بسیار کم است، اما این مورد برای زبان فارسی صدق نمیکند. به گزارش رسانه تک توب درصد خطای زبان فارسی ۳۲.۹ است که عدد خوبی به نظر نمیرسد.
کاربرد ابزار whisper
اعمال زیرنویس کردن فیلمها برای خیلی از ما کار سختی به شمار میآید، اما با وجود ابزارهای مختلف هوش مصنوعی سختی کار از بین رفته است و در عرض چند ثانیه میتوان فیلمها را زیرنویس کرد. با کمک ابزار whisper میتوان مطالب بیان شده در کلاس، جزوه تهیه کرد. در واقع دانشجویان و دانش آموزان میتوانند از طریق این ابزار کلاسهای درسی خود را به متن و جزوه تبدیل کنند.
استفاده از ابزار هوش مصنوعی whisper برای عموم مردم رایگان است، اما اگر برنامه نویسان بخواهند استفاده بسیار حرفهای از آن بکنند، باید مبلغی را پرداخت نمایند.
آینده whisper
اگر شرکت سازنده whisper قادر به وارد کردن ابزار whisper به بازار برنامههای speech-to-text شود، سود زیادی را تحت حمایت مایکروسافت نصیب خود خواهد کرد. بر اساس گزارشهای موجود، ارزش بازار speech-to-text در سال 2026 به 5.4 میلیارد دلار خواهد رسید. قابل ذکر است که در سال 2021 ارزش این بازار 2.2 میلیارد دلار بود.
براکمن، مدیر عامل OpenAI گفت: «تصویر ما این است که ما واقعاً میخواهیم این هوش جهانی باشیم». و «ما واقعاً میخواهیم بتوانیم به شیوه بسیار انعطافپذیری، هر نوع دادهای را که در اختیار دارید، و هر کاری را که میخواهید با آن انجام دهید، با نیرویی چند برابر برایتان انجام دهیم.»
نقطه تمایز Whisper با رقبا
بنابر گفته رئیس و مدیرعامل OpenAI، گرگ براکمن، نقطه تمایز Whisper با رقبا، آموزش این ابزار بر روی 680.000 ساعت دادههای چندزبانه و multitask است. این موضوع باعث تشخیص آسانتر لهجههای منحصر به فرد، نویز پس زمینه و ویسهای تخصصی شده است.
براکمن در طی یک تماس ویدئویی با TechCrunch بیان کرد: «ما یک مدل منتشر کردیم، اما این برای ایجاد یک اکوسیستم جامع برای توسعه دهندگان کافی نبود. Whisper API همان مدل بزرگی است که میتوانید به صورت منبع باز دریافت کنید. ما آن را تا حد امکان بهینهسازی کردهایم. استفاده از این API بسیار سریعتر و آسانتر از مدلهای دیگر است.»
ویژگیها و امکانات هوش مصنوعی whisper
- رابط کاربری آسان
- اوپن سورس
- نسخه رایگان
سرعت بالا
ویژگی ها
ویژگی به عنوان ابزار هوش مصنوعی
نسخه رایگان
چت بات
تولید محتوای متنی
تولید محتوای تصویری
تولید محتوای ویدیویی
چند زبانه بودن
حوزه تجارت الکترونیک
حوزه سلامت
تجزیه و تحلیل پیش بینی
دستیار شخصی مجازی
حوزه برنامه نویسی
تولید محتوای صوتی
فرمول نویسی
قبلا از این نرمافزار استفاده کردهاید؟
نوشتن نظر