Podcastle запускає додає більш ніж 450 голосів ШІ

0
274 views
Podcastle запускає додає більш ніж 450 голосів ШІ

Платформа для запису та редагування подкастів Podcastle приєднується до інших компаній у перегонах з перетворення тексту в мовлення на основі штучного інтелекту, випустивши власну модель під назвою Asyncflow v1.0. Також буде доступний API для розробників, який дозволить їм безпосередньо інтегрувати модель перетворення тексту в мовлення у свої додатки.

Завдяки новій моделі компанія може запропонувати понад 450 голосів зі штучним інтелектом, які можуть озвучити ваш текст. Стартап заявив, що розробив технологію та модель таким чином, щоб витрати на навчання та висновки були низькими, що дає йому перевагу перед конкурентами.

Цим кроком Podcastle приєднується до низки стартапів, серед яких ElevenLabs, Speechify та WellSaid, які розробили технологію та моделі штучного інтелекту для перетворення будь-якого типу тексту на голосовий кліп, озвучений штучним інтелектом. Ця технологія охоплює такі сфери використання, як маркетинг, реклама, створення контенту, освіта та корпоративне навчання.

Засновник Podcastle Арто Єріцян розповів TechCrunch, що компанія завжди хотіла побудувати модель перетворення тексту в мовлення, але вартість навчання та вимоги до даних для цього були дуже високими.

“Ми хотіли побудувати надійну модель перетворення тексту в мовлення з моменту нашого заснування. Однак витрати на розробку були дуже високими. Завдяки нещодавнім великим розробкам мовних моделей ми змогли досягти прориву в минулому році, щоб дістатися до місця, де ми могли побудувати високоякісну модель голосу, не потребуючи тонни даних”, – сказав Єріцян.

Компанії також допомогло залучення 13,5 мільйонів доларів США в рамках серії А минулого року.

Єріцян каже, що в той час як Podcastle бере близько 40 доларів за 500 хвилин перетворення тексту в мову, ElevenLabs бере 99 доларів за те ж саме.

Функція клонування голосу в Podcastle також отримає оновлення, щоб пришвидшити процес навчання.

Раніше процес навчання передбачав читання приблизно 70 різних речень. Тепер для створення клону вашого голосу потрібно лише кілька секунд запису від вас. Новий процес також використовує штучний інтелект Magic Dust AI від Podcastle, який був випущений минулого року, щоб покращити якість аудіозапису.

У нашому тестуванні голос, створений за допомогою нового процесу, звучав дещо роботизовано, хоча й імітував нашу інтонацію. У компанії запевняють, що з часом вдосконалять цю функцію. Крім того, ви можете тренувати різні зразки свого голосу, щоб отримати різні результати.

У Podcastle кажуть, що, окрім витрат, наявність інструментів для аудіо, відео, подкастів та дикторського супроводу на одному оновленому сайті дасть їм перевагу над конкурентами. Єріцян каже, що хоча більшість користувачів використовують Podcastle для роботи з аудіоконтентом, відео також наздоганяє їх.