Главная Юзердоски Каталог Трекер NSFW Настройки

Искусственный интеллект

Ответить в тред Ответить в тред
Check this out!
<<
Назад | Вниз | Каталог | Обновить | Автообновление | 4 4 3
автоматический перевод и озвучка на русский полностью офлайн Стори: захотел посмотреть сериал с тра Аноним # OP 12/08/25 Втр 21:38:34 1314324 1
TheTower.png 361Кб, 512x400
512x400
The Apprentice [...].mp4 6398Кб, 512x384, 00:01:39
512x384
ADigitalMediaPr[...].webm 4519Кб, 640x360, 00:06:15
640x360
автоматический перевод и озвучка на русский полностью офлайн

Стори: захотел посмотреть сериал с трампом который оказывается никем никогда не озвучивался, и не переводился (переводился сабами несколько сезонов но похуй) так вот оказалось что нету никаких готовых инструментов в стиле "перевести 20 часов звука за ноль денег". И я подумал что это какой то бред, ведь есть ебанутая гора технологий для реализации всех этапов, бесплатно. Ну вот я и сделал, за пару дней. Перевёл-озвучил первый сезон, посмотрел, ну, так, не зашло особо. Но софт получился что надо. Поработал ещё 3 недели над ним, нашёл нейросети получше, ну и короче:

Техническая часть: Whisper + TowerPlus + Silero TTS с моей укладкой по таймингам, итого все выполняют полный цикл распознавание + перевод + озвучка. Реализовано только на процессоре потому что я нищий у меня нету видеокарты, что бы отдебажить всё это на ней, поэтому да поебать мне.

Скачать+использовать:
https://drive.google.com/file/d/1Kufx5LqKOEx67xy7NNNQjcQd5qwKJt7j/view?usp=sharing полная офлайн сборка со всем софтом и моделями, которые я довёл до простоты принципиально:
1. распакуй куда угодно
2. дропни видос в .bat
3. ??????
4. готовый файл с переводом.

https://drive.google.com/file/d/1u22DFaHRaHDb7sg-i3cxW7wfEQjJUN0z/view?usp=sharing тоже самое но без моделей Whisper + TowerPlus, их можно скачать самому здесь https://huggingface.co/DZgas/Tower-Plus-2B-GGUF/tree/main и здесь https://huggingface.co/ggerganov/whisper.cpp/tree/main
Так же можно использовать другие модели, например large v2 и towerplus 9b для более лучшего перевода, но это упирается в проц и весит дохера. Всё остальное доделывайте сами, 3 модуля, всё можно менять, всё соединяется промежуточно субтитрами, а я на вайбкодился вусмерть.
Аноним # OP 12/08/25 Втр 22:10:10 1314509 2
NUUG Meetup 201[...].mp4 20382Кб, 1280x720, 00:01:52
1280x720
Аноним 15/08/25 Птн 19:57:32 1319392 3
>>1314509
анон ты гений ебать
Аноним 15/08/25 Птн 22:21:11 1319574 4
>>1314324 (OP)

Ты крут, анон. Обычно за такие готовые решения все сразу хотят получать бабки, потому они и не выходят никогда в открытый доступ, а ты обошел систему. Побольше бы таких как ты.
Настройки X
Ответить в тред X
15000
Добавить файл/ctrl-v
Стикеры X
Избранное / Топ тредов