Привет, пидоры. / пидоры помогите (реактор помоги)

пидоры помогите 

Привет, пидоры. 

Ищу софт для перевода mp3 (а еще лучше mp4) в текст. То есть что-то вроде конспектирования лекций. Знаю, что Алиса от яндекса делает что-то подобное, но вроде там только краткий пересказ и к тому же видео нужно заливать на ютуб. Дело в том, что лекции никуда заливать нельзя в связи с NDA, да и к тому же конспекты нужны подробные, а видеозаписей там на 15+ часов. Гугл вывел меня на нейросетку whisper-jax, но как поднять ее локально не представляю. Может есть какая-то софтина или бесплатный сервис? По поводу последнего, пробовал https://huggingface.co/spaces/sanchit-gandhi/whisper-jax, но он 2 часовую лекцию не прожевал.

Прошу помощи

КУПОН НА 1 помощь,пидоры помогите,реактор помоги

Подробнее
КУПОН НА 1 помощь
пидоры помогите,реактор помоги
Еще на тему
Развернуть
гугл доками попробуй.
Так у openAI есть открытые модели для распознавания Whisper.
https://huggingface.co/openai
https://huggingface.co/openai/whisper-large-v3
(кроме них в общем то нихрена открытого у них и нет)

Так уж ли нельзя никуда заливать? А то телега умеет распознавать в премиум режиме. Ютуб может генерировать сабы. Яндекс браузер вроде умеет сабы делать. Тот же OpenAI API может возвращать текст из mp3 (тот же whisper используется). Ну и сам https://huggingface.co/spaces/openai/whisper
Да, вот последний я пробовал. Загрузил файл минут 20 назад. До сих пор жду. Установил себе локально этот whisper jax. Можно тебе сюда буду писать с вопросами?
Да я сам ещё с этим не разбирался. Всё лень. Для своего бота юзал OpenAI API. Сейчас мой токен превратился в тыкву, надо новый подрубать, да и запускать это потом на сервере в нидерландах, ибо из раши не принимают запросы. Мээээ. Может через месяц-два, когда начну в 5й раз переписывать своего бота, гляну по моделям, что получится запустить локально, но пока лень.
Поставил себе локально. Он 10 минут обрабатывал 4х минутное видео. Проще видимо самому сидеть и все это вбивать руками
пробовал на чем-то более простом? например видео из Youtube? у меня было такое, что большое тоже не с первого раза пережевывает, но с небольшими частями проблем нет
Ну, 4х минутная запись на мой взгляд должна быть достаточно легкой, учитывая, что у меня 15 часов лекций.

Я это делаю на жирике нвидивском на линухе (для того собственно и ставил), виспер собираю с гитхаба и запускается локально, распознавание работает бодренько.

Но для лекций во времена ещё лекций, юзал гугл Транслейт на телефоне. Как вариант чтобы не ебаться, с винды приватности у тебя и так нет. А чтобы с пайтоном играть то идейе нужно и ну короче, делов на 20 минут (нет). А так можешь на другой язык заодно переводить и даже озвучивать. Возможно даже апи для этого есть у гугла.

К сожалению, я сильно ограничен во времени и хотелось бы за ближайшую ночь обработать 15 часов лекций. Жирик - это что такое? В докере если поднять будет лучше или это совсем не то?
Жирик это видеокарта от нвидии
Это можно поднять в докерк, если есть железо, можно даже в гугл ноте или как он там. Который даёт видяху бесплатно на 12 часов.
Пытался самостоятельно поднять, ничего не вышло. Зато нашел коллабу какого-то бабаха, у него все работает как часы
https://colab.research.google.com/drive/1dtcxoiH4XYV7AMUTyXZhj2kXV54HMnh9?usp=sharing#scrollTo=scAiM8ug_s1M
Да, есть несколько настроенных документов на GitHub, которые могут помочь вам использовать Whisper в Google Colab для распознавания речи. Вот несколько из них:

- **Whisper Notebook**: Этот репозиторий содержит Colab Notebook, который поддерживает OpenAI Whisper и API DeepL для транскрипции и перевода. Он предлагает простую настройку и инструкции для использования. Вы можете открыть его и следовать указаниям внутри: [Whisper Notebook](https://github.com/cnbeining/Whisper_Notebook).

- **Faster Whisper Google Colab**: Этот проект предлагает облачное развертывание Faster Whisper на Google Colab. Он позволяет автоматически генерировать субтитры или транскрипцию для загруженных видеофайлов. Это решение также бесплатное и не имеет ограничений по длине видео: [Faster Whisper Google Colab](https://github.com/ChanJianHao/Faster-Whisper-Google-Colab).

- **Deepgram Blog**: Хотя это не GitHub, в блоге Deepgram есть простой ноутбук для работы с Whisper в Google Colab, который включает установку, загрузку аудио с YouTube и оценку производительности модели: [Как запустить OpenAI Whisper в Google Colab](https://deepgram.com/learn/how-to-run-openai-whisper-in-google-colab).

Эти ресурсы помогут вам быстро начать работу с Whisper для распознавания длинных лекций на русском языке.

Citations:
[1] https://deepgram.com/learn/how-to-run-openai-whisper-in-google-colab
[2] https://github.com/cnbeining/Whisper_Notebook
[3] https://github.com/ChanJianHao/Faster-Whisper-Google-Colab
новое обновление винды 11 должно уметь
Можно чуть подробнее
win+ctrl+S
Но нужно язык системы переключить на инглиш.
Но что-то сомневаюсь, что оно работает локально.
Пишет, что текущий язык не поддерживается. Сомневаюсь, что он в таком случае сможет нормально конвертацию русского языка сделать

Работает локально, русского нет.

В настройках видны надо установить языковые пакеты, возможно на вкладке по распознаванию речи
Кто отследит твоё NDA на ютубе, если сделаешь доступ по ссылке? Там кстати есть автогенерация субтитров от самого ютуба, потом просто удалишь видео.
Не хочется рисковать если есть другие пути
Если сервис подавился двух часовым файлом, по попробуй нарезать на часовые (получасовые) отрезки и скормить ему так.
Или там ограничение на количество файлов есть?
Только зарегистрированные и активированные пользователи могут добавлять комментарии.
Похожие темы

Похожие посты
пидоры, простите