/pr/ – programming


ad5f4ad5f4ff3e3574022b6de8b9181a55c5c – ``Распознавание речи''

@4020104fb81940889710b71a8b6c64dd Anonymous 2021-04-08 17:15:46
Попробовал Vosk. В принципе, неплохо распознаёт, даже матюки понимает.
@60ce1fc2de89481b8464ccb545a27e2e Anonymous 2021-04-08 17:23:41
Спасибо.
@cb1d7515dada48928d1644493815a706 Anonymous 2021-04-08 22:40:06
Устный калькулятор - это слишком сложно. Нахуй.
@1748d387b2d4407594351c1516226604 Anonymous 2021-04-09 13:47:27
Блджад. Оно незнакомые слова хуёво распознаёт.

Но в модели есть интересный файлик "graph/phones/align_lexicon.txt". Ещё пишут, что можно её дообучать вроде как.
@02b53c5a89154c208ad4e1b62a78689f Anonymous 2021-04-09 13:53:03
@1748d@1748d387b2d4407594351c1516226604 А там пишут, что есть большие модели и мальнике 50mb. Ты на какой проверяешь?
@eb98d64e56b44e3386e31ad9e39d05ae Anonymous 2021-04-09 16:12:18
@02b53@02b53c5a89154c208ad4e1b62a78689f На той, которую смог достать. 3.7 ГБ.
@0c195bd64a13404895b2239f77b60912 Anonymous 2021-06-25 09:39:58
Да, хорошая полезная штука. Пригодилось когда надо было сконвертить бубнёж из одного ютуб видео в текст.