Program do zamiany głosu na tekst (szmer.info)

submitted 1 month ago by dj1936@szmer.info to c/zapytajszmer@szmer.info

5 comments fedilink hide all child comments

Poszukuję łatwego w obsłudze, najlepiej darmowego programu, który z nagrania w dyktafonie stworzy plik tekstowy.

Co polecacie?

Program online mile widziany też, bo mam linuxa, więc już się boję co to będzie z instalacją... :D

top 5 comments

sorted by: hot top controversial new old

[-] ergast@szmer.info 3 points 1 month ago

Ja używałem capcut jak miałem dzwięk w wideo, ale znalazłem takie narzędzie. nie testowałem: https://speechnotes.co/

[-] harcesz@szmer.info 3 points 1 month ago* (last edited 1 month ago)

W sumie by mi się przydało, więc zaraz odpalę do testów Speech Note; https://github.com/mkiol/dsnote

Można zainstalować przez 'sklep' z aplikacjami w Ubuntu/Debianie wyszukując po nazwie, albo jak chcesz się poczuć bardziej hakersko - instalacja w terminalu:
flatpak install flathub net.mkiol.SpeechNote

Jeśli masz komputer z oddzielną kartą graficzną (GPU nvidia albo AMD) to warto doinstalować elementy do tego i tego i ją wykorzystać, bo to na pewno znacznie przyśpieszy działanie. Program Open Source, działa w całości lokalnie, ma nic nie wysyłać do internetu, więc znacznie bardziej prywatne niż używanie czegokolwiek online. Teoretycznie polski jest tam w pełni wspierany.

[-] harcesz@szmer.info 3 points 1 month ago* (last edited 1 month ago)

Na lekko złomotawym komputerze bez karty graficznej prędkością nie powala, dyktując powyższy komentarz musiałem poczekać ze 2 minuty aż go przemieli, ale wynik zaskakująco dobry. Jestem pod wrażeniem.

Po instalacji trzeba wejść w języki wyszukać polski i wybrać model językowy do ściągnięcia. Pierwszy z góry dał słabe efekty, ale faster whisper large v3 daje bardzo dobre wyniki.

[-] dj1936@szmer.info 3 points 1 month ago

Dzięki harc! Nawet udało mi się zainstalować po hakersku :D

[-] wacpan@szmer.info 1 points 1 month ago

Korzystałem z rozwiązania chmurowego (czyli bez gwarancji prywatności):

http://www.veed.io/tools/auto-subtitle-generator-online

– w wersji free-bez rejestracji – limit 10 min per kawałek, limit dobowy oraz brak rozróżniania rozmówców; za to jakość dla jęz. polskiego – co najmniej dobra.

Analogicznie można użyć YouTube'a z autotranscript, tylko trzeba mieć tam konto.

this post was submitted on 15 Oct 2024

6 points (100.0% liked)

zapytajszmer

401 readers

7 users here now

Społeczność Szmerfów pytających :) Masz pytanie? Zadaj je, inne Szmerfy chętnie odpowiedzą.

founded 3 years ago

MODERATORS

lysy@szmer.info