#NapiGen

2024-05-12

Ruszyła zbiórka fundacji non-profit @ftdl na dodatkowy sprzęt dla generatora napisów i transkrypcji po polsku 🇵🇱 czyli NapiGen 🚀 oraz kolejnych projektów LLM.

Pomożecie rozwiązać problem braku polskich napisów w większości treści na YouTube i transkrypcji w podkastach?

Można się dołożyć tutaj:
ftdl.pl/sprzet-llm-napigen/

Nie zaszkodzi również podbicie 😉

P.S. Wszystko jest lub będzie open-source, we własnej serwerowni fundacji w Krakowie, na własnym sprzęcie, żadnych "wycieków" na zewnątrz czy "darmowego" douczania amerykańskich korpo ejajów.

#NapiGen #LLM #AI #PolskieNapisy #Napisy #Transkrypcje

Nad dłonią robota świetlny okrąg a w nim rozszerzenia plików .srt i .txt
Fundacja Technologie dla Ludziftdl@pol.social
2024-04-25

@karma @smoku @bobiko

Tak, prowadzimy projekt #NapiGen służący generowaniu napisów oraz transkrypcji do materiałów audio i wideo w języku polskim i angielskim. Obsługuje on pliki wideo i audio oraz adresy url do materiałów na YouTube, PeerTube, Vimeo i innych obsługiwanych przez yt-dlp.

Wygenerowane napisy .srt i transkrypcje .txt gotowe do pobrania z systemu po przesłaniu plików / adresów url i przetwarzaniu przez specjalnie zmodyfikowanego Whisper.

Kilka osób i projektów już używa, można sprawdzić m. in. na stronach i podcastach Czaban robi raban, GilotynaTV, Discrust, Warroza czy Myśleć Głębiej.

Zapraszamy do kontaktu tutaj lub e-mailem na pomoc@ftdl.pl, by uzyskać dostęp. System jest bezpłatny do zastosowań niekomercyjnych, często decydujemy się udzielić bezpłatnego dostępu również projektom komercyjnym, gdy taki dostęp jest ważny ze względów społecznych czy edukacyjnych.

Niebawem projekt zostanie udostępniony jako open-source, ponieważ osiągnął już wg nas odpowiedni etap rozwoju, by się nim podzielić ze społecznością i przyspieszyć wspólnie jego rozwój.

Zapraszamy do kontaktu.

2023-12-15

@kolejnylewackipej

Przygotowałem z pomocą #NapiGen od @ftdl napisy srt i transkrypcję do tego wspaniałego materiału.

Jeśli uważasz, że się przydadzą, to zapraszam do skorzystania. Mogą wymagać jakiejś korekty:

nch.pl/s/DzHwo8DiogYtSrW

2023-12-10

@skolima Jest projekt fundacji @ftdl dający bardzo dobre rezultaty.

Osoby z dostępem early-access chwalą. Wykorzystywany jest na kilku popularnych kanałach do robienia napisów, ale generuje też tekst.

Więcej pod tagami #NapGenPL i #NapiGen

zrzutka.pl/generator-napisow

2023-11-26

@paigesaunders@urbanists.video
cc @paigesaunders@mastodon.social

Great video!

I liked it so much that I prepared subtitles for it, with our automatic generator #NapiGen

If you find them good, please add them to the video, let deaf people see this great video too :)

nch.pl/s/oxWBPLZTC2B45XT

Fundacja Technologie dla Ludziftdl@pol.social
2023-11-20

Jeden z ambasadorów projektu #NapiGen Discrust @lukaso666 napisał kilka słów po testach wczesnej wersji oprogramowania:

discrust.diy.net.pl/blog/napig

Fragment:

"dlaczego warto wesprzeć ekipę FTdL przy pracach nad NapiGen? odpowiedź jest oczywista. to projekt kompletnie oddolny, poza łapskami jakiejś korporacji, dla której jedynym sensownym horyzontem i celem jest zysk i pieniądz. jest to inicjatywa od ludzi, dla ludzi i jej przyszłość zależy od naszego zaangażowania i wsparcia. bezcenną jest natomiast wymierna pomoc dla niesłyszących i niedosłyszących, którzy otrzymują wysokiej jakości napisy, a zatem dostęp do treści, które często były poza ich zasięgiem. możemy więc spokojnie traktować NapiGen, jako element pomocy wzajemnej, gdzie każdy/-a z nas ma realną możliwość przyczynienia się do czegoś dobrego dla innych."

Tutaj link do zbiórki na sprzęt (testy odbywają się na pożyczonym GPU i serwerze przeznaczonym do innych zadań) jeśli chcielibyście wesprzeć ten projekt:
zrzutka.pl/generator-napisow/

★discrüst★lukaso666@chaos.social
2023-11-20

📝 discrust | blog

:: NapiGen – automatyczne generowanie napisów do filmów | Fundacja Technologie dla Ludzi

słów kilka o wrażeniach z testowania #NapiGen od @ftdl ...

🔃 boosty mile widziane - dla dobra tego świetnego i potrzebnego projektu!

🌐 discrust.diy.net.pl/blog/napig

#napisy #generowanie_napisow #projekt

2023-11-20

@warroza

Dużo poprawiałeś napisy po #NapiGen-ie?

@archiwum

2023-11-19

@PiTau

Jak wygenerujesz sobie napisy do video, to edytura możesz już użyć dowolnego do korekty.
Jeśli szukasz takiego z wyświetlaniem waveforma, to może zainteresuje Cię #SubtitleEdit: nikse.dk/subtitleedit
Mają też wersję edytora online:
nikse.dk/subtitleedit/online

Takich narzędzi jest sporo. Kiedyś używałem edytora napisów z Kapwing.

Natomiast na kustomizacje pod głos osoby czy kilka innych ficzerów systemu #NapiGen warto poczekać.

@ftdl

2023-11-19

@ftdl Do zakończenia zbiórki zostało teoretycznie 11 dni, ale proszę nie obawiać się, wpłacać dotacje, bo projekt już ruszył z kopyta i nie zostanie zatrzymany, nie ma takiej obawy. Zresztą zbiórka na zrzutka.pl była już przedłużana. Z problemami, bo nie udaje się zebrać wymaganej ilości środków, ale kontynuujemy projekt, bo zapotrzebowanie na napisy do materiałów na YouTube jest ogromne. Wiemy, że dla osób niesłyszących to ważne. Możecie już zobaczyć napisy generowane przez #NapiGen na kanałach "Czaban robi raban" Piotra Czabana czy "GilotynaTV" Wojtka "Żubra" Bolińskiego @mr_zvbr

Więc zachęcam do wpłat, cel jest szczytny, efekty znakomite, zakończmy razem problem braku napisów do treści na YT, #PeerTube czy transkrypcji w podkastach.

Link do zbiórki w poście @ftdl wyżej w wątku.

Dzięki za podbicie, to też wsparcie :)

Fundacja Technologie dla Ludziftdl@pol.social
2023-11-19

Miło nam poinformować o uruchomieniu testów naszego oprogramowania #NapiGen (wcześniej #napgenpl) na sprzęcie bezpośrednio w naszej serwerowni. Oczywiście na naszym autorskim oprogramowaniu spinającym LLM. Można już wysyłać pliki i generować napisy bez naszego udziału, samodzielnie.

Osoby, które wpłaciły dotację na projekt w wysokości uprawniającej do wczesnego dostępu, prosimy o kontakt w celu wygenerowania kont dostępowych do systemu.

Osoby, które chciałyby wspomóc ten projekt i ewentualnie również uzyskać dostęp early-access zapraszamy na stronę zbiórki:
zrzutka.pl/generator-napisow/

Trochę technikaliów:
Wykorzystujemy LLM whisper z Faster-Whisper. Wczesniej whisper.cpp ale miał problemy ze współpracą z GPU.
Głównie large-v2. Nasze oprogramowanie backend napisane jest w pythonie. Serwer uruchomiony w krakowskiej serwerowni, więc nie ma obawy o karmienie obcych llm/ai.
Maszyna to Dell r730 z pożyczonym GPU Geforce GTX 1080 Ti bo zbieramy nadal na swoją.

#FTdLKurier #ŻycieFTdL #wspieramFTdL

Fundacja Technologie dla Ludziftdl@pol.social
2023-11-16

Z życia Fundacji:

Karta GPU GTX 1080 Ti montowana w serwerze.

Przygotowania do generowania napisów i transkrypcji z audio w języku polskim za pomocą LLM whisper.cpp w projekcie #NapiGen (wcześniej NapGenPL).

Czyli napisy do #PeerTube i YouTube oraz transkrypcje do podkastów !

Oprogramowanie z naszymi "kustomizacjami" sprawdzone jest już na laptopach i na wynajętych serwerach z GPU (na godziny), niebawem będziemy mieli własny.

Serwer trzeba jeszcze doposażyć, m. in. w dodatkowy RAM, ale o tym później 😉

#FTdLKurier #FTdL #WspieramFtdl

Wnętrze serwera Dell z zamontowaną kartą GPU

Client Info

Server: https://mastodon.social
Version: 2025.04
Repository: https://github.com/cyevgeniy/lmst