Skip to content

developer-jutra/open-whisper

Repository files navigation

transcriber-ui

tkinter - python builtin GUI std lib

Plik tkinter-only.py - zawiera tkinterowe hello world

Aplikacja jest w app.py. Domyślnie nagrany plik (potrzebny na rzecz transkrypcji) jest zrzucany do recording.wav.

setup

System może najpierw potrzebować zainstalowane portaudio:

macos: brew install portaudio

linux: sudo apt-get install portaudio19-dev

WSL: Jeśli uruchamiasz repozytorium na WSL mogą być potrzebne dodatkowe kroki, aby WSL poprawnie widział urządzania audio. Pomocne mogą być kroki z tego wątku: microsoft/WSL#9624 (comment)

tkinter

upewnij się że tkinter jest zainstalowany:

macos: brew install tcl-tk lub brew install [email protected]

linux: sudo apt-get install python3-tk

python

venv/uv/... - do wyboru, do koloru

python -m venv .venv
source .venv/bin/activate  # linux/macos
.venv\Scripts\activate     # windows
pip install -r requirements.txt

uruchamiania lokalnie

w terminalu:

python app.py

Jeśli korzystasz z VSCode możesz skorzystać z launch.json z konfiguracją debugowania.

bundle as dekstop app - pyinstaller

Może potrwać chwilę

Uruchom: pyinstaller --onefile --windowed --name "Azor-Transcriber" app.py

śledzenie zajętości miejsca

No rocket science, ale warto monitorować zajętość miejsca (i wiedzieć, gdzie który toolstack przechowuje modele)

# model w wersji najmniejszej
(.venv) ➜  transcriber-ui git:(main) ✗ du -sh ~/.cache/huggingface/hub/models--openai--whisper-tiny 
148M    /Users/tomaszku/.cache/huggingface/hub/models--openai--whisper-tiny

# zależności lokalne (porównywalnie do czarnej dziury czyli node_modules :P)
(.venv) ➜  transcriber-ui git:(main) ✗ du -sh .venv/
994M    .venv/
# w tym największe:
385M    .venv/lib/python3.13/site-packages/torch
111M    .venv/lib/python3.13/site-packages/transformers
 98M    .venv/lib/python3.13/site-packages/scipy

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 3

  •  
  •  
  •  

Languages