Zaawansowany, wieloplatformowy konwerter PDF na DOCX/TXT z automatycznym rozpoznawaniem tekstu (OCR) dla skanów i zdjęć. Nowoczesny, stabilny interfejs, wsparcie dla macOS, Windows, Linux.
- Automatyczne rozpoznawanie tekstu (OCR) dla PDF-ów bez warstwy tekstowej (skany, zdjęcia)
- Zaawansowany preprocessing obrazu: autokontrast, wyostrzanie, mocniejsza binarizacja, DPI x3
- Rozpoznawanie wyłącznie języka polskiego dla lepszej skuteczności OCR
- Nowy, stabilny i responsywny interfejs (Tkinter, PanedWindow, podgląd PDF)
- Przycisk "Pomoc / O programie" na górze panelu
- Pasek postępu, logi, anulowanie konwersji, wsparcie dla wielu plików
- Obsługa macOS, Windows, Linux
Nowoczesny, czytelny interfejs z panelem wyboru plików, opcjami konwersji i podglądem logów.
Przełączanie między motywem jasnym a ciemnym dla komfortu pracy w różnych warunkach oświetleniowych.
Pasek postępu i szczegółowe logi w czasie rzeczywistym pokazują postęp konwersji z rozpoznawaniem OCR.
Kompletne informacje o zakończonej konwersji z podsumowaniem przetworzonych plików.
- Zainstaluj wymagane biblioteki:
pip3 install -r requirements.txt
- Zainstaluj Poppler i Tesseract OCR:
- macOS:
brew install poppler tesseract tesseract-lang
- Windows:
- Pobierz Poppler: https://github.com/oschwartz10612/poppler-windows/releases
- Pobierz Tesseract: https://github.com/tesseract-ocr/tesseract
- Linux:
sudo apt install poppler-utils tesseract-ocr tesseract-ocr-pol
- macOS:
python3 app.py
- ENTERPRISE DOCUMENTATION: profesjonalna dokumentacja kodu z markdown-style docstringami
- JAKOŚĆ KODU: Pylint score 8.65/10 - enterprise-grade quality
- NOWY DESIGN: nowoczesny interfejs w stylu macOS z obsługą motywu dzień/noc
- DOSTĘPNOŚĆ: wysoki kontrast i czytelność dla lepszej użyteczności
- STABILNOŚĆ: pełna kompatybilność z macOS, Windows i Linux
- PRODUKCJA: gotowość do publikacji z pełną dokumentacją
- REFAKTORING: poprawki jakości kodu, usunięcie code smells
- Wszystkie funkcje z wersji 4.1.0: zaawansowane logowanie, konfiguracja, testy CI/CD
- Pylint Score: 8.65/10 (enterprise-grade quality)
- Code Style: PEP 8 compliant z professional docstrings
- Documentation: Markdown-style dokumentacja z szczegółowymi opisami
- Error Handling: Comprehensive exception handling
- Zaawansowane logowanie do pliku z rotacją (
logs/app.log
) - Konfiguracja przez plik
config.yaml
(output_dir, log_level, ocr_lang) - Automatyczne testy jednostkowe (pytest, katalog
tests/
) - Gotowy workflow CI/CD (GitHub Actions:
.github/workflows/python-app.yml
)
Aby uruchomić testy lokalnie:
pip3 install pytest pyyaml
pytest tests/
Testy uruchamiają się automatycznie przy każdym pushu do gałęzi main
na GitHubie.
Edytuj plik config.yaml
, aby zmienić domyślne ustawienia aplikacji (np. katalog wyjściowy, poziom logowania, język OCR).
Wszystkie logi audytowe zapisywane są do pliku logs/app.log
z automatyczną rotacją (5 plików po 2MB).
app.py (1440+ linii)
├── 📦 Importy i Konfiguracja
├── 📝 Konfiguracja Logowania
├── 🖥️ Obsługa Logów w GUI
├── ⚙️ Funkcje Pomocnicze
├── 🏗️ Klasa Główna Aplikacji
│ ├── 🎨 System Motywów
│ ├── 🔄 Logika Konwersji
│ └── 🖼️ Podgląd PDF
└── 🚀 Punkt Wejścia
- Enterprise-grade documentation z markdown docstrings
- Modular design z clear separation of concerns
- Error handling z graceful degradation
- Cross-platform compatibility (macOS, Windows, Linux)
- Threading dla operacji długotrwałych
🎯 Wersja: 4.2.0 Enterprise Edition
📅 Ostatnia aktualizacja: 20 czerwca 2025
✅ Status: Stabilny, gotowy do użycia produkcyjnego
� Jakość kodu: Pylint 8.65/10 - enterprise-grade
�🔧 Testy: Automatyczne CI/CD z GitHub Actions
� Kompatybilność: macOS, Windows, Linux
📚 Dokumentacja: Professional markdown-style docstrings
MIT
Alan Steinbarth