Metadata-Version: 2.4
Name: PayPerTranscript
Version: 0.3.9
Summary: Open-Source Voice-to-Text mit Pay-per-Use Pricing
Author: PayPerTranscript Contributors
License-Expression: MIT
Project-URL: Homepage, https://github.com/nikovdany/PayPerTranscript
Classifier: Operating System :: Microsoft :: Windows
Classifier: Programming Language :: Python :: 3.12
Classifier: Topic :: Multimedia :: Sound/Audio :: Speech
Requires-Python: >=3.12
Description-Content-Type: text/markdown
License-File: LICENSE
Requires-Dist: PySide6
Requires-Dist: sounddevice
Requires-Dist: numpy
Requires-Dist: groq
Requires-Dist: pynput
Requires-Dist: pywin32
Requires-Dist: psutil
Requires-Dist: pyperclip
Requires-Dist: pyautogui
Requires-Dist: keyring
Requires-Dist: soundfile
Requires-Dist: packaging
Provides-Extra: dev
Requires-Dist: build; extra == "dev"
Requires-Dist: pytest; extra == "dev"
Dynamic: license-file

<div align="center">

# 🎙️ PayPerTranscript

**Voice-to-Text ohne unnötige Kosten**

Hotkey drücken → sprechen → Text erscheint  
*Pay-per-Use statt teurer Komplettlösung*

[![MIT License](https://img.shields.io/badge/license-MIT-blue.svg)](LICENSE)
[![Python 3.12+](https://img.shields.io/badge/python-3.12+-blue.svg)](https://python.org)
[![Windows](https://img.shields.io/badge/platform-Windows-blue.svg)]()

</div>

## 📈 Rund 3,5x schneller als Tippen

Als realistische Schätzung kann man von etwa **3,5x** ausgehen, also grob **250 % mehr Geschwindigkeit** als beim normalen Tippen im Büroalltag.

Gemeint ist dabei nicht nur das Sprechen selbst, sondern der komplette Ablauf von Start der Aufnahme bis zum eingefügten Text. Dieser Wert wird in der App laufend mitgetrackt, statistisch ausgewertet und transparent angezeigt.

---

## 💡 Das Problem

Viele kommerzielle Speech-to-Text-Apps setzen auf ein Abo-Modell.

Ein Abo für 15 Dollar im Monat klingt erstmal fair. Rechnet man es auf echte Transkriptionskosten runter, entspricht das aber grob **12 Stunden aktiver Transkription pro Tag, jeden Tag des Monats**.

Wenn du morgens um 8 Uhr anfängst, müsstest du bis ungefähr 20 Uhr fast durchgehend diktieren, nur um überhaupt in die Nähe dieses Gegenwerts zu kommen. Nicht „die App läuft im Hintergrund“, sondern wirklich: Taste drücken, sprechen, weiter, wieder und wieder.

## ✨ Die Idee

**PayPerTranscript** ist die Pay-per-Use-Alternative dazu. Du nutzt deinen eigenen API-Key und zahlst nur für die tatsächliche Nutzung:
- keine laufenden Fixkosten
- volle Kontrolle über deine Daten
- trotzdem die typischen Komfort-Funktionen moderner Dictation-Apps

**Open Source** · **Keine Telemetrie** · **Dein eigener API-Key**

---

## 🚀 Features

### ⚡ Schnell im Alltag
- **Hold-to-Record** oder **Toggle-Hotkey**
- Text direkt in fast jede Windows-App einfügen
- **Audio-Dateien hochladen** und transkribieren
- Statistik mit **Zeitersparnis, WPM und Voice-vs.-Typing-Faktor**

### 🧠 Smart statt kompliziert
- App-spezifische Formatierung für Chat, E-Mail oder neutrale Notizen
- Kontext aus markiertem Text für Namen, Fachbegriffe und laufende Antworten
- Eigene Wortliste für häufig genutzte Begriffe
- Verlauf mit Copy-Funktion und **präziser Re-Transkription**

### 🔒 Kontrolle
- Lokaler Verlauf statt Black Box
- Audio-Dateien werden automatisch gelöscht
- Verlaufstexte können deaktiviert oder begrenzt werden
- Kosten und Nutzung jederzeit nachvollziehbar

---

## 📦 Installation

### Via pip

```bash
pip install paypertranscript
paypertranscript
```

Beim ersten Start führt dich ein kurzer Setup-Wizard durch die Einrichtung.

**Voraussetzungen:** Windows 10/11 · Python 3.12+

### Aus Quellcode

```bash
git clone https://github.com/nikovdany/PayPerTranscript.git
cd PayPerTranscript
pip install -e .
paypertranscript
```

---

<div align="center">

**Einfach diktieren. Nur zahlen, wenn du es wirklich nutzt.**

</div>
