Codeberg

Diktieren.
Lokal.
Fertig.

Hotkey halten → sprechen → fertiger Text in der aktiven App.
Kein Cloud-Dienst, kein Abo, keine Drittanbieter-App. 100 % offline.

macOS 13+ Apple Silicon AGPL v3 Kein Abo

Drei Versprechen. Keine Ausnahmen.

100 % lokal

Audio verlässt deinen Mac nie. whisper.cpp läuft direkt auf deiner Hardware — keine Cloud, kein Server, kein Ping nach außen.

Kein Abo, kein Konto

Einmal bauen, dauerhaft nutzen. Keine Registrierung, keine Subscription, kein Tracking. Das Tool gehört dir.

Open Source — AGPL v3

Vollständiger Quellcode auf Codeberg. Eigenständige Implementierung auf Basis von whisper.cpp und Ollama.

Was Voxista kann

Native macOS-Menüleisten-App — schmal, präzise, ohne Ballast.

Aktivierung per Doppeltipp oder Halten

Standard: Doppeltipp — kollidiert nicht mit -Sonderzeichen wie @. Alternativ Push-to-talk (Halten). Frei belegbares Kürzel, z. B. ⌥ Leer. Esc verwirft die Aufnahme.

Veredelungs-Modi

Roh · Aufräumen · Als E-Mail · Ins Englische — und eigene Aktionen im Editor. Optional: Cloud-Provider (Langdock / OpenAI-kompatibel) statt Ollama lokal.

Warm-Modus

„Modell im Speicher halten" startet whisper-server im Hintergrund — Transkription beginnt sofort, kein Modell-Ladezeit beim ersten Diktat.

Live-Vorschau im HUD

Experimentell: Zwischenstand des Diktats erscheint alle ~2,5 s während des Sprechens — setzt Warm-Modus voraus.

Wörterbuch & Textbausteine

Automatische Wortersetzung (dictionary.txt), Eigennamen-Liste (vocabulary.txt) fürs LLM und Textbausteine via Trigger-Wort — „Signatur" diktieren, Baustein wird eingefügt.

Verlauf

Die letzten Transkriptionen im Fenster und direkt im Menüleisten-Menü einsehbar. Suche, Anpinnen, Einzellöschen, Drag & Drop heraus.

Meeting-Erkennung

Nutzt eine andere App das Mikrofon (Teams, Zoom & Co.), bietet Voxista das automatische Mitschreiben an — deine Gesprächsseite landet als Take.

Aufnahme-HUD mit Wellenform

Schwebe-Pill zeigt den Zustand in Echtzeit: Live-Wellenform, Wort-Counter „✓ 128 Wörter eingefügt", 10-s-Countdown bei Stille.

Automation & CLI

Dieselbe Binary als Kommandozeilen-Tool — für die Kurzbefehle-App, URL-Scheme voxista://, optionaler Webhook (z. B. n8n).

So funktioniert's

Vier Schritte vom Hotkey bis zum Text in der aktiven App — alles auf deinem Mac.

Aufnahme

Hotkey & Mikrofon

halten oder doppeltippen — Voxista nimmt mit 16 kHz WAV auf. Das Menüleisten-Icon pulsiert rot. Esc bricht ab.

Transkription

whisper.cpp lokal

Large-v3-Turbo läuft ausschließlich auf deiner Hardware. Lange Aufnahmen werden an Stille-Stellen aufgeteilt und mit Fortschritt transkribiert.

Optional

LLM-Veredelung

Ollama (qwen2.5) bereinigt, formatiert oder übersetzt den Rohtext — je nach gewähltem Modus. Wörterbuch und Vocabulary werden angewendet.

Ausgabe

⌘V in die aktive App

Text landet via Zwischenablage + ⌘V genau dort, wo der Cursor steht. Optional mit automatischem Enter.

Scripting & Integration

Voxista als Werkzeug in deiner Automatisierungs-Kette — Kurzbefehle, Shell-Skripte, Webhooks.

Terminal
# ./build.sh --install richtet den Befehl automatisch ein
voxista --transcribe interview.mp3             # Audio → Text (lokal)
voxista --enhance "ähm das meeting ist morgen" --mode clean
voxista --list-modes                           # verfügbare Modi anzeigen
URL-Scheme

voxista:// — startet Aktionen direkt aus anderen Apps oder dem Browser.

Webhook

Jedes fertige Diktat wird optional an einen Webhook gesendet (z. B. n8n) — absicherbar per Bearer-Token im macOS-Schlüsselbund.

Kurzbefehle-App

Aktion „Shell-Skript ausführen" — nutzt dieselbe Engine und dieselben Einstellungen wie die laufende App.

Einrichten

Der schnellste Weg ist der fertige Download. Wer mag, baut stattdessen aus dem Quellcode — beides unten beschrieben.

Variante A — Download (empfohlen)

3 Schritte
# 1. ZIP laden & entpacken, Voxista.app nach /Applications ziehen:
#    → codeberg.org/kleinschmidt/Voxista/releases/latest
# 2. Erster Start: Rechtsklick auf die App → „Öffnen" → „Öffnen"
#    (Voxista ist selbst-signiert, nicht notarisiert — daher die Einmal-Hürde)
#    Alternativ im Terminal:
xattr -dr com.apple.quarantine /Applications/Voxista.app
# 3. Whisper-Modell lädt die App beim ersten Start selbst (geführtes Setup)

whisper ist im Download bereits eingebettet — Homebrew wird nicht benötigt. Updates meldet die App selbst (täglicher Versions-Check, kein Auto-Install).

Variante B — Aus dem Quellcode · 1 — Voraussetzungen

Terminal — einmalig
# Homebrew (brew.sh) und Swift Command Line Tools werden benötigt
# Kein volles Xcode nötig

# Spracherkennung
brew install whisper-cpp
mkdir -p ~/whisper-models
curl -L -o ~/whisper-models/ggml-large-v3-turbo-q5_0.bin \
  https://huggingface.co/ggerganov/whisper.cpp/resolve/main/ggml-large-v3-turbo-q5_0.bin

# Optionale LLM-Veredelung (lokal)
brew install --cask ollama-app
ollama pull qwen2.5:7b

2 — Bauen & installieren

Terminal
git clone https://codeberg.org/kleinschmidt/Voxista
cd Voxista
./setup-signing.sh   # einmalig: stabiles Signing-Zertifikat
./make-icon.sh        # App-Icon erzeugen
./build.sh --install  # nach /Applications bauen
# Fertige App läuft ohne Homebrew (whisper ist eingebettet)
Erster Start: In Systemeinstellungen → Datenschutz & Sicherheit Voxista unter Bedienungshilfen erlauben (globaler Hotkey + Einfügen) und beim ersten Diktieren das Mikrofon freigeben.
Weitergabe als ZIP: Voxista ist selbst-signiert (Ad-hoc), nicht notarisiert. Empfänger müssen die Gatekeeper-Sperre einmalig lösen: xattr -dr com.apple.quarantine /Applications/Voxista.app Oder: Rechtsklick auf die App → „Öffnen" → „Öffnen".

Changelog

Was in jeder Version dazugekommen ist — neueste zuerst.

1.17 14.06.2026
  • Drittanbieter-Lizenztexte jetzt mitgeliefert und im Über-Tab verlinkt (plus Gewährleistungsausschluss)
  • Kontaktadresse auf hello@heinemann.media aktualisiert
1.16 12.06.2026
  • Terminal (CLI), Fehlermeldungen und Erststart-Vorlagen vollständig zweisprachig
  • KI-Prompts und Meeting-Sprecher-Marker folgen der App-Sprache
  • Stabilität: Kontext-Erfassung gegen seltene Abstürze abgesichert
1.15 12.06.2026
  • Voxista spricht jetzt Englisch: Oberfläche standardmäßig Englisch, umschaltbar auf Deutsch (Einstellungen → Allgemein)
  • Alle Menüs, Panels und Dialoge vollständig zweisprachig
  • Eingebaute KI-Prompts und Meeting-Sprecher-Marker folgen der App-Sprache
1.14 12.06.2026
  • Voxista gibt es jetzt zum Download: fertige Releases auf Codeberg (ZIP, signiert)
  • Update-Hinweis: die App prüft täglich auf neue Versionen — ein Klick im Menü führt zum Download (kein Auto-Install)
  • Über-Tab: „Nach Updates suchen“-Knopf
1.13 12.06.2026
  • Umbenennung: aus Voxify wird Voxista — Logo und Funktionen bleiben
  • Alle Daten (Einstellungen, Wörterbuch, Takes, Verlauf, API-Keys) werden automatisch übernommen
  • CLI heißt jetzt „voxista“; URL-Scheme voxista:// (voxify:// bleibt als Alias)
1.12 12.06.2026
  • Meeting-Mitschnitt (Phase 2): nimmt jetzt auch die Gegenseite auf — Stereo-Take (links du, rechts die anderen)
  • Sprecher-Transkript: „Ich:“ / „Andere:“ zeitlich verschränkt, direkt aus dem Meeting-Panel (auch per CLI)
  • KI-Protokoll auf Knopfdruck: Themen, Entscheidungen, Aufgaben, offene Punkte (neuer Modus „Meeting-Protokoll“)
1.11 11.06.2026
  • Meeting-Erkennung (Phase 1): Nutzt eine andere App das Mikrofon und läuft Teams/Zoom & Co., bietet Voxista das Mitschreiben an — die eigene Mikrofon-Seite landet als Take
  • Neues Arbeitslogo: Voxista-Marke als App-Icon, im Über-Tab und Onboarding (vektorisiert in Branding/)
1.10 11.06.2026
  • Lange Aufnahmen (> 5 min) werden an Stille-Stellen in Teile geschnitten und mit Fortschritt („Teil 2 von 5") transkribiert — deutlich zuverlässiger als am Stück
  • HUD-Position wählbar: unten oder oben mittig
  • Webhook absicherbar per Auth-Token (Bearer, Schlüsselbund); Spenden-Button im Über-Tab
1.9 11.06.2026
  • Diktat-Sprache (Deutsch/Englisch/Automatisch) direkt im Menü umschaltbar
  • Textbausteine: Trigger-Wort diktieren (z. B. „Signatur") → Baustein wird eingefügt
  • Automation: CLI mit --json/--stats/--export-history, URL-Scheme voxista://, optionaler Webhook (n8n)
  • Politur: Bestätigungs-Dialoge vor dem Löschen, Auto-Speichern beim Verlassen, sichtbare Fehler
  • HUD zählt mit: „✓ 128 Wörter eingefügt"
1.8 11.06.2026
  • Takes-Liste: jede Aufnahme bleibt erhalten (Zeitstempel), mit Player, Transkribieren, Export und Einzellöschen
  • Stille-Auto-Stopp: nach längerer Ruhe zählt das HUD 10 s herunter — Weitersprechen bricht ab (Limit einstellbar)
1.7 11.06.2026
  • Live-Vorschau im HUD (experimentell): Zwischenstand alle ~2,5 s — mit Warm-Modus
  • Frei belegbarer Hotkey (z. B. ⌥ Leer) zusätzlich zu rechten Modifier-Tasten
  • Esc bricht laufende Aufnahme ab; „✓ Eingefügt"-Bestätigung nach dem Diktat
  • Menüleisten-Icon zeigt den Zustand (rot pulsierend bei Aufnahme)
  • Verlauf: Suche, Anpinnen, Einzellöschen, Einträge per Drag & Drop herausziehen
  • Aktionen-Editor: „Ausprobieren" testet den Prompt mit Beispieltext
  • Geführter Erststart (Mikrofon, Bedienungshilfen, Modell) statt stillem Scheitern
  • Aufnehmen-Tab mit Live-Wellenform; System-Stummschaltung gilt auch dort
1.6 11.06.2026
  • Warm-Modus „Modell im Speicher halten": whisper-server hält das Modell geladen — Transkription startet sofort
  • Diktat-Verlauf direkt im Menüleisten-Menü einsehbar
  • Neues Aufnahme-HUD mit Live-Wellenform
  • Bugfixes: Download-Statusprüfung, Zwischenablage-Schutz
  • Performance-Verbesserungen: Datei-Caches, schnellere Einstellungen
  • Erste Unit-Tests
1.5 10.06.2026
  • Datei-Transkription per Drag & Drop
  • Berechtigungs-Übersicht mit Live-Status
  • Mikrofon-Auswahl
  • Wellenform-Player
  • Sichtbare Veredelungs-Fehler
1.4 10.06.2026
  • Einstellungen mit Seitenleiste
  • Cloud-Provider für KI-Veredelung (Langdock/Custom, Keys im Schlüsselbund)
  • Editierbare Vorschau vor dem Einfügen
  • CLI-Modus für Kurzbefehle
1.2 / 1.3 10.06.2026
  • Doppeltipp-Aktivierung
  • Einstellungs-Fenster
  • Eigene Modelle
  • App-spezifische Modi
  • Kontext aus markiertem Text
  • Verlauf
  • Pegelanzeige
1.1 10.06.2026
  • Wörterbuch & Vocabulary
  • Hybrid-Hotkey
  • VAD (Voice Activity Detection)
  • Modell-Verwaltung
  • Sound-Feedback
1.0 10.06.2026
  • Erste Version
  • Push-to-talk-Diktat
  • 4 Modi (Roh, Aufräumen, Als E-Mail, Ins Englische)
  • Lokales Whisper + Ollama

Voxista bleibt frei