Warum ich mir eine eigene Transkriptions-App gebaut habe
Artikel vorlesen lassen
Drei Jahre Turboscribe, jetzt eine eigene macOS-App. Gleiche Qualität, weniger Kosten, volle Kontrolle über Fachbegriffe.
Ich transkribiere viel. Meine Twitch-Streams, YouTube-Videos, aber auch fremde Videos zu Themen wie KI, Marketing oder Psychologie. Aus den Transkripten entstehen Blogartikel, YouTube-Beschreibungen, strategische Analysen und eine wachsende Wissensdatenbank in Notion.
Drei Jahre lang habe ich dafür Turboscribe genutzt. 120 $ im Jahr, gute Qualität, schnelle Ergebnisse. Ich war zufrieden. Turboscribe kann auch deutlich mehr als nur transkribieren: Export als Untertitel-Dateien in verschiedenen Formaten, als Text, PDF oder Docx, dazu eine direkte Anbindung an Google Translate für Übersetzungen in beliebige Sprachen. Gute Funktionen, die ich in meinem Workflow aber kaum nutze.
Deshalb habe ich mir jetzt eine eigene macOS-App gebaut. Mit Claude Code, in knapp zwei Stunden. Meine Vorgabe war simpel: Ich brauche eine native macOS-App, die Video- und Audiodateien transkribiert, ein Glossar für Fachbegriffe unterstützt und die Ergebnisse als Markdown speichert. Den Rest hat Claude Code eigenständig entschieden: SwiftUI als Framework, macOS 14 (Sonoma) als Mindestversion, ein Xcode-Projekt als Build-System. Ich hätte das auch anders vorgeben können, aber die Auswahl war sinnvoll und ich hatte keinen Grund, sie zu ändern.
Die Entwicklung hat mich ca. 12 $ an API-Kosten gekostet.
Gleiche Qualität, weniger Kosten
Turboscribe setzt intern auf OpenAIs Whisper. Meine App spricht dieselbe API direkt an. Die Transkriptionsqualität ist identisch.
Der Unterschied: Ich zahle nur die tatsächlichen API-Kosten. Bei meinem Volumen sind das geschätzt 40 bis 50 $ im Jahr statt 120 $. Eine Stunde Audio kostet über die Whisper API ca. 0,36 $.
Was die App kann
Die App ist auf meinen Workflow zugeschnitten:
- Drag & Drop von Video- und Audiodateien direkt ins Fenster
- YouTube-URLs reinkopieren und transkribieren lassen
- Ordnerüberwachung: Neue Datei im Ordner? Transkript kommt automatisch.
- Glossar für Fachbegriffe: Whisper neigt dazu, Fachbegriffe falsch zu schreiben. Über das Glossar sorge ich dafür, dass "TYPO3", "TypoScript", "Fluid" und "Sitepackage" korrekt im Transkript landen.
- Automatisches Splitting langer Dateien (die API hat ein 25-MB-Limit pro Request)
- Markdown-Ausgabe mit Timestamps direkt neben der Quelldatei
Besonders das Glossar ist für mich als TYPO3-Trainer wichtig. Ohne Glossar schreibt Whisper gerne mal "Turbo 3" oder "Type of Script". Das Glossar wird als Prompt an die API übergeben und sorgt dafür, dass die Fachbegriffe stimmen.
Warum das für TYPO3-Profis relevant ist
Wer TYPO3-Content produziert (Talks, Tutorials, Screencasts, Podcasts), kennt das Problem: Transkriptions-Tools verstehen unsere Fachsprache nicht. TypoScript, Fluid, Content Blocks, Site Sets, Sitepackage. Das sind keine Alltagsbegriffe.
Mit einer eigenen Lösung hast du die Kontrolle über das Glossar. Du definierst einmal deine Begriffe und bekommst saubere Transkripte, die du direkt weiterverarbeiten kannst.
Die OpenAI Whisper API ist gut dokumentiert, das Preismodell transparent. Wer sich mit KI-Coding-Tools wie Claude Code oder Cursor beschäftigt, kann sich solche Werkzeuge in erstaunlich kurzer Zeit bauen.
Die Rechnung
| Turboscribe | Eigene App (Whisper API) | |
|---|---|---|
| Kosten pro Jahr | 120 $ | ca. 40-50 $ (abhängig vom Volumen) |
| Einmalige Entwicklung | 0 $ | ca. 12 $ (API-Kosten für Claude Code) |
| Glossar für Fachbegriffe | begrenzt | frei konfigurierbar |
| Ausgabeformat | Text, PDF, Docx, Untertitel-Formate | Markdown mit Timestamps, lokal gespeichert |
| Datenhoheit | Cloud-Dienst + eigener Account | Audio geht an OpenAI API, Transkripte werden lokal gespeichert |
Fazit
Ich sage nicht, dass sich das für jeden lohnt. Turboscribe bietet deutlich mehr Funktionen als meine App. Wer verschiedene Exportformate, Untertitel oder Übersetzungen braucht, ist dort gut aufgehoben.
Aber wer regelmäßig transkribiert, einen speziellen Workflow hat und die Kontrolle über Fachbegriffe braucht, für den kann sich der Eigenbau lohnen. Zwei Stunden Zeitinvestment, 12 $ Entwicklungskosten, und du hast ein Werkzeug, das genau das tut, was du brauchst.
Du hast eine Frage oder willst das Thema diskutieren?
Im Community Hub für TYPO3 kannst du dich mit anderen TYPO3 Anwendern austauschen. Und wenn du keine neuen Artikel verpassen willst: Der TYPO3 Newsletter kommt einmal im Monat, ohne Spam.
Hi, ich bin Wolfgang.
Seit 2006 arbeite ich mit TYPO3. Nicht in der Theorie, sondern in echten Projekten mit echten Deadlines. Die Probleme, die du gerade hast, hatte ich wahrscheinlich schon dreimal.
Irgendwann habe ich angefangen, mein Wissen in Videokurse zu packen. Nicht weil ich gerne vor der Kamera stehe, sondern weil ich dieselben Fragen immer wieder gehört habe. Mittlerweile sind es Hunderte Videos geworden. Jedes Einzelne entstand aus einer konkreten Frage aus einem konkreten Projekt.
Was mich von einem YouTube-Tutorial unterscheidet: Ich kenne nicht nur die Lösung, sondern auch den Kontext. Warum etwas so funktioniert. Wann es nicht funktioniert. Und welche Fehler du dir sparen kannst, weil ich sie schon gemacht habe.
Meine Teilnehmer nutzen mich als Sparringspartner. Nicht im Sinne von "ruf mich jederzeit an", sondern so: Du kommst mit einem konkreten Problem in die Live-Session, postest deine Frage in der Community oder schaust dir das passende Video an. Und bekommst eine Antwort, die funktioniert, weil sie aus der Praxis kommt.
Als Mitglied im TYPO3 Education & Certification Committee sorge ich dafür, dass die Zertifizierungsprüfungen auf dem aktuellen Stand bleiben. Was dort geprüft wird, fließt direkt in meine Kurse ein.