handbook:formate:audio
Unterschiede
Hier werden die Unterschiede zwischen zwei Versionen angezeigt.
| Beide Seiten der vorigen RevisionVorhergehende Überarbeitung | |||
| handbook:formate:audio [2025/05/08 14:08] – Externe Bearbeitung 127.0.0.1 | handbook:formate:audio [2025/05/08 14:56] (aktuell) – gelöscht 92.119.182.128 | ||
|---|---|---|---|
| Zeile 1: | Zeile 1: | ||
| - | ====== 3.5. Audio (TTS, Transkription, | ||
| - | |||
| - | ==== Überblick ==== | ||
| - | |||
| - | KI-Modelle für Audio sind in der Lage, Sprache zu erzeugen (Text-to-Speech), | ||
| - | |||
| - | Typische Einsatzfelder: | ||
| - | * **Text-to-Speech (TTS):** Inhalte als gesprochene Sprache ausgeben | ||
| - | * **Transkription: | ||
| - | * **Sprachsynthese & Voice Cloning:** Natürliche Stimmen oder bekannte Sprecher: | ||
| - | * **Musikkomposition & Sounddesign: | ||
| - | * **Audiobearbeitung mit KI:** Rauschunterdrückung, | ||
| - | |||
| - | ---- | ||
| - | |||
| - | ==== Aufbau eines Audio-Prompts ==== | ||
| - | |||
| - | Ein zielführender Audio-Prompt enthält: | ||
| - | |||
| - | * **Ziel** (z. B. „Sprich diesen Text in ruhigem Ton ein“) | ||
| - | * **Stimmlage / Stil** (freundlich, | ||
| - | * **Geschlecht / Sprache / Akzent** (sofern wählbar) | ||
| - | * **Format** (z. B. Audioclip, Podcast-Einleitung, | ||
| - | * **Länge / Sprechgeschwindigkeit / Pausen** | ||
| - | * **Optionale Hinweise zur Betonung** | ||
| - | |||
| - | → Je klarer du das gewünschte Ergebnis beschreibst, | ||
| - | |||
| - | ---- | ||
| - | |||
| - | ==== 🎧 Prompt-Beispiele: | ||
| - | |||
| - | **Prompt 1 – Begrüßung für Anrufbeantworter** | ||
| - | > Sprich folgenden Text in freundlichem, | ||
| - | Sprache: Deutsch / Stimme: weiblich / Tempo: normal | ||
| - | |||
| - | **Prompt 2 – Text für Erklärvideo** | ||
| - | > Erzeuge eine Sprachaufnahme dieses Textes im Stil einer YouTube-Erklärung (informativ, | ||
| - | „Heute sprechen wir über künstliche Intelligenz – und warum sie deinen Arbeitsalltag erleichtern kann.“ | ||
| - | |||
| - | **Prompt 3 – Podcast-Intro** | ||
| - | > Erstelle ein Podcast-Intro mit einer markanten, ruhigen männlichen Stimme. Sprache: Deutsch. Text: „Willkommen bei Zukunft Jetzt – deinem Podcast über Technologie, | ||
| - | |||
| - | ---- | ||
| - | |||
| - | ==== 📝 Prompt-Beispiele: | ||
| - | |||
| - | **Prompt 4 – Gespräch transkribieren** | ||
| - | > Transkribiere diese MP3-Datei in Textform. Sprichende Personen bitte kennzeichnen („Person A: …“, „Person B: …“). Sprache: Deutsch. | ||
| - | (→ Datei anhängen) | ||
| - | |||
| - | **Prompt 5 – Zusammenfassung aus Transkript** | ||
| - | > Fasse die wichtigsten Punkte dieses Gesprächsprotokolls stichpunktartig zusammen. Max. 5 Bulletpoints. | ||
| - | |||
| - | **Prompt 6 – Automatisches Kapitel-Markieren** | ||
| - | > Erkenne Themenblöcke im folgenden Transkript und erstelle passende Kapitelmarken mit Zeitstempeln. | ||
| - | |||
| - | ---- | ||
| - | |||
| - | ==== 🎶 Prompt-Beispiele: | ||
| - | |||
| - | **Prompt 7 – Hintergrundmusik generieren** | ||
| - | > Erzeuge ein 30-sekündiges Musikstück im LoFi-Stil mit entspannter Atmosphäre, | ||
| - | |||
| - | **Prompt 8 – Jingle für Podcast** | ||
| - | > Komponiere einen 5-Sekunden-Jingle für einen Technologie-Podcast. Stil: futuristisch, | ||
| - | |||
| - | **Prompt 9 – Soundeffekt (UI-Feedback)** | ||
| - | > Erzeuge einen kurzen Ton für eine Bestätigung in einer App (z. B. wenn ein Formular erfolgreich abgeschickt wurde). Stil: dezent, positiv, nicht aufdringlich. | ||
| - | |||
| - | ---- | ||
| - | |||
| - | ==== Tipps für Audio-Prompting ==== | ||
| - | |||
| - | * Stimme und Stil so präzise wie möglich beschreiben (z. B. „junger Sprecher mit leichtem Berliner Akzent“) | ||
| - | * Tempo, Pausen und Tonlage bewusst steuern („langsam und klar“, „schnell und energisch“) | ||
| - | * Bei längeren Texten: in Abschnitte aufteilen oder Gliederung vorgeben | ||
| - | * Output-Format angeben (MP3, WAV, geschnitten, | ||
| - | |||
| - | ---- | ||
| - | |||
| - | ==== Tool-Hinweise: | ||
| - | |||
| - | === 🧰 Übersicht nützlicher Audio-KI-Tools === | ||
| - | |||
| - | * **ElevenLabs** | ||
| - | - Extrem natürliche Stimmen (TTS) | ||
| - | - Unterstützt Mehrsprachigkeit, | ||
| - | - Ideal für Hörbücher, | ||
| - | |||
| - | * **Whisper (OpenAI)** | ||
| - | - Hochpräzise Transkription (viele Sprachen) | ||
| - | - Unterstützt auch Noisy Audio / Dialekte | ||
| - | - Ideal für Protokolle, Untertitelung, | ||
| - | |||
| - | * **Descript** | ||
| - | - Audio- & Videobearbeitung mit Textinterface | ||
| - | - Overdub (Stimme klonen), Umformulierungen, | ||
| - | - Für Podcasts, Interviews, Clips | ||
| - | |||
| - | * **Play.ht** | ||
| - | - Webbasierter TTS-Service mit vielen professionellen Stimmen | ||
| - | - Möglichkeit zur Feinsteuerung (Pausen, Tonhöhe etc.) | ||
| - | - Export als Audio-Dateien oder Player | ||
| - | |||
| - | * **AIVA** | ||
| - | - KI-Musikkomponist für Soundtracks, | ||
| - | - Steuerung über Musikstile, Emotionen, Strukturvorgaben | ||
| - | - Erzeugt MIDI und WAV-Dateien | ||
| - | |||
| - | * **Soundraw** | ||
| - | - Generiert lizenzfreie Hintergrundmusik nach Stimmung und Länge | ||
| - | - Ideal für YouTube, Werbung, Corporate Videos | ||
| - | |||
| - | * **Voicemod Text to Song / Voice AI** | ||
| - | - Spaßige Tools zur Musikgenerierung oder Stimmenverfremdung | ||
| - | - Eher experimentell, | ||
| - | |||
| - | ---- | ||
| - | |||
| - | → Weiter mit: [[handbook: | ||
handbook/formate/audio.1746706133.txt.gz · Zuletzt geändert: 2025/05/08 14:08 von 127.0.0.1
