Der Wortlaut des Visuellen

Youtube Untertitel auslesen – kopieren / Captions

Inmitten von so manchem Youtube-Video verstecken sich kleine ‘Textschätze’ in Form von Vidotranskripten. Mittels einer kostenlosen Software namens Google2Srt lassen sich diese auslesen. Im Folgenden ein Beispiel, wie man die Untertitel auslesen kann.

Wer gern die Untertitel aus den Youtube-Videos heraus kopieren möchte und nicht gerade den Text transkribieren möchte, muss erst mal feststellen, dass der Text quasi im Video eingebettet ist und dass man nicht ohne weiteres an den Inhalt heran kommt.

Ich habe dazu mal nach “Youtube Captions download” gesucht und folgende nützliche Software gefunden:
Google2SRT . Damit lassen sich eben genau diese Untertitel aus den Videos herunterladen und als SRT-Datei speichern.

Dies ist ein spezielles Format, mit der man die Untertitel direkt in andere Videoplayer einbinden kann und den Text zum Video anzeigen lassen kann. Ein ganz nützliche Funktion muss ich schon sagen. Hier mal ein Beispiel, anhand von einem Video von Matt Cutts:

Video – Is Google Analytics data a factor in a page’s ranking?

00:00:00,000 –> 00:00:05,620
Wir haben viele Fragen von A aus San Francisco erhalten. A fragt: “Werden die
2
00:00:05,620 –> 00:00:12,620
Statistiken aus Analytics, wie Absprungrate und Besuchszeit als Faktoren fürs Ranking einer Webseite
3
00:00:12,849 –> 00:00:15,628
oder Domain benutzt?” Gleich gebe ich die kurze Antwort. Aber vorher erzähle ich eine kleine Geschichte:
4
00:00:15,628 –> 00:00:21,719
Vor einigen Jahren wurde ich auf der PubCon, einer WebmasterWorld-Konferenz, gefragt
5
00:00:21,719 –> 00:00:27,039
“Verwendet ihr Google Analytics im Webspam-Team?” Und ich sagte: “Es wird vom Webspam-Team
6
00:00:27,039 –> 00:00:31,820
nicht verwendet und ich verspreche, mein Team wird niemals ans Analytics-Team herantreten, um diese Daten zu verwenden.”
7
00:00:31,820 –> 00:00:35,869
Und wir haben uns an dieses Versprechen gehalten. Bei der letzten PubCon wurde ich das wieder gefragt.
8
00:00:35,869 –> 00:00:38,949
Ich antwortete: “Ich weiß, dass wir das nicht im Webspam-Team verwenden.

Das Ganze funktioniert also wunderbar. Gratis dazu kann man sich gleich noch die Untertitel in einer zweiten Sprache, bei dem Video sind deutsche und englische Untertitel verfügbar, mit downloaden. Also: Ein absolut gelungenes kleines Programm.

Wenn die automatische Transkription von Youtube mal richtig funktionieren sollte, zumindest bei Aufzeichnungen, die langsam und deutlich gesprochen sind, um keinen Wortsalat zu erhalten, dann wird es richtig interessant – weil dann die gesprochenen Videoinhalte durchaus in die Suchergebnisse mit einfließen könnten, zumindest hätte Google jetzt schon die Möglichkeit dies zu tun… Bislang ist es aber ähnlich wie bei Sprachaufzeichnungen die automatisch in Text umgewandelt werden sollen, es hapert an der Umwandlung von ‘natürlicher Sprache’, sprich wenn mehr als ein Sprecher vorhanden ist, Dialekt, Hintergrundgeräusche da sind etc., dann erhält man nur Sinn entstellte Fetzen aus der Audioaufzeichnung. (vgl. Youtube Videotranskription)

Was ich mir noch als recht interessante Funktion bei Youtube’s Untertiteln vorstellen könnte, wäre eine Art Verbesserungsoption der Untertitel, dass User die Texte, ähnlich wie bei Google Translate, verbessern könnten. In Verknüpfung mit einem Mechanical-Turk-Crowd-Sourcing Programm whatsoever durchaus vorstellbar und vor allen Dingen für Google eine durchaus beachtliche Quelle für zusätzliche (barrierefreie) Inhalten.

In eigener Sache: Transkriptionsservice gesucht? Wir transkribieren Interviews, Audio- und Videoaufzeichnungen. Damit werden Videoinhalte mit Mehrwert versehen und wortgetreu verschriftlicht. Damit haben Nutzer etwas zum Lesen und Google weiß was gesagt wird.

Verwendete Suchbegriffe:
  • youtube untertitel download
  • yhs-elex_myv9
  • untertitel youtube download
  • untertitel von youtube downloaden
  • untertitel von youtube kopieren
  • YOUTUBE CAPTIONS DOWNLOAD
Stichworte: , , ,
3 Kommentare auf “Youtube Untertitel auslesen – kopieren / Captions
  1. Frank sagt:

    Hi, interessanter Beitrag! Habe mir Google SRT mal angeschaut, aber so recht will es nicht klappen. Kennt jemand ein Tool für die Untertitelung von Youtube Videos?
    Perfekt wäre so etwas wie F4 Audiotranskription nur eben mit SRT Export…

    P.S. Videotranskripiton hat enormes Potential – müssen nicht immer Untertitel sein, aber allein, dass Bildinhalte als Text ausgegeben werden… da geht einiges! :)

    MfG
    Der Frank

  2. christian sagt:

    Hilfe … ich versuche auch verzweifelt, ein Video mit englischen Untertiteln zu übersetzen und dann neu einzustellen, habe das auch schon mal gemacht, ich weiß aber nicht mehr wie ???????
    Hat YT etwas geändert oder komme ich nur nicht mehr darauf wie ich es damals gemacht habe ??
    Ich bin für jeden Tipp dankbar! Danke auch für diesen Ansatz hier, aber irgendwie scheint’s nicht zu funktionieren, zumal sich das STR Programm gar nicht erst öffnen lässt und ich weiß ich habe es (damals) anders gemacht und es war relativ einfach!

  3. tikoim sagt:

    Hallo Christian,

    habe es eben nochmal live getestet – via Google2SRT runterladen, Google2SRT.jar starten. Du brauchst Java dafür – ist auch Open Source – dann funktioniert es.
    Der Artikel liegt schon eine Weile zurück – aber war gerade eben selbst erstaunt, dass es in 2 Sekunden die SRT geladen hat – das Transkript – Wow, ich glaube das muss ich mir doch mal wieder anschauen :)

    Achso, wiedereinstellen… das lässt sich dann im selbst hochgeladenen Video bei den Optionen festlegen -> Unter Sprachen…
    MfG
    Heiko

// Metabox
Wann erstellt Youtube eine automatische Transkription / Untertitel?
Die automatische Untertitelung von Videos auf Youtube erfolgt nur, wenn das Ausgangsmaterial bestimmten Kriterien entspricht. Relavant sind laut Youtube die Videolänge, Sprache (siehe unterstützte Sprachen), die Klang-/Sprachqualität, lange Pause am Anfang des Videos und mehrere Sprecher.
vgl. Youtube Hilfe

Anmerkung: Die Qualität der automatischen Untertitelung ist z.T. recht gut bei klaren und deutlichen Aufzeichnungen mit nur einem Sprecher. Dennoch, selbst bei professionellen Sprechern werden nicht alle Wortlaute fehlerfrei übertragen. Die Komplexität von Sprache und Intonation erfordert für eine genaue Transkription eine manuelle Abschrift.