.." />

道具としてのコンピュータ

2012年1月22日
海外ドラマのDVDからオリジナルの英語教材を作る



時間ができたので、アメリカのドラマのDVD BOXを初めから見直すという暴挙に出ました。
NYを舞台にした4人の女性の恋物語を綴るあのドラマ。見るのはもう数回目。
そろそろ字幕無しで内容がわかるようになりたい…。

そこで、DVDから英語の字幕を抜き出してテキスト化し、
音声だけを音声ファイルにしてiPodに入れて、
いつでもiPod+テキストでリスニングの練習ができるようにしようと考えました。

ところが、調べていくうちに、DVDの字幕が画像ファイルであることが判明。
つまりテキストデータ化は難しいということなのかしら…。

一旦あきらめかけたのだけれども、さらに調査を進めると、
SubRipというソフトを使えば、画像ファイルの字幕から、
テキストデータを生成できるということがわかりました。

手順は以下の通り

  1. DVD Decrypterを使って、DVDのデータを自分のハードディスクにコピーする。
  2. ハードディスクに保存したデータから、SubRipで字幕を抜き出し、テキスト形式にして保存。
  3. Any Video Converterで、ハードディスクに保存したデータを、mp3に変換。

余力があれば、音声ファイルをAudacityでくっつけてみたり、わけてみたりするとよいかも。

SubRipはなかなか面白いソフトで、OCRで文字を認識している途中、
ソフトが認識できない文字にぶつかると、
「この文字はなんだ?」と手動での入力を求められます。
その手動で入力された文字に基づいて字幕の画像をテキストに変換しているようですが、
認識の精度はほとんど間違いないぐらい高く、
それほど手動で入力すべき文字も多くありません。
2時間のDVDの字幕を認識するのに、10分かからなかったのではないかと。

これで明日から、自分の好きな海外ドラマのスクリプトを読みながら、
通勤電車の中でヒヤリングの練習ができますね。
音声を聞いて、スクリプトを目で追って、
わからない単語が出てきたらいちいち調べるというのが、
とても勉強になると思います。

ちなみに、DVDからデータを抜く行為は、
法律的には「家庭内などで私的に利用するため」に認められているものですので、
良識に沿った利用をお願いします。

Related Posts