英語の音声をテキスト化するスクリプトです。 PythonのSpeechRecognizerとIBM BluemixよりSpeech To Text-ew APIを使用しています。
- IBM Bluemixにサインアップする(未登録の場合)
- Speech To Text-ew APIを使えるようにしておく
- コード内に資格情報を入力する
- スクリプトと同じディレクトリに"test.wav"という名前のWaveファイルを置く
- スクリプトを実行する
- 任意のWavファイルを指定できるようにする
- スクリプトを実行する際にファイル名を引数で与えられるようにしたい
- 標準入力で与えられるようにしたい
ls *.wav
とかやった結果をパイプでつなげたら複数のファイルを連続してテキスト化できるのでは?という野望