ITで遊ぶ

録音した会話を文字おこしするひとつの方法(Mac)

家人が数時間分の会話の文字起こしをしなきゃいけない、ということでいろいろ調べた。

まずほとんどのソフトウェアが役にたたない。
録音を聞きながら本人がタイピングすることが前提なんだよね。頭が固いというか。
好きなところで再生を止められるとか、どーでもいい機能しかない。

もちろん音声認識ソフトを試したが役にたたない。
比較的優秀なものがコレ。

https://www.ibm.com/watson/jp-ja/developercloud/speech-to-text.html

なぜ音声認識ソフトがダメかというと、会議室でもどこでもノイズがすごい。
机をいじっていたり、横を人がとおたり、外を車がとおったり。
本人たちは静かな部屋で会話していたつもりが録音を聞くとノイズだらけ。

巷には「Audacityを使えばノイズは取れる」とかいう寝ぼけた記事が多いが、明らかに自分でやっていない。
実際のインタビューを処理すると、声自身が消えてしまい優秀なGoogleさんの音声認識エンジンにもかからない。

このノイズを取らないと音声認識ソフトさんもきついだろう。

Webサービスなどで音声ファイルを有料で音声認識ソフトで文字起こししますなんてありますが、嘘です。お金払わないでください。

さんざんやってみましたもん。

おそらくNTT、富士通、NECやGoogle, Microsoft, Amazonなど音声認識装置を売っているところはノイズ軽減方法をもっているでしょうけれど、借りる、買うとなるとすごい値段じゃないでしょうか。

だって理論的に考えてむつかしいもん。

役にたたない音声ファイルに大金払わないようにね!

だから!

Macについてる「音声入力」でええやん。
静かな部屋で録音を聞きながら、再度、同じ言葉を話すとしっかり記録される。

Macの場合、
リンゴマーク->システム環境設定->キーボード->音声入力
でオンにすれば、機能が導入されます。

これはMac OSの機能なのでWord上でもPages上でもメモ上でも動作します。

ちなみにiPhone用のマイク付きイヤフォンをイヤフォン端子につっこむと、付属のマイクを使えます。

もし、クリアな録音ならばUSBからマイクとイヤフォン端子を出せるアダプターが安く売られています。
それで直結を試してみてもいいのではないでしょうか。

ご参考まで。

関連記事

  1. ハッカー、セキュリティエンジニアと法律

  2. モバイルファースト2

  3. 木村岳史さんのSI会社再生説には賛成しかねる

  4. M1 Mac(Monterey)にm5stackのための開発環境を

  5. Generative AIは日本人には特に危険

  6. Macのドットファイル(._)を消す

  7. EUの消費者データ保護

  8. AppleのアプリRemoteに感動

記事をプリント