プロのように音声合成ソフトウェアを使用する方法

03/22 2021
スマホを持つ男性
(画像: © Pixabay)

IBMによると、史上最速のタイピング速度の世界記録はシカゴ出身のステラ・パジュナス氏が保持しているという。1946 年に、彼女はピーク時に IBM 電動タイプライターを使用して 1 分あたり最大 216 ワードを入力することができました。しかし、人間の平均的なタイピング速度はそれよりはるかに遅く、1 分あたりわずか 44 ワードであったため、彼女の偉業は奇妙でした。

それに比べて、最高の音声テキスト変換ソフトウェア(新しいタブで開きます) プラットフォームの 1 つであるDragon Professional (新しいタブで開きます) を使用すると、1 分あたり 160 ワードと同等のタイピング速度でディクテーションを行うことができます。したがって、音声文字起こしは、正しく行えば、入力するよりもはるかに高速であることは明らかです。手首や指への負担も軽減されます。まだ試したことがない場合は、次のヒントとコツを参考にして最大限に活用できるようにお手伝いします。

1. 購入する前に試してください

プレミアム音声テキスト変換アプリケーションに 300 ドルを費やす前に、利用できる無料のオプションやトライアルがたくさんあります。それほど正確ではありませんが、本格的に作業に入る前にプロセスを把握するのに役立ちます。たとえば、Google ドキュメントには独自の音声テキスト変換機能があり、[ツール] > [音声入力] に移動してアクセスできます。 。ビジネス以外のアカウントでも完全に無料で利用できます。Microsoft 365 (新しいタブで開きます)のサブスクリプションをお持ちの場合は、 Word (新しいタブで開きます)に組み込まれている音声ディクテーション アプリを使用することもできます。

2. 良いマイクを使用する

始めるにはある程度の投資が必要です。具体的には、優れたマイク(新しいタブで開きます)は、周囲の騒音に邪魔されずに言葉を正確に転写するのに大いに役立ちます。 

ハイエンドでは、ノイズキャンセリング機能と優れたオーディオ品質を備えたRazer Seiren Elite (新しいタブで開きます)をお勧めします。ただし、プロのストリーマーやポッドキャスターを対象としているため、かなり高価です。現時点では、小売価格 $199.00USD で入手可能です。他の選択肢には、Rode NT-USB Mini や Samson Meteorite などがあります。これらは比較的低予算で、優れた音声テキスト変換ソフトウェアと組み合わせて使用​​できる推奨事項です。 

3. スマホで録音しない

Android と iOS には、優れた音声テキスト変換アプリケーションがたくさんあります。試してみたいと思うかもしれませんが、文字起こしのためにスマートフォン(新しいタブで開きます)を使用して長時間の音声を録音するのは賢明ではありません。最も強力なスマートフォン アプリであっても、デスクトップのアプリに比べて機能が少なく、品質も劣ります。スマートフォンは、電子メールの簡単な返信や音声メモを書き取るのにはまだ適していますが、より野心的な場合は、デスクのコンピューターとマイクに取っておく必要があります。

4. 最初に草案の概要を説明します

音声テキスト変換アプリケーションでディクテーションを開始する前に、箇条書きを使用して下書きの概要を説明します。または、取り上げる予定のすべての重要事項をまとめたマインド マップ(新しいタブで開きます)を作成してみることもできます。これにより、ディクテーション中の気まずい一時停止や突然のエラーを回避し、フローに一貫性があり、ドラフトがプロフェッショナルに見えるようにすることができます。 

話す前に文の間に一時停止し、十分な時間をかけて考えをまとめるようにしてください。音声ディクテーション(新しいタブで開きます) は最終稿を目的としたものではないため、原稿を提出する準備が整う前に、編集や校正を行うことが期待できます。

5. コマンドを学ぶ

音声ディクテーションは、自然に話すことと同じではありません。話しているときでも、テキストをフォーマットするために多くのコマンドを使用することが期待されます。最も頻繁に使用するコマンドには、「改行」、「カンマ」、「ピリオド」が含まれます。「感嘆符」、「開始引用符」、「終了引用符」、「コロン」、および「セミコロン」で使用できるコマンドは他にもあります。「スマイリーフェイス」などのコマンドを使用してテキストに絵文字を追加することもできます。

6. プレースホルダーを使用する

テキスト内に頻繁に使用する必要がある名前や用語などの難しい単語がある場合、音声認識ソフトウェアがそれを適切に検出できない場合があります。そのような場合は、代わりに単純な単語を使用し、ワープロ ソフトウェアの検索と置換機能を使用して、後で正しい単語で編集することができます。これは、綴りの難しい名前の技術的なホワイトペーパーや架空の物語を書くときに特に便利です。

7. 複数の話者の録音を避ける

ほとんどの音声テキスト変換アプリは、複数の話者向けに設計されていません。人の声には独自のレベルのピッチと大きさがありますが、非常に特殊なアクセントを持つ人もいます。このため、双方向電話通話など、複数のスピーカーを使用して音声を書き写すことは避けたほうがよいでしょう。 

ただし、これは常に可能であるとは限りません。特に、多くのインタビューや他の人との会話を文字に起こす必要がある仕事をしている場合はそうです。その場合は、Otter など、複数の話者を念頭に置いて設計された音声テキスト変換アプリケーションに投資してみてください。ソフトウェアではうまくいかない場合は、人間の文字起こしを雇ってみるのもいいでしょう。

8. 適切なソフトウェアを選択する

最後のヒントは、ユースケースに適したソフトウェアを選択する必要があるということです。メモを取ったり、電子メールの返信の下書きを作成したりするのに適した専用のアプリケーションもあれば、長文の記事、書籍、ホワイトペーパーを書くのに適したアプリケーションもあります。 

結論

これまで音声転写(新しいタブで開きます)ソフトウェアを使用したことがない場合は、すべての機能を適切に使用できるようになるまでに学習曲線が必要になる可能性があります。ただし、これらの便利なヒントやコツを知っていれば、最初の草稿に取り組む際の手間を軽減できます。最初の数回の試みを勇気を持って乗り越えたら、音声テキスト変換ソフトウェアを使用して文章を書き起こすと、時間と労力を大幅に節約できます。