40 views
【0】連載内容
(134)【Google Cloud TTS #1】子どもの英会話学習教材を作りたい! ←今回はココ
(135)【Google Cloud TTS #2】Google Cloud側の準備作業
(136)【Google Cloud TTS #3】自前サーバー側の準備作業(Ubuntu24)
(137)【Google Cloud TTS #4】WEBブラウザから実行
(138)【Google Cloud TTS #5】話す速度をゆっくりに
(139)【Google Cloud TTS #6】声の大きさ、声の高さを変える。
(140)【Google Cloud TTS #7】Webブラウザ上で話者(Voice)を指定可能に
(141)【Google Cloud TTS #8】二人以上の会話を入力可能に
(142)【Google Cloud TTS #9】英会話教材を作る。(一先ず完結)
【1】やりたいこと
(1) 使用目的
我が家の子どものための英語教材を自作している。
例文を作ることはできるのだが、私のインチキ英語の音声を教材にはできない。
そこで、TTS(Text To Speech)プログラムを使うことにした。
(2) 候補
ElevenLabs

ElevenLabsは生成された音声の質が非常に高いが、高額だ。
登場人物A, Bなど、複数人の声が交差する会話文を作る方法がよくわからない…
Google Cloud TTS

まだ検討中だが…
従量課金制で費用を抑えられそうだし、Geminiに聞けば有用な情報がたくさん得られそうなので、
まずは Google Cloud TTSを試してみることにした。
(3) 実行環境
ざっくりと、作りたいものはこんな感じです。

1) パソコンの Webブラウザ上で英会話テキストを入力し、[TTS実行] ボタンを押下する。
2) Ubuntu24上で動作する Webサーバ経由で Pythonスクリプトを実行(=TTS API呼び出しを実行)する。
3) Google Cloud TTSから変換後の音声データを受け取る。
4) 音声データを MP3ファイルに変換し、Webブラウザ上で再生させる。
先ずは動く物を作ってみよう。
目的に適わないモノであれば、他の選択肢を試してみるまでだ。
※Linuxサーバは、Windows11 Pro上の仮想マシン Hyper-V上で動作させている。
→ Webブラウザを動かすパソコンと、Linuxサーバは、同じ物理マシン上で動作している。
→ 物理マシン 1台だけで環境構築する。
(4) Google Cloud TSの参考情報
Python Client library : google-cloud-texttospeech
APIとリファレンス
料金
Cloud TTS クライアントライブラリ
Cloud Text-to-Speech を使うには billing を有効化
サポートされている音声と言語 (※サイト閲覧が重いので注意)