40 views

【0】連載内容

【1】やりたいこと

(1) 使用目的

我が家の子どものための英語教材を自作している。
例文を作ることはできるのだが、私のインチキ英語の音声を教材にはできない。
そこで、TTS（Text To Speech）プログラムを使うことにした。

(2) 候補

ElevenLabs

ElevenLabsは生成された音声の質が非常に高いが、高額だ。
登場人物A, Bなど、複数人の声が交差する会話文を作る方法がよくわからない…

Google Cloud TTS

まだ検討中だが…
従量課金制で費用を抑えられそうだし、Geminiに聞けば有用な情報がたくさん得られそうなので、
まずは Google Cloud TTSを試してみることにした。

(3) 実行環境

ざっくりと、作りたいものはこんな感じです。

1) パソコンの Webブラウザ上で英会話テキストを入力し、[TTS実行] ボタンを押下する。
2) Ubuntu24上で動作する Webサーバ経由で Pythonスクリプトを実行（＝TTS API呼び出しを実行）する。
3) Google Cloud TTSから変換後の音声データを受け取る。
4) 音声データを MP3ファイルに変換し、Webブラウザ上で再生させる。

先ずは動く物を作ってみよう。
目的に適わないモノであれば、他の選択肢を試してみるまでだ。

※Linuxサーバは、Windows11 Pro上の仮想マシン Hyper-V上で動作させている。
　→ Webブラウザを動かすパソコンと、Linuxサーバは、同じ物理マシン上で動作している。
　　→ 物理マシン 1台だけで環境構築する。

(4) Google Cloud TSの参考情報

Python Client library : google-cloud-texttospeech
APIとリファレンス
 料金
 Cloud TTS クライアントライブラリ
 Cloud Text-to-Speech を使うには billing を有効化
 サポートされている音声と言語（※サイト閲覧が重いので注意）

アクセス数（直近7日）: ※試験運用中、BOT除外簡易実装済

2026-03-31: 1回

2026-03-30: 1回

2026-03-29: 3回

2026-03-28: 8回

2026-03-27: 5回

2026-03-26: 9回

2026-03-25: 12回