Pythonやってみる!

(139)【Google Cloud TTS #6】声の大きさ、声の高さを変える。

113 views

【0】連載内容

(134)【Google Cloud TTS #1】子どもの英会話学習教材を作りたい!
(135)【Google Cloud TTS #2】Google Cloud側の準備作業
(136)【Google Cloud TTS #3】自前サーバー側の準備作業(Ubuntu24)
(137)【Google Cloud TTS #4】WEBブラウザから実行
(138)【Google Cloud TTS #5】話す速度をゆっくりに
(139)【Google Cloud TTS #6】声の大きさ、声の高さを変える。 ←今回はココ
(140)【Google Cloud TTS #7】Webブラウザ上で話者(Voice)を指定可能に
(141)【Google Cloud TTS #8】二人以上の会話を入力可能に
(142)【Google Cloud TTS #9】英会話教材を作る。(一先ず完結)

【1】やりたいこと

声の大きさ(=音量)を変えたい。
声の高さ(=ピッチ)を変えたい。

これも前回投稿と同様に AudioConfigクラスで指定できる。

【2】やってみる

こちらの AudioConfigクラスのリファレンスページを参照されたい。
Class AudioConfig (2.34.0)

(1) 声の大きさを変える。

AudioConfigクラスの生成時に、引数 volume_gain_db で話す音量を指定できる仕様だ。

データ型float
初期値0.0 [dB]
指定可能な範囲-96.0 ~ 16.0 [dB]

プログラム中では以下のように指定すればよい。

    audio_config = texttospeech.AudioConfig(
        audio_encoding = texttospeech.AudioEncoding.MP3,
        speaking_rate = 0.7,
        volume_gain_db = 9.0      # 音量を 9.0 [dB]上げる。
    )

(2) 声の高さを変える。

AudioConfigクラスの生成時に、引数 pitch で声の高さを指定できる仕様だ。

値の単位は semitones, すなわち半音だ。
 → 4を指定すると “ド” が “ミ” になる。

データ型float
初期値0.0
指定可能な範囲-20.0 ~ 20.0

プログラム中では以下のように指定すればよい。

    audio_config = texttospeech.AudioConfig(
        audio_encoding = texttospeech.AudioEncoding.MP3,
        speaking_rate = 0.7,
        volume_gain_db = 9.0,
        pitch = 4.0      # 音階を 4半音上げる。
    )

アクセス数(直近7日): ※試験運用中、BOT除外簡易実装済
  • 2026-05-07: 0回
  • 2026-05-06: 0回
  • 2026-05-05: 1回
  • 2026-05-04: 0回
  • 2026-05-03: 0回
  • 2026-05-02: 0回
  • 2026-05-01: 0回
  • モバイルバージョンを終了