Amazon Polly、生成AI型TTSエンジンを10個の新音声と双方向ストリーミングAPIで拡張
Amazon Polly expands Generative TTS engine with 10 new voices, 2 new regions, and Bidirectional Streaming API
概要
Amazon Pollyの生成AI型TTSエンジンに、8言語対応の10個の新しい高表現力音声が追加されました。同時にロンドンとカナダ中部の2つの新しいAWSリージョンに対応し、双方向ストリーミングAPIが導入されました。これにより、大規模言語モデル(LLM)の出力をリアルタイムで音声合成できるため、チャットボットやゲームのキャラクター音声などの用途が容易になります。
何が変わったか
- ・10個の新しい生成AI型音声を追加(Tiffany、Brian、Aria、Jasmine、Florian、Ambre、Lorenzo、Beatrice、Lennart、Sabrina)
- ・ロンドンとカナダ中部の2つの新AWSリージョンで生成エンジンを利用可能に
- ・双方向ストリーミングAPI対応により、テキストをストリーム送信して音声を同時に受け取り可能
影響
LLMベースのインタラクティブシステムを構築するデベロッパーは、より自然な音声対応アプリケーションを低レイテンシーで実装できるようになります。グローバル展開するアプリケーションはより多くのリージョンでサービス提供が可能になり、ユーザー体験が向上します。
対象ユーザー
LLM開発者音声対応アプリケーション開発者チャットボット構築者ゲーム開発者コンテンツクリエイター
まとめ
会話型AIと音声対応アプリケーションのための生成音声合成機能の大幅な拡張といえます。
原文タイトル
Amazon Polly expands Generative TTS engine with 10 new voices, 2 new regions, and Bidirectional Streaming API
AWS公式アナウンスを読む →