Organizations

2 results for SSML
  • 概要 最近AmazonConnectを触っていますが、ConnectではAmazonPollyによる音声読み上げに対応しており、一般的な用語に関しては日本語でも比較的スムーズな発音で読み上げてくれます。 しかし、造語だったり、復数の意味があるものだったりすると自然な発音をしてくれない場合があります。 そこで、調べてみると、AmazonPollyではSSML(Speech Synthesis Markup Language)というXMLベースのマークアップ言語を使うことで、読み上げ方をカスタマイズできるそうです。 12ヶ月は500万文字まで無料で、超えても3100文字で0.01USDなので試してみることにしました。 AmazonPollyの料金 中々発音が疑問になるような単語を探すのが難しいのですが、今回はいつもお世話になっている「はてなブックマーク」を選択してみました。 SSMLを使わないパターン まずはSSMLを使わずに、プレーンテキストにします。 https://inamuu.com/wp-content/uploads/2020/04/polly_01.mp3 そのままだと「はてなブックマーク」の「ブック」が強調されて、やや違和感があります。(いやこれが正しいんだという意見もあるかもしれませんが、一応Youtubeではてなの中の人の発音を聴いて判断してます) SSMLを使ってみる 早速SSMLを使って書いてみます。 文字を強調したり、速度を変えたりすることで雰囲気を変えられるようですが、今回はピッチを調整するようにしました。 <speak> <prosody pitch="-20%">はてな</prosody> <prosody pitch="0%">ブック</prosody> <prosody pitch="+10%">マーク</prosody> </speak> https://inamuu.com/wp-content/uploads/2020/04/polly_02.mp3 今度は、ブックマークの部分はマークの部分が強くなったので自然になった反面、「はてな」の部分が尻下がりになりました。 これでも良さそうですが、より普通っぽくするには「はてな」を平坦にしたいと思い、思考錯誤した結果が下記です。 <speak> <prosody pitch="-20%">ハテナ</prosody> <prosody pitch="0%">ブック</prosody> <prosody pitch="+10%">マーク</prosody> </speak> https://inamuu.com/wp-content/uploads/2020/04/polly_03.mp3 「はてな」の部分をカタカナの「ハテナ」へ変更しました。 こうした所、「はてな」の部分のアクセントが無くなり、意図したアクセントの発音になりました。 なお、音声を女性のMizukiからTakumiに変えた所、マークが強調されて逆におかしく聴こえるようになりました。 音声によっても、微調整が必要そうです。 まとめ 今回はAmazonConnectの流れで、Pollyを試してみました。 機械音声だから、ある程度のアクセントの微妙さは仕方がないと思いつつ、アレクサのように喋らせたいと思ったら同様にSSMLを調整することで、自然な発音になりそうです。 どうしても日本語の処理は微妙になりがちですが、今はこのようにやればある程度は調整ができるので、アレクサ開発やAmazonConnectのアナウンスで調整してみようと思います。 <p style='padding: 5px;'>
    AmazonConnect AmazonPolly AWS SSML Created Wed, 15 Apr 2020 12:38:04 +0000
  • 概要 AmazonConnectでコールセンターを提供したいと考えた場合、幾つかの設定を変えないと、そのままでは意図しない英語のメッセージが流れることがあります。 Connectではデフォルト設定ですぐに始められるようになっている分、自動的に流れるアナウンスや英語設定のままになっているところがあります。 そのため、日本語で対応をしたい場合の初期セットアップをメモしておきます。 顧客キュー 単純な日本語分岐でループなどを考えない一方通行のフローでしたら、問い合わせフローエディターで一番最初に 音声の設定 でMizukiかTakumiを選べば日本語になります。 しかし、一般的にコールセンターであれば対応出来るメンバー(AmazonConnectではエージェントと呼ばれる権限)は人数が限られ、その人数を超えた場合に問い合わせがあると待機状態になります。 AmazonConnectではこれを顧客キュー という名前でループさせることが可能です。 デフォルトでは、顧客に対してキューに入ると一度 英語 のアナウンスが流れてから軽快なメロディーが流れ出します。 Thank you for calling. Your call is very important to us and will be answered in the order it was received. と聴こえたら Default customer queue という顧客キューのキューに入った状態です。 英語が突然流れてきたら顧客は驚いてしまいますので、下記手順で新らたに顧客キューを作成してあげることで英語を流さないようにする(または日本語アナウンスにする)ことが可能です。 まず、Connectへログインして、問い合わせフローエディターのルーティングから問い合わせフローを選択します。 次に「顧客キューフローの作成」を選択します。なお、このプルダウンの選択を間違えるとあとから変更が出来ないのでよく見て選択しましょう。 顧客キューフローで必須なのは エントリーポイント→プロンプトのループ→エラー時の処理→終了 です。 プロンプトのループでは幾つかデフォルトで選択できるwav形式のファイルがあり、そこから待機音楽が流せます。 もしも、キューに入れる前に 現在混み合っております 的なメッセージを流したければ、ここで一度プロンプトの再生でテキストメッセージを流してからループに入れるのが良さそうです。 ここまできたら、後はメインの問い合わせフローをエディタから開き、対象のキューにセットしたい箇所でセットします。 今回は分岐を入れていませんが、顧客の押下したボタンの番号に応じて、キューを分けることが可能です。 分岐の後に顧客キューをセットするのが良さそうです。 ここまで実施すると、簡単な問い合わせフローが日本語で設定出来ます。 分岐先にLambdaを設定したり、Lambdaが返した戻り値をそのままConnectで流すことも可能です。 まとめ 昨年、とある業務で簡単なフローはAmazonConnectで作成できましたが、コールセンターのフローまでは未検証でした。 今回ちょっと検証してみたことで、小さなコールセンターであれば対応できる人さえいれば、数日以内には作成できてしまうでしょう。 他にも、Lambda連携をすることで、プログラマブルに電話をハックすることが出来て大変面白いツールになっていますし、メッセージもAmazonPollyがデフォルトで対応していて日本語にも対応しているため、若干機械音声ではあるもののテキストを自動音声でそのまま読み上げてくれます。(英語は流暢に聴こえます) 大変便利なツールなので、是非試してみてください。 <p style='padding: 5px;'>
    AmazonConnect AWS SSML コンタクトセンター Created Tue, 14 Apr 2020 10:43:20 +0000