こんなお悩みを解決します
Soraを試してみたい
WebRTC SFU Soraを使いたいけど ”どうしたらいいのかわからない”といったお悩みを解決します。Soraをサービス化するには多くの技術的な壁が存在しますが、私たちが提供する構築ソリューションを導入することでその壁を越えて行けます。
商用サービスで使いたい
WebRTC SFU Soraの機能を各種APIや認証機能を便利に使える様にラップして提供します。
通話はもとより録画や文字起こしAI要約の結果を簡単に管理できるので、一般的な商用のWebサービスに組み込む際の障壁がとても低くなります。
通話記録をAIでチェック
Zoom等の一般的なリモート会議システムでは通話利用とその記録と一体管理は困難です。リモート通話とその記録(動画と文字起こしとAI要約)に特化しているので誰でも簡単に使えて、通話記録をAI要約によりガラス張りにします。
WebRTC SFU Sora 構築ソリューションとは?
WebRTC SFU Sora を使ったサービスに必要となる
補完機能を一式備えたソフトウェアと
エンジニアリング&構築作業がセットになった
ソリューションです
基本パッケージソフトウェア
Sora用サービス化機能
WebRTC SFU Sora のサービス化に必要となる、IDaaSを使った認証(Soraのシグナリング時のWebフック)や通話ステータス管理やユーザロール機能や動画ファイルの管理や文字起こしといった便利な機能群を取り揃えています。
Sora用基本画面
WebRTC SFU Sora を直ぐに使える、基本的な画面機能が揃っています。通話に必要なロール別画面や画面共有や録画制御があるだけでなく、複数拠点表示やシークレット監視や呼出し対応機能により点在する拠点の監視にも活用できます。
生成系AI連携機能
録画完了に自動連動したSpeech-To-Textによる文字起こしと、文字起こし結果を主要な生成系AI_APIと連携した要約や都度解析が自由自在にできます。Claude(Anthropic)やChatGPT(OpenAI)の各種モデルが選択できます。
お客様オリジナルの機能にカスタマイズしたり
既存のシステムに拡張機能として組み込めます
エンジニアリングサービス
オリジナル機能の開発
基本パッケージソフトウェアのカスタマイズやオリジナル機能の開発を承ります。
Soraやクラウドに長けた私たちのエンジニアが担当することで、迅速な新サービスのローンチを確実なものにできます。
構築作業と運用保守
クラウドへの構築作業は、私たちのエンジニアにお任せ下さい。低コストに確実なかつ迅速に構築します。
運用に関する支援も可能ですのでご相談ください。
お客様オリジナルのシステム開発や構築を
私たちがお手伝いします
構築ソリューションでデキること
Sora用サービス化機能
WebRTC SFU Soraをサービス化するには様々な機能が別途必要になります。
IDaaSを使った認証(Soraのシグナリング時のWebフック)や通話ステータス管理やユーザロール機能や動画ファイルの管理や文字起こしといった便利な機能群を取り揃えています。
認証・認可機能
IDaaSを使った認証やアカウントロールをSFUサーバアクセス時や画面機能の中で統合的に認可利用できます。
録画動画や音声の管理
Soraの録画APIにIDaaSの認証を付けてセキュアに保存できます。Google Cloud StorageやS3等のオブジェクトストレージに保存することで低コストな運用ができます。
話者録画と合成
Soraの話者別録画動画の合成方法を自由にカスタマイズできます。レイアウト指定や画面共有録画の指定や音声のみの合成もできます(目的に応じた細やかなカスタマイズ)。
プライベートな通話環境
IDaaSを使った認証やアカウントロールをSFUサーバアクセス時や画面機能の中で統合的に認可利用できます。
通話の文字起こし
話者別の録画音声から「Speech-to-Text」による高精度な文字起こしができます。文字起こし結果は、発言別に時系列に管理されるのでDB管理やデータ処理が簡単にできます。
ChatGPT要約と議事録生成
話者別に時系列に保存された文字起こし結果をChatGPT(Powered by GPT-4)で要約できます。全ての会話テキストが保存されているので、話題や議題に対して自由な要約指示による議事録作成可能です。
Sora用基本画面
WebRTC SFU Sora には含まれていない、基本的な画面機能が揃っています。接客通話に必要なロール別画面や画面共有や録画制御があるだけでなく、複数拠点表示やシークレット監視や呼出し対応機能により点在する拠点の監視にも活用できます。Sora用基本画面のソースコードをベースにオリジナル画面のカスタマイズも可能です。
基本リモート接客画面
実際の接客現場の声やノウハウをフィードバックした、リモート接客や画面共有や録画制御といった便利で基本的な画面機能が揃っています。
すぐに、WebRTC SFU Soraを使った
サービスが構築できるだけでなく、細かなカスタマイズが可能です。
高精細カメラと画面共有
一般的な通話アプリで不満が多いカメラの映りを、Soraのパラメータを調整することでハードウェアエンコードの利用等で高精細化したり独自の品質に調整できます。画面共有の基本機能だけでなく、共有の仕方もカスタマイズできます。
多拠点監視モード
拠点側クライアントはキオスクモードで常時起動しています。各拠点のリアルタイム映像を1画面でまとめていつでも確認できます。まとめて監視することで無人状態の拠点管理の負担軽減に繋がり、来客時の素早い対応が可能です。
動画と会話文字列連動
接客履歴を動画と文字起こし結果を一緒に表示できるだけでなく、動画に合わせた文章がタイムラインにあわせて自動表示されるので画像と文字列の両方で会話の内容や雰囲気が確認できます。
AIがタイトル生成
接客記録の文字起こし結果から、AIが全体の文脈と内容を理解して、適せ且つ簡素な接客記録のタイトルを自動生成してくれます。もう面倒な内容確認やメモや振り返りして、タイトルを考える必要はありません。
わかりやすいAI議事録
文字起こし結果から、わかりやすい構成でAIが議事録を作成します。長すぎず短すぎない議事録が作成され通話内容が手に取るようにわかります。議事録作成フォーマットのカスタマイズも可能です。
自動でAI要約
WebRTC SFU Soraによる通話とその録画が完了すると、自動実行された文字起こし結果から、生成系AIが自動で要約結果を作成してくれます。記録された動画を見なくても、どんな内容だったか?直ぐにわかります。
自由プロンプトとチェック
文字起こし結果の全文が残っているから、何度でも色んな観点で通話内容を細かくチェックできます。文脈と意図をAIが判断するので、コンプライアンスやハラスメントといった重大事象を見逃しません。
エンジニアリングと構築作業のご紹介
オリジナル開発の委託
私たちのエンジニアにお任せ下さい。Soraやクラウド技術に長けたエンジニアがオリジナル機能の開発までお手伝いします。
構築をアウトソーシング
私たちのエンジニアに設計から構築作業までの全てをお任せ下さい。
クラウドやネットワークやAPI連携に長けたハイスキルなエンジニアが担当いたします。
ベストプラクティス
IDaaSやオブジェクトストレージやSpeech-to-TextやChatGPTのAPI連携のGoogle CloudにおけるSora構築のベストプラクティスを提供します。
運用と保守
私たちや運用保守専門パートナーによる運用と保守の相談も可能です。
お客様の声
実際にリモート接客や商用サービスでお使いの皆様の声
インサイドセールス部署を指揮しています。これまでZoomを活用してリモート接客とその録画をして接客記録として残していました。ただ、せっかく残していても録画を見返す必要があったり、動画と業務の紐付け管理が疎かになってしまって、録画しっぱなしになり・・・なかなか活用ができておらず記録の意味を成してないのが課題でした。このシステムの動画と会話文字列連動機能は、お客様と担当者の発言が個別に正確にトレースされており、録画データを全て見返す必要がなくなったのが大きな時間の節約になっています。
注文住宅のリモート接客に活用しています。以前は別のリモート接客システムを使っていたのですが、そもそもリモート通話画面のカメラ画質が粗かったり、画面共有についても同様にクォリティが低くて遅延も顕著でした。特に壁紙やカーテンの素材感を画面越しに伝えるのが難しく失注の一因になっていました。このシステムでは、私たちの接客業務に必要な解像度に設定することができて画質だけでなく遅延についても解決しました。4Kカメラを活用していますが、驚くほどリアルな画質で臨場感とレスポンスが速いので、お客様もまるでそこに担当者が居るようだと驚かれますね。特に高齢のお客様の反応が以前とは比べものになりません。
官公庁の特定業務向けにクローズドなWebRTCを用いた低遅延な通話システムの提案を検討していました。WebRTC SFU Soraの「SoraLabo」で検証までは出来たものの、システムに組み込むのにはどうすればいいか困っていました。この構築パッケージと支援サービスで基本的な部分が直ぐに整ったのにはとても助かりました。基本的な認証周りが揃っていて、拡張性も高く既存のWebシステムとの連動も容易でした。結果的に、単年度予算による公募にも間に合い短い期間で構築することができて、年度末にも余裕をもって納品ができました。今後も自治体向けの実証事業(PoC)等の案件にドンドン活用していくつもりです。
機能詳細一覧
WebRTC SFU Soraを補完する機能詳細について
WebRTC SFU Sora用サービス化機能
Sora接続数管理
WebRTC SFU Soraサーバの接続数を管理できます。Soraライセンスの接続上限や全体負荷管理に大変便利です。
SoraAPI認証
WebRTC SFU Soraの各種APIアクセスにIDaaSの認証やロールを利用できます
認証シグナリング
WebRTC SFU Soraのシグナリング時のWebフック等にIDaaSを使った認証が適用できます
認証機能
デフォルトでは、Googleの「Firebase Authentication」に対応しています。他のIDaaSにも対応可能です
認可(テナント)
マルチテナント機能を備え、テナント毎に自社スタッフと(店舗などの)拠点クライアントの認可処理ができます
ロール機能
スタッフや管理者といったロール設定とロールによるアクセス権限等をカスタマイズできます
拠点ステータス
拠点毎にリアルタムなステータス(監視モード、通話中等)を管理できます
通話ステータス
通話毎のリアルタイムなステータスを管理できます。開始から終了までのステータスをリアルタイムに管理します
録画制御
通話ステータスと連動したリアルタイムな録画に関する制御と録画データ保存ができます
録画合成
SoraのID別の録画ファイルを様々な合成オプション指定して合成ができます(並べ方/品質/音声のみ/他)
自動文字起こし
録画合成に連動して、自動でGoogleの「Speech-to-Text」による高精度な文字起こしができます
自動AI連携
Soraの録画終了と文字起こしに連動して自動で生成系API連携機能をと連携します
動画管理
IDaaSの認証を付けてGoogle Cloud StorageやS3等のオブジェクトストレージにセキュアに保存できます
文字起こし管理
IDaaSの認証を付けてGoogle Cloud StorageやS3等のオブジェクトストレージにセキュアに保存できます
WebRTC SFU Sora用基本画面
一括監視画面
リモート通話画面
会話履歴画面
一括監視画面
リモート接客サービス者向けの画面
リアルタイム監視
管理する全ての拠点(店舗等)を1つの画面でリアルタイム動画で確認できます
ステータス表示
拠点(店舗等)毎に接客状態等のステータスを表示できます
シークレット監視
拠点クライアント側には、管理側の画像や音声等は何も出力されません
リモート通話画面(接客担当者側)
接客担当者側のリモート通話画面
シークレット監視
画面表示しただけでは、拠点クライアント側には接客担当者側の画像や音声等は何も出力されません
入室・退室
明示的に「入室」することで顧客とリモート通話ができます。(退室するとシークレット監視へ)
画面共有
タイムラグ無しに高精細なコンテンツを画面共有できます。(画質のカスタマイズも可能)
録画制御
接客担当者による録画制御ができます。カスタマイズにより入室と同時に自動録画も可能です。
画質カスタマイズ
業務と端末負荷に応じた画質のカスタマイズが可能です
リモート通話画面(拠点クライアント・顧客側)
拠点に設置された顧客側のリモート通話画面
キオスクモード
キオスクモードで自動的に起動します(起動都度のセットアップの手間が不要)
イタズラ防止
サービスで表示状態を監視しており常に全画面表示を維持します。不意の表示切り替えを無効化します。
常時配信
キオスクモードで起動すると同時に自動的に配信が開始され、常時配信されます
被監視モード
接客担当者側が「入室」するまで一切の画像や音声を出力しません
サイネージ機能
被監視モード中に特定のコンテンツをループ再生できます
接客許諾
リモート接客開始時に、顧客側に接客に関する注意事項等の説明と許諾入力を求めることができます
録画同意
接客担当者による録画操作と連動して、顧客側に録画の同意を求めることができます
画面共有
ライムラグ無しに高精細な画面共有とコンテンツを中心とした見やすい表示ができます
被監視復帰
リモート接客の終了や接客担当者側の接続が切れると自動的に被監視モードに復帰します
画質カスタマイズ
業務と端末負荷に応じた画質のカスタマイズが可能です
会話履歴画面
会話の履歴一覧と個別の会話履歴の画面
合成動画再生
リモート通話参加者の動画を合成した動画を表示と再生ができます
話者分離
リモート通話参加者(話者)が明確に分離された会話履歴が表示できます
文字起こし表示
リモート通話参加者を別々にした文字起こし結果をスクロール表示します
動画文字連動
動画再生にあわせて文字起こしスクロールを連動して表示できます
発言動画再生
文字起こしスクロールから指定した発言箇所のクリックで動画をスキップ再生できます
AI要約表示
文字起こしされた全文をChatGPTが手短に要約した結果を表示できます
AI要約指定
文字起こしされた全文に対して任意の要約(ChatGPT)を指定して結果を表示できます
AI議事録
文字起こしされた全文をChatGPTが議事録にまとめた結果を表示できます
生成系AI連携機能(ChatGPT/Claude)
AI用文字起こし
録画合成に連動して、AIが解析し易い形式による文字起こしがAI解析精度を飛躍的にアップさせます
色々なAI選択
殆どのメジャーな生成系AIサービスとモデルが指定出来るので、いつでも最新のLLMが使えます。
ChatGPT連携
ChatGPT(OpenAI_API)へ文字起こし結果に対する要約(自由指定可)や議事録作成等の処理を連携できます
Claude連携
Claude(Anthropic_API)へ文字起こし結果に対する要約(自由指定可)や議事録作成等の処理を連携できます
AIタイトル
通話記録のタイトルをAIが自動で付けてくれます(端的でわかりやすいタイトル)
AI要約
AIが通話内容を適切な長さなの文章で要約してくれます(要約方法のカスタマイズ可)
AI議事録
文字起こしに連動して、AIによる議事録が作成されます(Markdown記法によるフォーマットのカスタマイズ可)
自由プロンプト
文字起こし結果の全文に対して、詳細な自由プロンプト入力によるチェックができます
注意事項
-
別途「株式会社時雨堂社 WebRTC SFU Sora」のライセンスが必要です
-
別途「Google Speech-to-Text」の契約が必要となり、文字起こし都度の利用料が発生します
-
別途「OpenAI」の契約が必要となり、要約や議事録生成の都度の利用料が発生します
クレジット
-
使用音源:OtoLogic(https://otologic.jp)