音声エンジン: OpenAI の合成音声における画期的な進歩

OpenAI著名な人工知能研究組織であるは、29 月 2022 日にブログ投稿を公開し、最新の開発である音声エンジンについて説明しました。 15 年後半に作成されたこのモデルは、XNUMX 秒の音声サンプルとテキスト入力のみを使用して、元の話者によく似た自然な音声を生成できます。このテクノロジーは素晴らしいものですが、OpenAI は悪用の可能性があるため、その広範なリリースには慎重です。

Voice Engine は、OpenAI のテキスト読み上げ API でプリセット音声を強化したり、ChatGPT Voice および Read Aloud 機能を強化したりするなど、さまざまなアプリケーションですでに使用されています。 Voice Engine の実世界のアプリケーションをより深く理解するために、OpenAI は 2022 年後半から、選ばれた信頼できるパートナーのグループと協力してきました。

これらのコラボレーションは興味深い結果を生み出しており、Age of Learning は音声エンジンを使用してパーソナライズされた教育コンテンツを作成し、HeyGen は音声エンジンをビデオ翻訳に使用し、Dimagi は音声エンジンを使用して地域の医療従事者にインタラクティブなフィードバックを提供するなど、興味深い結果を生み出しています。この技術は医療分野でも試験的に導入されており、ライフスパンのノーマン・プリンス神経科学研究所は言語障害のある患者の音声を復元するためにこの技術を使用しています。

しかし、OpenAI は、特に選挙の年には、人々の声を忠実に模倣した音声の生成に伴うリスクを十分に認識しています。これらの懸念に対処するために、同社は、同意のないなりすましの禁止、元の話者からの明示的な許可の要求、生成された音声の出所を追跡するための透かしの使用など、パートナー向けの安全対策と使用ポリシーを導入しました。

<!–

使用されていません

–>

合成音声技術の進歩に伴い、OpenAI は主張する責任ある展開を確実にするための積極的な措置を講じます。これには、機密情報に対する音声ベースの認証の段階的な廃止、AI の機能と限界についての一般の教育、視聴覚コンテンツの出所を追跡する技術の開発などが含まれます。

AI の安全性への取り組みに沿って、OpenAI は音声エンジンをプレビューすることを決定しましたが、現時点では広くリリースしないことを決定しました。これらの洞察を共有することで、同社は合成音声の将来と、悪用のリスクを軽減しながらその可能性を活用するために必要な手順についての会話を開始することを目指しています。

OpenAI の発表に対するいくつかの反応は次のとおりです。

音声 AI は最も危険な手段です。

超人的で説得力のある声に対しては、私たちは最小限の防御策を持っています。

これに対して何をすべきかを考えることは、私たちの最優先事項の 1 つです。

(sota モデルはありましたが、このような理由でリリースされませんでした。例: https://t.co/vjY99uCdTl) https://t.co/fKIZrVQCml

— エマド acc/acc (@EMostaque) 2024 年 3 月 29 日

銀行口座の音声認証を無効にしていない場合や、AI 音声偽装について家族とまだ話し合っていない場合は、今が良い機会です。 https://t.co/TkpdGUfr76

— ノーム・ブラウン (@polynoamial) 2024 年 3 月 29 日

OpenAI には、しばらく前から素晴らしい音声技術がありました。

私たち自身でそれらを広く利用できるようにするかどうか、またその方法をまだ決めていません (これは多くの問題を引き起こします) が、誰かがそうするのは時間の問題であり、準備のためにさらに多くのことを行う必要があります。 https://t.co/8F2jTqbrLO

— マイルズ・ブランデージ (@Miles_Brundage) 2024 年 3 月 29 日

おすすめ画像via Pixabay

SEO を活用したコンテンツと PR 配信。今日増幅されます。
PlatoData.Network 垂直生成 Ai。自分自身に力を与えましょう。こちらからアクセスしてください。
プラトアイストリーム。 Web3 インテリジェンス。知識増幅。こちらからアクセスしてください。
プラトンESG。カーボン、クリーンテック、エネルギー、環境、太陽、廃棄物管理。こちらからアクセスしてください。
プラトンヘルス。バイオテクノロジーと臨床試験のインテリジェンス。こちらからアクセスしてください。
情報源： https://www.cryptoglobe.com/latest/2024/03/chatgpt-creator-openais-voice-cloning-technology-is-so-good-that-even-they-find-it-too-scary-for-public-release/

生成的データインテリジェンス

音声エンジン: OpenAI の合成音声における画期的な進歩

ビットコインキャッシュ（BCH）の価格上昇と半減期の誇大宣伝：規制の変化とブロックチェーンイノベーションの中での包括的な市場分析

ビットコインキャッシュは新たな高みを目指す：BCHの価格高騰、トルコの仮想通貨規制、世界の仮想通貨情勢を考察

最新のインテリジェンス

暗号通貨総まとめ: ビットコインキャッシュの半減が価格高騰、世界的な法改正、フィンテックイノベーションを引き起こす

世界的な仮想通貨規制の変化と金融界の罰金のなか、ビットコインキャッシュの価格は半減期を目前に上昇

ビットコインキャッシュの半減期前の上昇と暗号通貨の状況: 投資、規制、イノベーションのナビゲート

ビットコインキャッシュの価格上昇と誇大広告の半減：世界的な規制の変化とミームコインマニアの中での暗号通貨投資環境を乗り切る

誇大宣伝の半減からコンプライアンスの明確化まで: 暗号通貨とブロックチェーンのイノベーションのダイナミックな状況をナビゲートする

ビットコインキャッシュの半減の誇大宣伝から世界的な暗号化法まで: 進化するデジタル資産の世界をナビゲートする

生成的データ インテリジェンス

音声エンジン: OpenAI の合成音声における画期的な進歩

最新のインテリジェンス

生成的データインテリジェンス