大規模言語モデル (LLM) をトレーニングするためにどのようなデータソースを使用していますか?

Genesys は、オープンソースの会話と、さまざまなデジタルチャネルからの音声通話やチャットなど、製品の改善に参加することに同意した Genesys Cloud の顧客の両方から、モデルの微調整に使用されるデータをキュレートします。データが複数の分野と業界にまたがるように注意が払われ、自動化されたプロセスと手動による注釈の両方を通じて整合性と正確性が厳密に確認されます。

データは、実際の生産シナリオでモデルが遭遇すると予想される会話の種類を反映しています。ドメイン、性別、人種、その他の保護された特性に関連する偏見を軽減するための対策が講じられています。Genesys では、不適切な言語を除外するための厳格なプロセスも実施しており、すべてのデータはアクセスが厳しく制御された Genesys Cloud に安全にアーカイブされます。