IBM Waston Speech to text APIのキーワードスポッティング機能を使用するにはどうすればよいですか?

Sourav Bhattacharjee

IBM Watson Speech to text APIを使用して、オーディオファイルをテキストに変換しています。すべての機能が正常に機能しています。しかし、キーワードスポッティング機能を使用できません。出力は、発見されたキーワードに関する情報を提供していません。

これが私のコードです:

SpeechToText service = new SpeechToText();
    service.setUsernameAndPassword("*********", "********");
    //SpeechModel model =service.getModel("en-US_NarrowbandModel");


    service.setEndPoint("https://stream.watsonplatform.net/speech-to-text/api");

    String[] keys= {"abuse","bullying","parents","physical","assaulting"};
    RecognizeOptions options = new RecognizeOptions().contentType("audio/wav").model("en-US_NarrowbandModel").continuous(true).inactivityTimeout(500).keywords(keys).keywordsThreshold(0.7);


    File audio = new File("C:\\Users\\AudioFiles\\me.wav");

    SpeechResults transcript = service.recognize(audio, options);
    //Speech t1 = service.recognize(audio, options);
    System.out.println(transcript);

発見されたキーワードをトランスクリプトとともに出力として取得するための特別な機能はありますか?

ドイツのAttanasio

これはJavaSDKで修正されましたv3.2.0必ず最新バージョン(4.2.1)jar:java-sdk-4.2.1-jar-with-dependencies.jarをダウンロードするか、Gradle / Mavenを更新して最新バージョンをプルしてください。

以下のコードは、質問のコードに基づいています。

SpeechToText service = new SpeechToText();
service.setUsernameAndPassword("USERNAME", "PASSWORD");

File audio = new File("C:\\Users\\AudioFiles\\me.wav");    

RecognizeOptions options = new RecognizeOptions().Builder()
  .contentType("audio/wav)
  .inactivityTimeout(500)
  .keywords({"abuse", "bullying", "parents", "physical", "assaulting"})
  .keywordsThreshold(0.5)
  .build();

  SpeechResults transcript = service.recognize(audio, options).execute();
  System.out.println(transcript);

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

IBM Speech to Textに最適なサウンド形式はどれですか?

分類Dev

IBM Watson Speech to Text using WebSockets

分類Dev

IBM Text to Speech: ドイツ語のテキストで英語の単語を正しく発音するには?

分類Dev

ibm-watsonサービスC#を使用したSpeech-to-Text

分類Dev

IBM Watson Speech to Text Only Returning First Word With Java SDK

分類Dev

Speech to Text api / library

分類Dev

iOS Text To Speech API

分類Dev

IBM Watson Speech To Text:SwiftSDKを使用してテキストを書き写すことができません

分類Dev

Bluemixサービスの会話、Speech-To-Text、Text-To-SpeechをAndroidに統合するにはどうすればよいですか?

分類Dev

IBM Watson Text-to-Speechは、カスタム単語の後に文末点を発音します

分類Dev

IBM Watson IAMトークンは、すべてのサービスに適していますか、それとも各サービスに固有ですか(Speech-to-Textなど)?

分類Dev

AzureのText-To-Speechを使用して、ライブテキスト読み上げの代わりにオーディオファイルを作成するにはどうすればよいですか?(C#Unity SDK)

分類Dev

Microsoft Text to Speechエンジンに音声を追加するにはどうすればよいですか?

分類Dev

Speech-to-text large audio files [Microsoft Speech API]

分類Dev

Watson Speech to Text SDKの出力全体をPythonで受信するにはどうすればよいですか?

分類Dev

IBM Watson Speech-to-Text Python、「DetailedResponse」オブジェクトには属性「getResult」がありません

分類Dev

Google Cloud Text-to-Speech Interface Confusion(mp3ファイルをダウンロードするにはどうすればよいですか?)

分類Dev

Watson Speech to Textの精度を向上させるにはどうすればよいですか?

分類Dev

Google Speech-to-Text APIで複数のstreamingRecognizeリクエストを続行するにはどうすればよいですか?

分類Dev

Siri Kit (Speech to Text) で TTS (Text to Speech) iOS を無効にする

分類Dev

Using the AT&T Speech to Text API With Python

分類Dev

プログラムの実行時にMicrosoftAzure Speech To Textで文字起こしを開始するにはどうすればよいですか?(Unity、C#)

分類Dev

〜7mbより大きいファイルは、「応答が受信されていません」をスローします。IBM Watson Speech-To-Text asynccreateJob呼び出しで

分類Dev

Annyang converting speech to text

分類Dev

Speech to text for single word

分類Dev

Text to speech android code

分類Dev

ExtJS 4.2.1で要素(Text、Label、displayField)のテキストでワードラップを作成するにはどうすればよいですか?

分類Dev

Speech to Text オーディオ形式

分類Dev

Text2Speechエラー、ブラウザにURLを直接入力してオーディオを再生するにはどうすればよいですか?

Related 関連記事

  1. 1

    IBM Speech to Textに最適なサウンド形式はどれですか?

  2. 2

    IBM Watson Speech to Text using WebSockets

  3. 3

    IBM Text to Speech: ドイツ語のテキストで英語の単語を正しく発音するには?

  4. 4

    ibm-watsonサービスC#を使用したSpeech-to-Text

  5. 5

    IBM Watson Speech to Text Only Returning First Word With Java SDK

  6. 6

    Speech to Text api / library

  7. 7

    iOS Text To Speech API

  8. 8

    IBM Watson Speech To Text:SwiftSDKを使用してテキストを書き写すことができません

  9. 9

    Bluemixサービスの会話、Speech-To-Text、Text-To-SpeechをAndroidに統合するにはどうすればよいですか?

  10. 10

    IBM Watson Text-to-Speechは、カスタム単語の後に文末点を発音します

  11. 11

    IBM Watson IAMトークンは、すべてのサービスに適していますか、それとも各サービスに固有ですか(Speech-to-Textなど)?

  12. 12

    AzureのText-To-Speechを使用して、ライブテキスト読み上げの代わりにオーディオファイルを作成するにはどうすればよいですか?(C#Unity SDK)

  13. 13

    Microsoft Text to Speechエンジンに音声を追加するにはどうすればよいですか?

  14. 14

    Speech-to-text large audio files [Microsoft Speech API]

  15. 15

    Watson Speech to Text SDKの出力全体をPythonで受信するにはどうすればよいですか?

  16. 16

    IBM Watson Speech-to-Text Python、「DetailedResponse」オブジェクトには属性「getResult」がありません

  17. 17

    Google Cloud Text-to-Speech Interface Confusion(mp3ファイルをダウンロードするにはどうすればよいですか?)

  18. 18

    Watson Speech to Textの精度を向上させるにはどうすればよいですか?

  19. 19

    Google Speech-to-Text APIで複数のstreamingRecognizeリクエストを続行するにはどうすればよいですか?

  20. 20

    Siri Kit (Speech to Text) で TTS (Text to Speech) iOS を無効にする

  21. 21

    Using the AT&T Speech to Text API With Python

  22. 22

    プログラムの実行時にMicrosoftAzure Speech To Textで文字起こしを開始するにはどうすればよいですか?(Unity、C#)

  23. 23

    〜7mbより大きいファイルは、「応答が受信されていません」をスローします。IBM Watson Speech-To-Text asynccreateJob呼び出しで

  24. 24

    Annyang converting speech to text

  25. 25

    Speech to text for single word

  26. 26

    Text to speech android code

  27. 27

    ExtJS 4.2.1で要素(Text、Label、displayField)のテキストでワードラップを作成するにはどうすればよいですか?

  28. 28

    Speech to Text オーディオ形式

  29. 29

    Text2Speechエラー、ブラウザにURLを直接入力してオーディオを再生するにはどうすればよいですか?

ホットタグ

アーカイブ