kafkaトピックの各IDの頻度を数える方法

フューリーファズ

CSVファイルをストリーミングしたKafkaトピックTranfer_Historyがあります。ここで、各PARTY_IDの発生をカウントしたいと思います。次に、変換を適用した後:カウントが20未満の場合は、新しいトピックCHURNに配置し、20を超える場合は、トピックLOYALに配置します。#JAVAを使用しています。

パブリッククラスFirstFilterer {

public static void main(String[] args) {

    final StreamsBuilder builder = new StreamsBuilder();

    /*input messages example
     {"155555","11.11.2016 11:12}
     {"155555","11.11.2016 13:12}
     {"155556","11.11.2016 13:12}
     result to be achived:
     {"155555","2"}
     {"155556","1"}
     */
    builder.stream("test_topic_3")
//                .map()
                  .groupByKey()
//                .windowedBy(Window) // This may or may not be required
                  .count()
                  .toStream()
                  .map(
                    (key,count) -> new KeyValue<>(key.toString(),count)
            )
            .to("test_output_filtered_3");//this topic is empty after the run

私はカフカに不慣れです多くのplzが私を助けてくれることを知りません

サミー

これは、KafkaStreamsを介して非常に簡単に実現できます。まず、KStreamとKTableのバックグラウンドがあることを確認します。以下の手順に従う必要があります。

 builder.<Keytype, ValueType>stream(YourInputTopic))
    .map()
    .groupByKey()
    .windowedBy(TimeWindows.of(Duration.ofSeconds(10))) // This may or may not be required 
                                                           in your case
    .count()
    .toStream()
    .map((Windowed<String> key, Long count) -> new KeyValue<>(key.key(),count.toString()))
    .filter((k,v)-> Long.parseLong(v) > 20) // This is the filter
    .to(TopicName));

注:これは、この偉業を達成する方法のアイデアを与える単なる擬似コードです

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

Python:トリプルヌクレオチドの頻度を数える方法

分類Dev

リストの要素頻度を数える方法

分類Dev

Python:リスト内の特定の要素の頻度を数える方法

分類Dev

特定の列から数の頻度を数える方法は?

分類Dev

Rの各行の文字列の頻度を数える方法

分類Dev

順不同リスト内の要素の頻度を数える方法は?

分類Dev

Java8を使用して文字列のリストから各単語の頻度を数える

分類Dev

IDと範囲内の数字で頻度を数える

分類Dev

Apache Kafkaで複数のトピックを削除する方法

分類Dev

文字列内の文字の頻度を数える方法は?

分類Dev

numpy配列の要素の頻度を数える方法は?

分類Dev

ファイル内の行の頻度を数える方法

分類Dev

Pythonで特定の単語の頻度を数える方法

分類Dev

文字の頻度を数える

分類Dev

ngramの頻度を数える

分類Dev

文字列の頻度を数える

分類Dev

要素の頻度を数えるPython

分類Dev

各列の頻度を計算し、マトリックス全体の頻度を計算します

分類Dev

ルビー:文字の頻度を数える方法

分類Dev

Rで日付の頻度を数える方法は?

分類Dev

トピックモデリング:LDA、各トピックの単語頻度、およびWordcloud

分類Dev

Rの各列の残基(ヌクレオチド)カバレッジの頻度を計算する方法は?

分類Dev

単語リストの単語頻度を数える

分類Dev

Python-2Dリストで要素の頻度を数える

分類Dev

パンダのトピック名と説明をトピック名、単語、頻度に変換する

分類Dev

Java、Apache Kafkaのトピックのメッセージ数を取得する方法

分類Dev

Webコンテンツをスクレイピングしてから、Rの単語の頻度を数える方法は?

分類Dev

Pythonの頻度と値に基づいて各ユーザーIDのワードクラウドチャートを作成する方法

分類Dev

パンダ-他の列の各値タイプの値の頻度を数える

Related 関連記事

  1. 1

    Python:トリプルヌクレオチドの頻度を数える方法

  2. 2

    リストの要素頻度を数える方法

  3. 3

    Python:リスト内の特定の要素の頻度を数える方法

  4. 4

    特定の列から数の頻度を数える方法は?

  5. 5

    Rの各行の文字列の頻度を数える方法

  6. 6

    順不同リスト内の要素の頻度を数える方法は?

  7. 7

    Java8を使用して文字列のリストから各単語の頻度を数える

  8. 8

    IDと範囲内の数字で頻度を数える

  9. 9

    Apache Kafkaで複数のトピックを削除する方法

  10. 10

    文字列内の文字の頻度を数える方法は?

  11. 11

    numpy配列の要素の頻度を数える方法は?

  12. 12

    ファイル内の行の頻度を数える方法

  13. 13

    Pythonで特定の単語の頻度を数える方法

  14. 14

    文字の頻度を数える

  15. 15

    ngramの頻度を数える

  16. 16

    文字列の頻度を数える

  17. 17

    要素の頻度を数えるPython

  18. 18

    各列の頻度を計算し、マトリックス全体の頻度を計算します

  19. 19

    ルビー:文字の頻度を数える方法

  20. 20

    Rで日付の頻度を数える方法は?

  21. 21

    トピックモデリング:LDA、各トピックの単語頻度、およびWordcloud

  22. 22

    Rの各列の残基(ヌクレオチド)カバレッジの頻度を計算する方法は?

  23. 23

    単語リストの単語頻度を数える

  24. 24

    Python-2Dリストで要素の頻度を数える

  25. 25

    パンダのトピック名と説明をトピック名、単語、頻度に変換する

  26. 26

    Java、Apache Kafkaのトピックのメッセージ数を取得する方法

  27. 27

    Webコンテンツをスクレイピングしてから、Rの単語の頻度を数える方法は?

  28. 28

    Pythonの頻度と値に基づいて各ユーザーIDのワードクラウドチャートを作成する方法

  29. 29

    パンダ-他の列の各値タイプの値の頻度を数える

ホットタグ

アーカイブ