天気予報に関する時間ごとのデータを収集しました。私が収集した特徴は、数値-「気温」、「降水量」、およびカテゴリ-「天気予報」です(例:「晴れ」、「晴れ」、「曇り」、「雨」、「大雨」など)。毎日の天気予報の統計を作成する必要があります。数値機能の場合は簡単ですが(最小、最大、平均、標準など)、カテゴリデータをどう処理するかについて少し苦労しています。1時間ごとに「weather_forecast」機能のワンホットエンコーディングを考えてから、これらの値を合計しました。
たとえば、次のデータの場合:
hour weather_forecast
8:00 sunny
9:00 sunny
10:00 sunny
11:00 cloudy
12:00 rain
13:00 cloudy
1つのホットエンコーディングで
sunny cloudy rain
8:00 1 0 0
9:00 1 0 0
10:00 1 0 0
11:00 0 1 0
12:00 0 0 1
13:00 0 1 0
私は次のような統計を取得します
sunny: 3
cloudy: 2
rain: 1
これにより、1日の天気に関する統計を集計できる可能性があります。
このアプローチに落とし穴や問題があるのか、それとも注意すべき点があるのか疑問に思います。このエンコーディングには名前がありますか(Web上で見つかりませんでした)。
ワンホットエンコーディングをweather_forecastに適用すると、エンコーディングは終了しました。Sumsは、天気が晴れ、曇りなどの時間数を示します。
統計を合計時間数で割ると、ある期間、たとえば1日の間の気象タイプのパーセンテージを受け取ることになります。特別な問題はないと思います。
この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。
侵害の場合は、連絡してください[email protected]
コメントを追加