こんにちは私は、上げられた手の数が増えると彼らがより高い点数を得るという学術データセットを持っています。
マークはClass1列に格納され、Hは高いマークを表し、Lは低いマークを表します。
Rのcdplotで次のプロットを取得しましたが、私の理解では、挙手の数が増えると、マークが低くなるように見えます。これは間違っていますが、出力を正しく理解できません。
出力プロットが何を言っているかを理解するのを手伝ってください。
次のコードを使用-
getwd()
Reading.df <- read.csv("xAPI-Edu-Data.csv")
cdplot(Class1 ~ raisedhands,data = Reading.df)
そして出力を下回りました-
逆に、暗いバンドはクラスHを表し、挙手数が増えると、y軸は暗いバンドによって支配され、クラスHが増えることを示します。このプロットに関する別の方法は、次のようになります。 x軸変数をカテゴリに分割し、増加するにつれて各カテゴリのクラスの割合を尋ねます
たとえば、アイリスデータセットを使用し、setosaとその他の2つのクラスがあります。連続Sepal.Width変数を序数(5ビン)に分割し、種の分布を確認します。
data = iris
data$Species = factor(ifelse(data$Species=="setosa","setosa","others"))
tab = table(data$Species,cut(data$Sepal.Width,5))
barplot(sweep(tab,2,colSums(tab),"/"),
xlab="Sepal.Width ranges",ylab="Compostion of species",
col = c("lightblue","darkblue"))
legend("topright",fill=c("lightblue","darkblue"),rownames(tab),
xpd=TRUE, horiz=TRUE,inset=c(0,-0.3))
Sepal.widthの値が高いほど、より多くの「setosa」種が支配的です。次に、cdplotを実行します。
この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。
侵害の場合は、連絡してください[email protected]
コメントを追加