我正在使用RStudio
,但ggplot2
图表有问题。我的数据集有大约 86,200 个观察值;所以我期待这些点出现在我的情节中,但奇怪的是它只在情节中间显示了一个点。
ggplot(mydata,aes("Package Revenue EXCL VAT","Total Spending",colour=PropertyCode, size=5, alpha=0.5)) + geom_point()
用于散点图的 2 列是数字列。运行 astr(mydata)
为这两列提供以下内容:
Package Revenue EXCL VAT: num
Total Spending: num
这就是绘图在 RStudio 的绘图查看器窗口中的显示方式(我已从屏幕截图中排除了图例):
知道我做错了什么吗?
正如评论所说,使用标识符,而不是字符串。正如您在图中看到的那样,您有一个点,它的坐标实际上是离散值 x = “Package Revenue EXCL VAT”和 y = “Total Spending”。
此外,您需要从美学中删除固定属性并将它们放入几何图形中:否则 ggplot2 会将它们映射到常量但任意值(即不是您想要的值)。
ggplot(mydata) +
aes(`Package Revenue EXCL VAT`, `Total Spending`, color = PropertyCode) +
geom_point(size = 5, alpha = 0.5)
(添加了格式清理。)
如果不清楚,上面代码中的反引号不分隔字符串,它们分隔标识符:在 R 中,`foo`
与foo
. 但是,反引号允许您在标识符中使用其他无效字符。这包括空格。
在某些情况下,R 允许您使用带引号的字符串而不是反引号标识符这一事实使问题变得混乱。但aes
不是这些情况之一,如果你想保持理智,你不应该使用 R 的这个令人困惑的功能。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句