我有一个包含两列“开始”和“结束”的表,其中分别包含各个开始和结束时间的日期和时间,如下所示:
Sr. No. Start End
1 22May2001:00:00:00 27May2001:23:59:59
2 28May2001:00:00:00 26Jun2001:23:59:59
我想将上述日期时间转换为以下格式(带时间戳的ISO8601):
Sr. No. Start End
1 2001-05-22 00:00:00 2001-05-27 23:59:59
2 2001-05-28 00:00:00 2001-06-26 23:59:59
我使用了以下链接上的可用代码:http : //www.stat.berkeley.edu/~s133/dates.html
View(my_table)
str(my_table)
my_table$startD <- as.Date(my_table$start, "%d%b%Y:%H:%M:%S")
my_table$startT <- strptime(my_table$start, format = "%d%b%Y:%H:%M:%S")
到目前为止,我的尝试为我提供了两列,如下所示:
StartD StartT
2001-05-22 2001-05-22
这是不可取的。有人可以建议我通过上述方法或其他方法将日期时间转换为所需的格式吗?
为了清楚起见,在回答表单中,您需要一个datetime类,在R中,它表示POSIXct或POSIXlt。通常,我们分别使用as.POSIXct
和strptime
分别将字符串解析到每个类中(as.POSIXlt
存在,但很少使用),但是如果您愿意的话,也可以使用lubridate替代方法。
最基本的
my_table$Start <- as.POSIXct(my_table$Start, format = '%d%b%Y:%H:%M:%S')
my_table$End <- as.POSIXct(my_table$End, format = '%d%b%Y:%H:%M:%S')
my_table
## Sr.No. Start End
## 1 1 2001-05-22 2001-05-27 23:59:59
## 2 2 2001-05-28 2001-06-26 23:59:59
请注意,您需要指定format
字符串的名称,因为的第二个参数as.POSIXct
实际上是tz
(用于设置时区)。还要注意,虽然Start
看起来有点浪费时间,但这是因为POSIX * t的打印方法虽然仍然存储,但它们不会在午夜打印时间。
如果您想在一行中同时更改两者,则可以使用
my_table[-1] <- lapply(my_table[,-1], as.POSIXct, format = '%d%b%Y:%H:%M:%S')
或在dplyr中(与POSIXlt相比,它更喜欢POSIXct):
library(dplyr)
my_table %>% mutate_at(-1, as.POSIXct, format = '%d%b%Y:%H:%M:%S')
两者都返回完全相同的东西。您还可以使用lubridate::dmy_hms
,将其解析为POSIXct:
library(lubridate)
my_table$Start <- dmy_hms(my_table$Start) # or lapply like above
my_table$End <- dmy_hms(my_table$End)
# or dplyr
my_table %>% mutate_at(-1, dmy_hms)
这也返回相同的东西。
my_table <- structure(list(Sr.No. = 1:2, Start = structure(1:2, .Label = c("22May2001:00:00:00",
"28May2001:00:00:00"), class = "factor"), End = structure(c(2L,
1L), .Label = c("26Jun2001:23:59:59", "27May2001:23:59:59"), class = "factor")), .Names = c("Sr.No.",
"Start", "End"), class = "data.frame", row.names = c(NA, -2L))
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句