我正在做一个个人项目,一个非常简单的网络抓取工具。我已经将结果存储为CSV,其中包含标题,URL和ID。ID包含通过正则表达式匹配找到的结果字符串(例如:ID单元格可以是“ 1234567”,“ 1111111 2222222”,等等。)将单元格拆分为列是微不足道的,但是如何在保持与相关链接的链接的同时轻松地拆分这些ID标题和URL?我正在处理数千页,因此手动选择不是很多选择。
例子:
初始:
“首页”,foo.bar / home,1111111 2222222
之后:
“主页”,foo.bar / home,1111111
“主页”,foo.bar / home,2222222
在vba中类似的东西应该可以解决问题。它没有错误检查,并且没有针对速度进行优化,但是对此应该可以。它将创建一个新的工作表并按照您想要的方式拆分数据。
Option Explicit
Sub test()
Dim lRow As Long, curRow As Long, pasteRow As Long
Dim dataWS As Worksheet, pasteWS As Worksheet
Dim ArrID() As String
Dim i As Long
'Since csv will only have one sheet
Set dataWS = Sheets(1)
Set pasteWS = Worksheets.Add
pasteRow = 1
lRow = dataWS.Range("A" & dataWS.Rows.Count).End(xlUp).Row
For curRow = 1 To lRow
ArrID() = Split(dataWS.Range("C" & curRow).Value, " ")
For i = 0 To UBound(ArrID)
If Len(ArrID(i)) > 0 Then
pasteWS.Range("A" & pasteRow & ":B" & pasteRow).Value = dataWS.Range("A" & curRow & ":B" & curRow).Value
pasteWS.Range("C" & pasteRow).Value = ArrID(i)
pasteRow = pasteRow + 1
End If
Next
Next
End Sub
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句