我正在使用tensorflow作为文本分类器代码。我正在学习的教程使用的是Kaggle的imdb数据集,加载它的代码是:
import tensorflow as tf
from tensorflow import keras
data = keras.datasets.imdb
(train_x,train_y),(test_x,test_y) = data.load_data()
现在,我有自己的CSV文件,要用作数据集,如何加载该文件?等价的东西是这样的:
data='mydata.csv'
(train_x,train_y),(test_x,test_y) = data.load_data()
数据集包含2列(审阅,响应)。“ mydata.csv”的格式也相同,两个字段均包含2列和纯文本数据
尝试这个
import pandas as pd
df=pd.read_csv("mydata.csv",delim_whitespace=True,header=None)
col_name=['review','response']
df.columns=col_name
如果喜欢,请进行投票!
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句