导入示例数据库
TiDB手册使用示例系统数据来自首都自行车共享,发布在首都共享单车数据许可协议.
下载所有数据文件
已获取系统数据以.zip文件下载每年组织一次。下载和提取所有文件需要大约3GB的磁盘空间。使用bash脚本下载2010-2017年的所有文件:
mkdir -p bikeshare-data && cd bikeshare-data curl -L——remote-name-all https://s3.amazonaws.com/capitalbikeshare-data/{2010..2017}-capitalbikeshare-tripdata.zip unzip \*-tripdata.zip
将数据加载到TiDB
系统数据可以通过以下模式导入TiDB:
创建共享单车数据库;使用例如;CREATE TABLE trips (trip_id bigint NOT NULL PRIMARY KEY AUTO_INCREMENT, duration integer NOT NULL, start_date datetime, end_date datetime, start_station_number integer, start_station varchar(255), end_station_number integer, end_station varchar(255), bike_number varchar(255), member_type varchar(255));
您可以使用这个示例单独导入文件加载数据
命令,或者使用下面的bash循环导入所有文件:
LOAD DATA LOCAL INFILE ' 2017q1 - capitalbikesshare -tripdata.csv' INTO TABLE trips FIELDS TERMINATED BY ',' closed BY '"' LINES TERMINATED BY '\r\n' IGNORE 1 LINES (duration, start_date, end_date, start_station_number, start_station, end_station_number, end_station, bike_number, member_type);
导入所有文件
导入所有* . csv
在bash循环中将文件导入TiDB:
在ls *.csv文件;do echo "== $FILE ==" mysql bikeshare——LOCAL - INFILE =1 -e "LOAD DATA LOCAL INFILE '${FILE}' INTO TABLE trips FIELDS TERMINATED BY ',' closed BY '\ ' ' LINES TERMINATED BY '\r\n' IGNORE 1 LINES (duration, start_date, end_date, start_station, end_station_number, end_station, bike_number, member_type);
这个页面有用吗?