csv批量导入mysql命令_MySQL
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了csv批量导入mysql命令_MySQL,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含1969字,纯文字阅读大概需要3分钟。
内容图文
今天把从Kaggle上下载下来的csv数据导入mysql,想做个统计分析,怎奈csv文件有些大,所以只能用mysql 命令导入,现mark下,以备以后不时之需:1. 导入:
基本语法:
load data [low_priority] [local] infile 'file_name txt' [replace | ignore]
into table tbl_name
[character set gbk]
[fields
[terminated by't']
[OPTIONALLY] enclosed by '']
[escaped by'\' ]]
[lines terminated by'n']
[ignore number lines]
[(col_name, )]
导入命令_example:
load data infile 'csv文件路径\\test.csv'
replace into table 表名
fields terminated by ','
optionally enclosed by '"'
lines terminated by '\n'
ignore 1 lines(Id,@dummy,DayOfWeek,PdDistrict,Address,X,Y);
不要小看这个简单的example,包含了很多东西;
第一行就是导入文件;
第二行参看语法就会发现有两个词:replace 和 ignore 。replace和ignore关键词控制对现有的唯一键记录的重复的处理。如果你指定replace,新行将代替有相同的唯一键值的现有行。如果你指定ignore,跳过有唯一键的现有行的重复行的输入。如果你不指定任何一个选项,当找到重复键时,出现一个错误,并且文本文件的余下部分被忽略。
所以我觉得现实情况下你的表设计主键,还是最好要不会重复的字段;
第三~四行很简单就是每个具体字段内容之间是以逗号隔开的,那就以逗号分开。
erminated by描述字段的分隔符,默认情况下是tab字符(\t)
enclosed by描述的是字段的括起字符,就是说字段中如果有引号,就当做是字段的一部分。
语法中还有一个是 escaped by, 它描述的是转义字符。默认的是反斜杠(backslash:\ )
第五行 lines terminated by是对每行进行分割,这里要注意一个问题,如果csv文件是在windows下生成,那分割用 ‘\r\n’,linux下用 ‘\n’。
第六行中 ignore 1 lines 是忽略第一行,因为第一行往往是字段名,后边括号中有个字段很特别 @dummy,它是说如果csv文件中有个字段我不想插进去,那就把对应字段名变成@dummy。
PS:想顺便插入导入时间,就在最后加上set update_time=current_timestamp;
2. 导出:
2. 导出:
同时附带上导出命令:
select * from 表名
into outfile '导出路径\\test.csv'
fields terminated by ','
optionally enclosed by '"'
escaped by '"'
lines terminated by '\n';
希望多多交流!
内容总结
以上是互联网集市为您收集整理的csv批量导入mysql命令_MySQL全部内容,希望文章能够帮你解决csv批量导入mysql命令_MySQL所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。