Python读写csv文件专题教程1-csv文件

前言

Python的数据分析包Pandas具备读写csv文件的功能,read_csv 实现读入csv文件,to_csv写入到csv文件。每个函数的参数非常多,可以用来解决平时实战时,很多棘手的问题,比如设置某些列为时间类型,当导入列含有重复列名称时,当我们想过滤掉某些列时,当想添加列名称时...

这篇专题我们结合官方文档,带你全面了解这些常用的参数,真正用透这2个函数。实际上,通过这2个函数的学习,我们不光能理解透这两个函数,顺便还可以了解更多Pandas的知识点,下面开始我们的专题之旅。

read_csv

读入一个带分隔符的csv文件到DataFrame中,也支持遍历或文件分割为数据片(chunks).

基本参数

filepath_or_buffer: 数据输入路径,可以是文件路径,也可以是URL,或者实现read方法的任意对象。

sep: 数据文件的分隔符,默认为逗号。假如sep为None,python引擎会通过内置的 csv.Sniffer工具自动判断分隔符。

注意:如果分割字符长度大于1,且不是 '\s+', 启动python引擎解析。

举例:

test.csv文件分割符为 '\t', 如果使用sep默认的逗号分隔符,读入后的数据混为一体。

Python读写csv文件专题教程1

源数据文件

此时,sep必须设置为 '\t',数据方可正确读入。再变换test.csv的分割符为两个空格,此时分隔符设置为 \s+ 就可以正确读入。

Python读写csv文件专题教程1

含多个空格的文件读入方法一

delimiter: 分隔符的另一个名字,与sep相似

delim_whitespace: 0.18版本后新加参数,默认为False, 设置为True时,表示分割符为空白字符,可以是一个空格,两个,或 \t等。

如下test.csv文件分隔符为两个空格时,设置delim_whitespace为True:

Python读写csv文件专题教程1

多个空格文件读入方法二

read_csv 方法的更多参数使用,陆续推送。

推荐阅读