csvkit---python一个牛逼到不行的csv处理库

简介: 先吐槽一下:不管是百度还是谷歌,查来查去除了官方文档之外就没有任何可以借鉴的例子,虽然官方文档写的挺好的。但是我一直以为是在python语言的方式运行的,结果是以命令行的方式运行的,搞得我还以为这个库太冷门太渣了,饶了无数个弯,简直是三路十八弯。

先吐槽一下:不管是百度还是谷歌,查来查去除了官方文档之外就没有任何可以借鉴的例子,虽然官方文档写的挺好的。但是我一直以为是在python语言的方式运行的,结果是以命令行的方式运行的,搞得我还以为这个库太冷门太渣了,饶了无数个弯,简直是三路十八弯。。。差点放弃。但是“终于等到你,还好我没放弃~~~”

咳咳,首先还是先把官方文档贴出来,毕竟这是最权威的嘛。csvkit官方文档


下面主要想用一个例子介绍一下csvkit的一些牛逼的地方,真的是太牛逼,太方便了。

(注意:csvkit是直接以命令行的方式运行的。)

我桌面上有一个test.xlsx文件,如果我想查看这个文件,low一点的方式是打开excel查看,but!!!太慢了!!!我会告诉你一个命令行立马就能打开吗?好吧我马上告诉你。


1.我桌面上有一个xlsx文件

csvkit---python一个牛逼到不行的csv处理库 - marsggbo - 火星教教主-marsggbo

   2.  in2csv 文件名

上述命令即可访问数据,并显示出来

csvkit---python一个牛逼到不行的csv处理库 - marsggbo - 火星教教主-marsggbo

3.在python中,我们一般用csv格式比较多,csvkit将xlsx转化成csv格式简直不要太简单

 
 

in2csv 文件名.xlsx > 文件名.csv

注意中间那个箭头符号" >",但是要注意的是转化后在windows系统下会出现一些小麻烦,需要转化成utf的编码格式。下个步骤再详细说

csvkit---python一个牛逼到不行的csv处理库 - marsggbo - 火星教教主-marsggbo


4.   现在我们已经得到了一个csv文件

但是!!!windows的cmd就是比较奇葩一些,总是会存在一些问题,当我要打开csv文件时,它提示要以utf编码,然后我就用记事本修改了编码格式,但然并卵。所以还是建议大家在linux环境下编程比较好。


csvkit---python一个牛逼到不行的csv处理库 - marsggbo - 火星教教主-marsggbo

  (有毒的cmd)

csvkit---python一个牛逼到不行的csv处理库 - marsggbo - 火星教教主-marsggbo

  (ubuntu下完美运行)

csvlook 文件名.csv

可以以更友好的界面查看数据





如果还想继续了解csvkit更多逆天神技,可以参考这个网页,感觉写的还算比较好,主要是页面是我喜欢的风格。

csvkit神技介绍



纯原创:如需转载,请注明出处,谢谢!
http://blog.163.com/hexin_mars_blog/blog/static/248215040201681502454593/#
目录
相关文章
|
1天前
|
Python
python_读写excel、csv记录
python_读写excel、csv记录
7 0
|
1天前
|
JSON Shell 数据格式
第十章 Python常用标准库使用(必会)
第十章 Python常用标准库使用(必会)
|
2天前
|
开发框架 前端开发 数据库
Python从入门到精通:3.3.2 深入学习Python库和框架:Web开发框架的探索与实践
Python从入门到精通:3.3.2 深入学习Python库和框架:Web开发框架的探索与实践
|
2天前
|
数据采集 数据可视化 数据处理
Python从入门到精通的文章3.3.1 深入学习Python库和框架:数据处理与可视化的利器
Python从入门到精通的文章3.3.1 深入学习Python库和框架:数据处理与可视化的利器
|
2天前
|
JSON 测试技术 API
Python的Api自动化测试使用HTTP客户端库发送请求
【4月更文挑战第18天】在Python中进行HTTP请求和API自动化测试有多个库可选:1) `requests`是最流行的选择,支持多种请求方法和内置JSON解析;2) `http.client`是标准库的一部分,适合需要低级别控制的用户;3) `urllib`提供URL操作,适用于复杂请求;4) `httpx`拥有类似`requests`的API,提供现代特性和异步支持。根据具体需求选择,如多数情况`requests`已足够。
8 3
Python
19 0
|
2天前
|
JSON 数据格式 索引
python 又一个点运算符操作的字典库:Munch
python 又一个点运算符操作的字典库:Munch
19 0
|
3天前
|
数据挖掘 数据处理 索引
如何使用Python的Pandas库进行数据筛选和过滤?
Pandas是Python数据分析的核心库,提供DataFrame数据结构。基本步骤包括导入库、创建DataFrame及进行数据筛选。示例代码展示了如何通过布尔索引、`query()`和`loc[]`方法筛选`Age`大于19的记录。
10 0
|
4天前
|
数据处理 Python
如何使用Python的Pandas库进行数据排序和排名
【4月更文挑战第22天】Pandas Python库提供数据排序和排名功能。使用`sort_values()`按列进行升序或降序排序,如`df.sort_values(by='A', ascending=False)`。`rank()`函数用于计算排名,如`df['A'].rank(ascending=False)`。多列操作可传入列名列表,如`df.sort_values(by=['A', 'B'], ascending=[True, False])`和分别对'A'、'B'列排名。
14 2
|
5天前
|
算法 Python
请解释Python中的关联规则挖掘以及如何使用Sklearn库实现它。
使用Python的mlxtend库,可以通过Apriori算法进行关联规则挖掘。首先导入TransactionEncoder和apriori等模块,然后准备数据集(如购买行为列表)。对数据集编码并转换后,应用Apriori算法找到频繁项集(设置最小支持度)。最后,生成关联规则并计算置信度(设定最小置信度阈值)。通过调整这些参数可以优化结果。
25 9