《Clojure数据分析秘笈》——1.4节将JSON数据读入Incanter数据集

简介:

本节书摘来自华章社区《Clojure数据分析秘笈》一书中的第1章,第1.4节将JSON数据读入Incanter数据集,作者(美)Eric Rochester,更多章节内容可以访问云栖社区“华章社区”公众号查看

1.4 将JSON数据读入Incanter数据集
另一个越来越流行的数据格式是JavaScript Object Notation(JSON,详见http://json.org/)。与CSV相似,JSON也是无格式的文本,因此程序容易处理。它提供了相对于CSV文件关于数据的更多信息,但是代价是更冗长。JSON格式允许用更复杂的方式使数据结构化,例如层次结构或者序列层次结构。
由于JSON是比CSV更完善的数据模型,因此使用时可能需要转换数据。在这种情况下,可以将感兴趣的信息取出,在传入Incanter之前精简嵌入的映射。然而这种方法仅用于处理相当简单的数据结构。
1.4.1 准备工作
首先,在Leiningen的project.clj文件中包含以下依赖:


63f5dab23e631ddfd8f6f42bc5f8b0a5708db43d

在REPL解释器或程序中使用下列库:


513cf8225709d681cc041b349d6d8cb6016e2155

1.4.3 实现原理
和所有的Lisp语言相似,Clojure通常采用从内层到外层、从右到左的方式读取数据。接下来详细说明。clojure.core/slurp将读入文件内容并以字符串的形式返回。对于非常大的文件来说这明显不是个好主意,但是对小文件来说却很实用。clojure.data.json/read-json从slurp中得到数据,将其以JSON格式进行解析,并返回本地的Clojure数据结构。在本例中,它返回一个由向量组成的映射。maps.incanter.core/to-dataset读入一个映射序列,然后返回Incanter数据集。这将会使用映射中的键作为列名并将数据值转换成矩阵。事实上,to-dataset可以接收许多不同的数据结构。在REPL解释器上尝试(doc to-dataset)命令,或者登录http://data-sorcery.org/contents/查看Incanter文档中的详细内容。

相关文章
|
1月前
|
存储 JSON Apache
揭秘 Variant 数据类型:灵活应对半结构化数据,JSON查询提速超 8 倍,存储空间节省 65%
在最新发布的阿里云数据库 SelectDB 的内核 Apache Doris 2.1 新版本中,我们引入了全新的数据类型 Variant,对半结构化数据分析能力进行了全面增强。无需提前在表结构中定义具体的列,彻底改变了 Doris 过去基于 String、JSONB 等行存类型的存储和查询方式。
揭秘 Variant 数据类型:灵活应对半结构化数据,JSON查询提速超 8 倍,存储空间节省 65%
|
1月前
|
自然语言处理 小程序 数据挖掘
数据分析实战-Python实现博客评论数据的情感分析
数据分析实战-Python实现博客评论数据的情感分析
95 0
|
2月前
|
数据采集 数据挖掘 API
主流电商平台数据采集API接口|【Python爬虫+数据分析】采集电商平台数据信息采集
随着电商平台的兴起,越来越多的人开始在网上购物。而对于电商平台来说,商品信息、价格、评论等数据是非常重要的。因此,抓取电商平台的商品信息、价格、评论等数据成为了一项非常有价值的工作。本文将介绍如何使用Python编写爬虫程序,抓取电商平台的商品信息、价格、评论等数据。 当然,如果是电商企业,跨境电商企业,ERP系统搭建,我们经常需要采集的平台多,数据量大,要求数据稳定供应,有并发需求,那就需要通过接入电商API数据采集接口,封装好的数据采集接口更方便稳定高效数据采集。
|
7天前
|
存储 JSON JavaScript
「Python系列」Python JSON数据解析
在Python中解析JSON数据通常使用`json`模块。`json`模块提供了将JSON格式的数据转换为Python对象(如列表、字典等)以及将Python对象转换为JSON格式的数据的方法。
21 0
|
10天前
|
存储 JSON 数据挖掘
python逐行读取txt文本中的json数据,并进行处理
Python代码示例演示了如何读取txt文件中的JSON数据并处理。首先,逐行打开文件,然后使用`json.loads()`解析每一行。接着,处理JSON数据,如打印特定字段`name`。异常处理包括捕获`JSONDecodeError`和`KeyError`,确保数据有效性和字段完整性。将`data.txt`替换为实际文件路径运行示例。
11 2
|
16天前
|
人工智能 监控 数据可视化
【Python】Python商业公司贸易业务数据分析可视化(数据+源码)【独一无二】
【Python】Python商业公司贸易业务数据分析可视化(数据+源码)【独一无二】
|
29天前
|
JSON 数据格式
糊涂工具类(hutool)post请求设置body参数为json数据
糊涂工具类(hutool)post请求设置body参数为json数据
19 1
|
30天前
|
JSON 前端开发 数据格式
Ajax传递json数据
Ajax传递json数据
11 0
|
1月前
|
JSON 并行计算 API
使用CJSON/Nlohmann:快速简便地在C/C++中处理JSON数据
使用CJSON/Nlohmann:快速简便地在C/C++中处理JSON数据
79 0
|
1月前
|
存储 数据采集 数据挖掘
python数据分析——数据分类汇总与统计
数据分类汇总与统计是指将大量的数据按照不同的分类方式进行整理和归纳,然后对这些数据进行统计分析,以便于更好地了解数据的特点和规律。
56 1

热门文章

最新文章