《Clojure数据分析秘笈》——导读-阿里云开发者社区

《Clojure数据分析秘笈》——导读

2017-07-03 1468

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 本节书摘来自华章社区《Clojure数据分析秘笈》一书中的目录，作者（美）Eric Rochester，更多章节内容可以访问云栖社区“华章社区”公众号查看

本节书摘来自华章社区《Clojure数据分析秘笈》一书中的目录，作者（美）Eric Rochester，更多章节内容可以访问云栖社区“华章社区”公众号查看

0a0d96cb05dc829db57f13203775e152c0b951c0

目　　录

第1章　导入分析数据
1.1　引言
 1.2　新建项目
 1.3　将CSV数据读入Incanter数据集
 1.4　将JSON数据读入Incanter数据集
[1.5　使用Incanter读入Excel数据](https://yq.aliyun.com/articles/12063）
1.6　从JDBC数据库读取数据
 1.7　将XML数据读入Incanter数据集
 1.8　从网页表中抓取数据
 1.9　从网页中抓取文本数据
 1.10　读取RDF数据
 1.11　使用SPARQL读取RDF数据 1.12　整合不同格式的数据
第2章　清洗和校验数据
2.1　引言
 2.2　使用正则表达式清洗数据
 2.3　使用同义词映射保持一致性
 2.4　识别并去除重复数据
 2.5　标准化数字格式
 2.6　调整词频值的度量
 2.7　标准化日期和时间
 2.8　大数据集的延迟处理
 2.9　大数据集抽样
 2.10　修正拼写错误
 2.11　解析自定义数据格式
 2.12　使用Valip校验数据
第3章　使用并发编程管理复杂度
3.1　引言
 3.2　使用STM管理程序复杂度
 3.3　使用agent管理程序复杂度
 3.4　使用commute获得更好的性能 3.5　将agent和STM结合使用
 3.6　使用ensure维护一致性
 3.7　将安全的副作用引入STM中
3.8　使用validator维护数据一致性
3.9　使用watcher追踪处理过程
3.10　使用watcher调试并发程序
3.11　从agent中错误恢复
3.12　使用sized queue管理输入
第4章　使用并行编程提高性能
4.1　引言
4.2　使用pmap并行处理
4.3　使用Incanter并行处理
4.4　将蒙特卡罗模拟进行划分使pmap性能提升
4.5　使用模拟退火算法最优化分块大小
4.6　使用reducers并行处理
4.7　使用reducers生成在线统计
4.8　使用OpenCL和Calx驾驭你的GPU
4.9　使用类型提示
4.10　使用Criterium制定基准
第5章　使用Cascalog进行分布式数据处理
5.1　引言
5.2　使用Cascalog和Hadoop分布式处理
5.3　使用Cascalog查询数据
5.4　使用Apache HDFS分布数据
5.5　使用Cascalog解析CSV文件
5.6　使用Cascalog执行复杂查询
5.7　使用Cascalog聚合数据
5.8　定义新Cascalog操作符
5.9　组成Cascalog查询
5.10　处理Cascalog工作流中的错误
5.11　使用Cascalog转换数据
5.12　使用Pallet在云上执行Cascalog查询

《Clojure数据分析秘笈》——导读

目　　录

华章出版社

热门文章

最新文章

相关课程

相关电子书

相关实验场景

《Clojure数据分析秘笈》——导读

目 录

华章出版社

热门文章

最新文章

相关课程

相关电子书

相关实验场景

目　　录