《R语言数据挖掘:实用项目解析》——第1章,第1.12节字符串操作

  1. 云栖社区>
  2. 华章计算机>
  3. 博客>
  4. 正文

《R语言数据挖掘:实用项目解析》——第1章,第1.12节字符串操作

华章计算机 2017-05-02 14:43:00 浏览1003
展开阅读全文

本节书摘来自华章出版社《R语言数据挖掘:实用项目解析》一书中的第1章,第1.12节字符串操作,作者[印度]普拉迪帕塔·米什拉(Pradeepta Mishra),更多章节内容可以访问云栖社区“华章计算机”公众号查看

1.12 字符串操作
字符串操作或字符操作是所有数据管理系统中的一个重要方面。比如在一个典型的实际数据集里,客户的名字会有多种写法,如J H Smith、John h Smith、John h smith等。据验证,这三个名字表示的是同一个人。在典型的数据管理里,标准化数据集中的文本列或变量很重要,由于R语言是区分大小写的,任何差异都会被当作一个新的数据点。还有很多其他变量,比如一辆汽车的名字/模型、产品描述等。我们来看看如何应用一些函数来标准化文本:


1db8d566aaac182f9f1707a35c76d4938da62cbb

以上代码中的X对象是一个字符串或字符型对象。substr命令用于从字符串

网友评论

登录后评论
0/500
评论
华章计算机
+ 关注
所属团队号: 华章计算机