手把手教你上手python库pydbgen(附代码、安装地址)

  1. 云栖社区>
  2. 数据派THU>
  3. 博客>
  4. 正文

手把手教你上手python库pydbgen(附代码、安装地址)

技术小能手 2018-04-03 10:52:31 浏览4008
展开阅读全文

1a6767f5d843c67ec78b2bedca71ea1e7287b088

SQL或数据科学领域的初学者通常会很难轻易访问大型示例数据库文件(.DB或.sqlite)来练习SQL命令。那么用一个简单的工具或库来生成一个包含多个表的,并且用自己选择的数据填充的大型数据库会不会很好?

当你开始学习和实践数据科学时,通常最担心的不是算法或技术,而是原始数据的可用性。幸运的是,网上有许多高质量的真实数据库可用于尝试学习热门机器学习技巧。但是,从我个人的经验来看从个人经验来讲,我发现学习SQL并不是这样。现在,对于数据科学领域来说,掌握SQL的基础知识与知道如何使用Python或R编写代码几乎同等重要。但是,访问存有真实数据的足够大的数据库(例如名称,年龄,信用卡,SSN,地址,生日等)并不像访问Kaggle上的玩具数据集一样常见,这些数据集是为机器学习的任务专门设计或策划的。

用一个简单的工具或库来生成一个包含多个表

网友评论

登录后评论
0/500
评论
技术小能手
+ 关注
所属云栖号: 数据派THU