带你走进Kaggle Kernels(内附视频讲解)

简介: Kaggle Kernels的本质是什么?我们如何使用它?本文从理论介绍到实例讲解,将Kaggle Kernels完美的展现在你面前……

更为详细内容,请查看文末视频链接。

在这一集的AI奇遇记中,我们的任务是介绍Kaggle Kernels是什么,以及如何开始使用它们。

         Kaggle是一个用来研究和共享数据科学的平台,你可能听说过Kaggle的一些有奖竞赛,同时它也是个数据科学实践和相互学习的好地方。Kaggle Kernels本质上是一个可免费在你面前的浏览器中运行的交互式笔记本( Jupyter Notebooks)。
        以防你错过了,所以我要再次强调,因为这真的很令人吃惊,Kaggle Kernels是一个可在你的浏览器中运行交互式笔记本的免费平台,这就意味着你可以省去设置本地环境的麻烦,并且不管你处在哪里,只要能上网,就可以在浏览器中拥有一个交互式笔记本环境。不仅如此,交互式笔记本的处理能力来自于云端服务器,而不是本地服务器。因此,你可以在这里做大量的数据科学和机器学习的研究,这也不会让你自己的笔记本电脑过热。Kaggle最近还升级了所有的内核,以获得更强的计算能力和更多的内存,并将一个笔记本单元的运行时间延长到60分钟。
        关于Kaggle Kernels我谈的已经足够多了,让我们来看看它实际上是什么样子的。
         只要在Kaggle.com上创建一个账户,就可以选择一个我们需要的数据集,只需点击几下鼠标就可以运行一个新的内核或笔记本。我们选择的数据集会被预先加载到内核的环境中,因此无需手动将数据集加载到服务器中或者从网络上复制大型的数据集。当然,如果你愿意的话,你仍然可以把额外的文件加载到内核中。
        在我们的案例中,我们将继续使用我们的Fashion MNIST 是一个替代 MNIST 手写数字集的图像数据集)和这个数据集。这是一个包含10类服装和配饰的数据集如裤子,包包,高跟鞋,衬衫等等,它拥有50000个训练样本和10000个评估样本。
        让我们来探索一下Kaggle Kernel上的数据集:它是在Kaggle上以CVS文件的形式提供的。原始数据是28*28像素的灰度图像,被转化为CVS文件中的784个不同的列,CVS文件的一列代表Fashion MNIST中索引号09的项。 由于数据集已经在环境中了,在pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的)中,让我们用它将这些CVS文件读到pandas的数据帧中。现在我们已经将数据加载到一个数据帧中了,我们可以利用它具有的所有的特征,用Head展示前五行,然后可以运行Describe来了解数据集结构的更多信息。
        此外,最好对这些图像中的一部分进行可视化处理,这样对我们来说有更多的意义,而不仅仅是一排排的数字。我们使用matplotlib可以看到这些图像是什么样子,即使用matplotlibpyplot子库(通常作为PLT库导入)——将像素值组成的数组呈现为图像。我们可以看到这些图像虽然模糊,但实际上仍然可识别为服装和饰品。
        另外,Kaggle Kernels在浏览器中几乎不需要设置,就可以允许我们可以在一个完全交互式笔记本的环境中工作。我们不必做任何类型的Python环境配置或者库的安装,这点真的很方便。
        现在你还在等什么?赶紧去Kaggle.com注册一个帐号来玩转Kaggle Kernels吧! 

        视频教程网址:

        https://weibo.com/tv/v/Fyzam3oXE?fid=1034:fddc10dc6b35ed44196f47ceb5f244e3


本文由北邮@爱可可-爱生活老师推荐,阿里云云栖组织翻译。
文章原标题《Introduction to Kaggle Kernels,作者:Yufeng G
译者:Mags,审阅:袁虎




相关文章
|
17天前
|
人工智能 开发框架 前端开发
社区供稿 | 适合假期自学一战成名的必看秘籍-五板斧打造AgentScope应用
本文写给有一定编程基础的学习者,得以入门 源码级 开发Agentscope应用,并上线创空间,参加AgentScope的应用开发挑战赛。
|
3月前
|
人工智能 搜索推荐 开发者
社区供稿 | 大模型恋爱神器!16种MBTI自由定制,北大ChatLaw团队出品
北大团队新作,让大模型拥有个性!而且还是自定义那种,16种MBTI都能选。
|
机器学习/深度学习 C++
百度飞桨世界冠军带你从零实践强化学习第五天(三岁白话时间)
百度飞桨世界冠军带你从零实践强化学习第五天(三岁白话时间)
150 0
百度飞桨世界冠军带你从零实践强化学习第五天(三岁白话时间)
|
机器学习/深度学习 C++
百度飞桨世界冠军带你从零实践强化学习第四天(三岁白话时间)
这里是三岁,这里吧第四的素材和资料整理了一下,大家康康,有什么不足的欢迎提出,批评指正!!!
92 0
百度飞桨世界冠军带你从零实践强化学习第四天(三岁白话时间)
|
存储
【CSDN编程竞赛 第六期】我的第一场编程竞赛
我的第一场编程竞赛解题思路。
126 0
【CSDN编程竞赛 第六期】我的第一场编程竞赛
|
机器学习/深度学习 人工智能 算法
PyHubWeekly | 第二十期:动漫迷不能错过的一款Python小工具!
PyHubWeekly每周定期更新,精选GitHub上优质的Python项目/小工具。 我把PyHubWeekly托管到了Github,感兴趣的可以搜索Github项目PyHubWeekly[1],如果喜欢,麻烦给个Star支持一下吧。此外,欢迎大家通过提交issue来投稿和推荐自己的项目~ 本期为大家推荐GitHub上5个优质的Python项目,它们分别是: •AnimeGAN •faker •Background-Matting •PyBoy •Learning-to-See-in-the-Dark
PyHubWeekly | 第二十期:动漫迷不能错过的一款Python小工具!
|
机器学习/深度学习 人工智能 自然语言处理
2019年Reddit机器学习17个高赞项目:AI德扑大师、StyleGAN等上榜
本文是Medium网友整理的2019年Reddit机器学习板块热门高赞项目资源汇总,既有Facebook、英伟达等大厂的作品,也有网友自制的有趣小尝试,共17个项目,按热度高低排序,一起看看吧!
259 0
2019年Reddit机器学习17个高赞项目:AI德扑大师、StyleGAN等上榜
|
机器学习/深度学习 算法 数据挖掘
李航《统计学习方法》第 2 版发布完整课件!清华教授出品!附完整下载
李航《统计学习方法》第 2 版发布完整课件!清华教授出品!附完整下载
808 0
李航《统计学习方法》第 2 版发布完整课件!清华教授出品!附完整下载
|
域名解析 网络协议 安全
清华雨课堂实现太难?手把手教你复刻一个“小红书”玩一玩!
清华雨课堂实现太难?手把手教你复刻一个“小红书”玩一玩!
284 0
清华雨课堂实现太难?手把手教你复刻一个“小红书”玩一玩!