1. 阿里云>
  2. 云栖社区>
  3. 主题地图>
  4. P>
  5. pickle存储

当前主题:pickle存储

独家 | 10个数据科学家常犯的编程错误(附解决方案)

作者:Norman Niemer 翻译:李润嘉 校对:李洁 文章来源:微信公众号 数据派THU 本文约2000字,建议阅读10分钟。 本文为资深数据科学家常见的10个错误提供解决方案。 数据科学家是“比软件工程师更擅长统计学,比统计学家更擅长软件工程的人”。

阅读全文

独家 | 基于Python的遗传算法特征约简(附代码)

作者:Ahmed Gad 翻译:张睿毅 校对:丁楠雅 文章来源:微信公众号 数据派THU 本教程主要使用numpy和sklearn来讨论如何使用遗传算法(genetic algorithm,GA)来减少从python中的Fruits360数据集提取的特征向量

阅读全文

最常使用的数据挖掘算法——决策树

决策树(Decision Tree)算法主要用来处理分类问题,是最经常使用的数据挖掘算法之一。 一、决策树 场景 一个叫做 "二十个问题" 的游戏,游戏的规则很简单:参与游戏的一方在脑海中想某个事物,其他参与者向他提问,只允许提 20 个问题,问题的答案也只

阅读全文

Python3入门(九)输入和输出

前面几章介绍了一些常用的输入输出,本文将具体介绍Python的输入和输出 一、输出格式美化 Python两种输出值的方式: 表达式语句和print()函数。 第三种方式是使用文件对象的write()方法,标准输出文件可以用sys.stdout引用。 如果你希

阅读全文

PyODPS DataFrame 处理笛卡尔积的几种方式

PyODPS 提供了 DataFrame API 来用类似 pandas 的接口进行大规模数据分析以及预处理,本文主要介绍如何使用 PyODPS 执行笛卡尔积的操作。 笛卡尔积最常出现的场景是两两之间需要比较或者运算。以计算地理位置距离为例,假设大表 Coo

阅读全文

手把手教程:用Python开发一个自然语言处理模型,并用Flask进行部署

截住到目前为止,我们已经开发了许多机器学习模型,对测试数据进行了数值预测,并测试了结果。实际上,生成预测只是机器学习项目的一部分,尽管它是我认为最重要的部分。今天我们来创建一个用于文档分类、垃圾过滤的自然语言处理模型,使用机器学习来检测垃圾短信文本消息。我们

阅读全文

只需10分钟!就能用Flask,Docker和Jenkins部署机器学习模型

在生产环境中部署机器学习模型是数据工程中经常被忽视的领域。网上的大多数教程/博客都侧重于构建、训练和调整机器学习模型。如果它不能用于实际的预测,那么它又有什么用呢? 接下来了解一下有哪些部署选项吧:评估选项 在生产中部署机器学习模型时,有多种选择。其中一种流

阅读全文

scrapy_redis中序列化源码及其在程序设计中的应用

序列化 (Serialization)是将对象的状态信息转换为可以存储或传输的形式的过程。在序列化期间,对象将其当前状态写入到临时或持久性存储区。以后,可以通过从存储区中读取或反序列化对象的状态,重新创建该对象。 在scrapy_redis中,一个Reques

阅读全文

pickle存储相关问答

提问题

如何改变 yielded value值

以下代码使用上下文管理器将变量存储并加载到文件中。但是,必须设置valuecontext manager(loaded.value)所产生的属性非常烦人。我想要 不必定义像这样的新类 LoadedValue 将context manager(loade

阅读全文