1. 阿里云>
  2. 云栖社区>
  3. 主题地图>
  4. P>
  5. pickle存储

当前主题:pickle存储

最常使用的数据挖掘算法——决策树

决策树(Decision Tree)算法主要用来处理分类问题,是最经常使用的数据挖掘算法之一。 一、决策树 场景 一个叫做 "二十个问题" 的游戏,游戏的规则很简单:参与游戏的一方在脑海中想某个事物,其他参与者向他提问,只允许提 20 个问题,问题的答案也只

阅读全文

Python3入门(九)输入和输出

前面几章介绍了一些常用的输入输出,本文将具体介绍Python的输入和输出 一、输出格式美化 Python两种输出值的方式: 表达式语句和print()函数。 第三种方式是使用文件对象的write()方法,标准输出文件可以用sys.stdout引用。 如果你希

阅读全文

PyODPS DataFrame 处理笛卡尔积的几种方式

PyODPS 提供了 DataFrame API 来用类似 pandas 的接口进行大规模数据分析以及预处理,本文主要介绍如何使用 PyODPS 执行笛卡尔积的操作。 笛卡尔积最常出现的场景是两两之间需要比较或者运算。以计算地理位置距离为例,假设大表 Coo

阅读全文

手把手教程:用Python开发一个自然语言处理模型,并用Flask进行部署

截住到目前为止,我们已经开发了许多机器学习模型,对测试数据进行了数值预测,并测试了结果。实际上,生成预测只是机器学习项目的一部分,尽管它是我认为最重要的部分。今天我们来创建一个用于文档分类、垃圾过滤的自然语言处理模型,使用机器学习来检测垃圾短信文本消息。我们

阅读全文

只需10分钟!就能用Flask,Docker和Jenkins部署机器学习模型

在生产环境中部署机器学习模型是数据工程中经常被忽视的领域。网上的大多数教程/博客都侧重于构建、训练和调整机器学习模型。如果它不能用于实际的预测,那么它又有什么用呢? 接下来了解一下有哪些部署选项吧:评估选项 在生产中部署机器学习模型时,有多种选择。其中一种流

阅读全文

scrapy_redis中序列化源码及其在程序设计中的应用

序列化 (Serialization)是将对象的状态信息转换为可以存储或传输的形式的过程。在序列化期间,对象将其当前状态写入到临时或持久性存储区。以后,可以通过从存储区中读取或反序列化对象的状态,重新创建该对象。 在scrapy_redis中,一个Reques

阅读全文

【Python 学习进阶月刊】 第一期:深入Python与日志服务,玩转大规模数据分析处理实战

欢迎订阅Python学习进阶月刊 精彩直播: Python 系列直播——深入Python与日志服务,玩转大规模数据分析处理实战 IPython/Jupyter Notebook非常流行,但随着数据量越来越大(例如几百亿条电商平台访问日志),如何继续保持灵活的

阅读全文

python高频面试问题(三)

整理一下最近被问到的一些高频率的面试问题。总结一下方便日后复习巩固用,同时希望可以帮助一些朋友们。 前两期点这↓python近期遇到的一些面试问题(一)python近期遇到的一些面试问题(二) 1.请写一个邮箱的正则表达式 电子邮件地址有统一的标准格式:用户

阅读全文

pickle存储相关问答

提问题

如何改变 yielded value值

以下代码使用上下文管理器将变量存储并加载到文件中。但是,必须设置valuecontext manager(loaded.value)所产生的属性非常烦人。我想要 不必定义像这样的新类 LoadedValue 将context manager(loade

阅读全文