安铭 + 关注
打杂coder

安铭 发表了文章:

不同地域的内容偏好性分析

发布时间:2017-06-02 14:44:00 浏览:1212 回帖 :0

不同地域的内容偏好性分析   摘要: 本报告简要分析了中国不同省市的用户对于凤凰网各主要频道的浏览偏好,以期为进一步的内容设置、区域营销及广告投放提供参考。主要结论如下: 1)    中国不同省市用户...

安铭 发表了文章:

渠道质量评价算法概要

发布时间:2017-06-02 14:25:00 浏览:716 回帖 :0

算法

安铭 发表了文章:

使用ClickHouse实现,累计用户计算模型

发布时间:2017-04-06 16:15:00 浏览:2053 回帖 :0

问题描述:根据用户标识和历史库的匹配结果,识别是否是新增用户,单位:天 要求:历史库每天累加更新,要考录用户历史数据库的幂等性及回补数据策略 输出: 用户pushid pushid对应的uid(如果...

string Group

安铭 发表了文章:

Python常用框架源码学习笔记

发布时间:2017-03-31 19:56:00 浏览:673 回帖 :0

起因:公司的移动APPsaas后台项目基本稳定,但是总感觉不够精炼,和一些成熟的开源python框架比感觉缺乏美感,总想着重构后台代码,但是做的时候一团乱麻,不知道从何处下手; 由于缺乏框架实现的经验...

python 源码 entity class database type

安铭 发表了文章:

HBase rowkey设计实例

发布时间:2016-07-11 16:05:00 浏览:483 回帖 :0

需求:绘制渠道用户的每日趋势(每分钟一组数据一天1440组,2000+个渠道,区分新/老用户,2*1440*2000+=576万+/每天),需要保存90天。 查询条件:渠道号、新or老用户、日期 ...

hbase

安铭 发表了文章:

Linux升级python版本

发布时间:2016-05-06 12:56:00 浏览:973 回帖 :0

第一步:下载python2.7.4版本源码:wget http://python.org/ftp/python/2.7.4/Python-2.7.4.tgz解压文件[aa@localhost ~]$ ...

linux python path yum gcc prefix makefile

安铭 发表了文章:

hive动态分区

发布时间:2016-05-06 09:24:00 浏览:644 回帖 :0

设置如下参数开启动态分区: hive.exec.dynamic.partition=true 默认值:false 描述:是否允许动态分区 hive.exec.dynamic.p...

配置 reduce Hive DML

安铭 发表了文章:

set hive.map.aggr=true 时统计PV数据错误

发布时间:2015-08-20 18:06:00 浏览:773 回帖 :0

从一个表里group by 之后 计算累加值、去重值: 为了效率设置并行:set hive.exec.parallel=true(可选:set hive.exec.parallel.thread.n...

BY Hive Group thread

安铭 发表了文章:

Java读取文件

发布时间:2015-07-31 13:06:00 浏览:494 回帖 :0

用惯了python在使用java,在读取文件这真心觉得麻烦,写了一小段代码对java的读写进行了简单的封装,总算舒服了一点: package seleniumTest; import j...

java path string static exception void file list arraylist

安铭 发表了文章:

R聚类分析

发布时间:2015-07-31 12:56:00 浏览:591 回帖 :0

数据格式:时间(小时)/各个省份数据 数据输入: locdata

csv

安铭 发表了文章:

CDH安装

发布时间:2015-05-14 16:58:00 浏览:643 回帖 :0

  参考资源:http://www.cloudera.com/content/cloudera/en/documentation/core/latest/topics/cm_ig_install...

yum 配置 agent Server Core html service

安铭 发表了文章:

python 使用记录

发布时间:2015-05-11 15:49:00 浏览:473 回帖 :0

元组比较: 1 >>> (0, 1, 2) < (0, 3, 4) 2 True 3 >>> (0, 1, 2000000) < (0, 3, 4) 4 True 列表的多字段排序:...

python 排序

安铭 发表了文章:

docker安装

发布时间:2015-05-08 16:17:00 浏览:1166 回帖 :0

注意: docker容器最早受到RHEL完善的支持是从最近的CentOS 7.0开始的,官方说明是只能运行于64位架构平台,内核版本为2.6.32-431及以上(即>=CentOS 6.5,运行do...

linux docker yum centos kernel Unix

安铭 发表了文章:

docker学习笔记

发布时间:2015-05-08 16:04:00 浏览:728 回帖 :0

Docker能处理的事情包括:  1、隔离应用依赖   2、创建应用镜像并进行复制   3、创建容易分发的即启即用的应用   4、允许实例简单、快速地扩展   5、测试应用并随后销毁它们 D...

docker 镜像 容器 多进程

安铭 发表了文章:

Hive过滤脏数据的一些经验

发布时间:2015-05-06 17:39:00 浏览:1266 回帖 :0

如下文件需要处理,每个文件大概13G,其中字段以空格(32)分隔的7个字段;最麻烦的是中间有脏数据: -rw-r--r-- 1 hadoop ifengdev 1895843464 May 6...

hadoop Apache BY string 空格 Hive Create

安铭 发表了文章:

精华文章转载

发布时间:2015-05-04 10:45:00 浏览:655 回帖 :0

docker: 告诉你为什么应该关注docker的好文章: http://thenewstack.io/why-you-should-care-about-docker/ docker源...

python 架构 docker hadoop 源码 Django git index html github Bash

安铭 发表了文章:

celery入门

发布时间:2015-04-30 18:06:00 浏览:714 回帖 :0

将要执行异步任务脚本 tasks.py: from celery import Celery from celery import group # host='10.32.21.52', p...

redis 源码 配置 ADD 脚本 插件 Group celery

安铭 发表了文章:

UnsupportedOperationException: Currently the writer can only accept BytesRefArrayWritable

发布时间:2015-04-22 14:12:00 浏览:882 回帖 :0

往Hive表中插入时报错: java.lang.RuntimeException: java.lang.UnsupportedOperationException: Currently the ...

java native hadoop Apache reduce string Hive Security

打杂coder

感兴趣or擅长的领域:

更多>
更多>
zz2019
zz2019
文章:0丨 粉丝:2丨 话题:0
黑蚁
黑蚁
文章:0丨 粉丝:0丨 话题:0
small_yi
small_yi
文章:0丨 粉丝:0丨 话题:0
这是一头小毛牛
这是一头小毛牛
文章:0丨 粉丝:0丨 话题:0
落叶&middot;逸
落叶&middot;逸
文章:0丨 粉丝:0丨 话题:0
wanweiwang
wanweiwang
文章:8丨 粉丝:7丨 话题:0