1. 云栖社区>
  2. 全部标签>
  3. #大数据#
大数据

#大数据#

已有285人关注此标签

内容分类:
博客 | 问答 | 视频 | 资料 |

数据挖掘聚类算法之K-MEDOIDS

     K-MEANS顾名思义K-均值,通过计算一类记录的均值来代表该类,但是受异常值或极端值的影响比较大,这里介绍另外一种算法K-medodis。看起来和K-means比较相似,但是K-medoids和K-means是有区别的,不一样的地方在于中心点的选取,在K-means中,我们将中心点取为当前cluster中所有数据点的平均值,在  K-medoids算法中,我们将从当前cluster  中选取这样一个点——它到其他所有(当前cluster中的)点的距离之和最小——作为中心点。

云栖社区 大数据 算法 cluster 数据挖掘

大数据公司ZestFinanceC轮获2000万美元投资

      ZestFinance是前谷歌首席信息官及工程副总裁Douglas Merrill和Capital One(美国第一资本投资国际集团)公司前主管Shawn Budde的心血结晶。该公司为放款者提供承保模式,旨在为那些个人信用不良或者不满足传统银行贷款资格的个人提供服务。

云栖社区 大数据 算法 创业

如何用数据逆袭追女神–信息图

  1、看一看在实践中可能需要用到哪些数据资料。 2、探讨一个核心问题,从哪里挖掘上面所说的数据。 3、如何处理挖掘到的信息。 你以为说的是追女神么?其实谈的是创业。成功的创业者都善用数据追女神! 原文发布时间为:2013-08-6 本文来自云栖社区合作伙伴“大数据文

云栖社区 大数据 创业

汽车后市场大数据的三大来源

        汽车后市场的大数据在哪里?我认为可能有三个来源。   其一是来自社交媒体。   微信、微博,这些平台会有大量文本数据、语音数据,经销商与顾客的每一次交谈、微博里的每一条信息、微信里的每一次互动对话,通过合适的语音、语义挖掘,都可能发掘消费者与消费行为的相关关系。

大数据 互联网

“人体IP” 专注可穿戴大数据应用创新

国内可穿戴设备创业团队Flashunit闪点继推出“DGC”模式后,其联合创始人翟飞再次提出“人体IP”这一创新观点引爆了圈内热议。他认为,每个个体都是独立的数据源,能够不断产生各种不同的人体数据,这些数据能够推动可穿戴设备的进一步发展,为大数据市场组成了不可替代的庞大细分市场。

云栖社区 大数据 移动互联网

运营商客户流失预警与挽留

 近几年,新兴通信业务对传统通信运营商构成了很大的威胁,在竞争过程中,并购、重组等大的战略调整屡见不鲜。如何保证大量广告宣传和营销服务的投入效果,保持业务优势,是传统通信运营商考虑的重中之重;其中,客户资源维持是提升其利润率和APRU值(每用户平均收入)的重要标志,客户流失率则是运营商最终ROI(投资回报率)评估的重要参考系数,因此客户关系管理在传统通信运营商的管理环节中显得尤为重要。

云栖社区 大数据 架构 解决方案 客服

如何通过数据分析来衡量游戏中的用户体验

 首先说明一点,本文中提到的UED基本都指交互设计 一、为什么需要数据验证? “天天看到你们也挺忙的,但是怎么衡量游戏用户体验提升了多少。” 是的,高层对战略方向关注的更多,不可能了解每个员工所有的工作细节,尤其是我们是做用户体验的。

云栖社区 大数据 用户体验 数据分析 客服

大数据妙用:Facebook 绘出同性婚姻合法化支持热度图

美国时间 6 月 27 日晚,美国反同性恋婚姻的《联邦婚姻保护法》被判违宪。随后,Facebook 的消费者内容经理 Alex Walker 和数据编辑  Robert D’Onofrio 在 Facebook 新闻直播间发文,展示 Facebook 大数据处理所得的 Facebook  用户对于该事件的反应。

云栖社区 大数据 facebook

沈浩老师:数据分析随访录

1、请您简单介绍一下数据的可视化技术、商业智能技术、和数据挖掘的技术。 答:数据可视化本身也是一种数据分析技术,是将数据以统计图表和视觉形态表现出来的分析展现技术。我常说:看得见才能做得到,看得见才能做得好!随着数据分析技术的发展,数据存储、报表、分析和展现逐渐融合和一体化,过去是从数画图,现在往往先画图再洞察数据异常;可视化领域:报表可视化、绩效仪表盘、社会网络可视化、信息图、一页式管理图表。

大数据 个性化推荐 数据分析 数据挖掘 google 报表

Chicisimo:大数据解答时尚搭配

“双十一”狂购了很多衣服?是!但就是不知道怎么搭配……一般说来,普通人每天要思考三个问题:早上吃什么,中午吃什么,晚上吃什么。女生通常得加上一个问题:今天穿什么?在这个问题之上,还有各种搭配问题:高腰裤配什么腰带?蝙蝠衫搭哪款墨镜?…… 为什么女生喜欢看街拍,因为她们想寻找某件衣物的搭配灵感,那衣服可能在柜子里雪藏许久。

云栖社区 大数据 电商

利用大数据发现隐匿的技术天才

随着更多顶级技术公司加入到内部招募的阵营,这种趋势显然已经成为得到优秀人才最靠谱的渠道;不过,在摆脱了对代理商的依赖后,这些企业又不得不耗费大量人力财力建设自己的数据库。如何才能一举两得?TalentBin 将自己描述为“人才发现引擎”,期望能提供一种解决方案帮助企业排除此类问题;日前,TalentBin 宣布已募得200万美元 A 轮融资。

大数据 数据库 facebook github

社交大数据:营销背后的精准投放

      炙手可热的“大数据”正在全球掀起一场智能广告革命。那些无孔不入的广告不再出自大牌4A广告公司艺术总监或创意师之手,而是来自于自动生成的智能系统。       2012年,facebook的广告收入攀升到了43亿美元。

大数据 数据挖掘 facebook

Google和facebook如何应用R进行数据挖掘

Google和facebook如何应用R进行数据挖掘 在R用户组织的主题为“R与预测分析科学”的panel会议上,有来自工业界的四位代表发表了讲话,介绍各自在工业界是如何应用R进行数据挖掘。他们分别是: Bo Cowgill, Google Itamar Rosenn, Facebook David Smith, Revolution  Computing Jim Porzak, The Generations  Network 他们分别介绍了在各个公司是如何使用R进行预测分析,R作为分析工具的优势和劣势,并且提供了学习案例,以下是对他们的介绍的相关总结。

云栖社区 大数据 数据可视化 数据处理 数据挖掘 脚本 google 并行计算 facebook

人际图谱:Facebook的数据挖掘功臣

  建立与发展   Facebook的人际图谱团队创立之初的任务是把用户个人信息中的纯文字描述转化成结构化数据。如果没有这样的数据,Facebook就无法实现广告受众定位,也不能帮助你找到高中好友。

云栖社区 大数据 数据挖掘 facebook

数据分析≠Hadoop+NoSQL,不妨先看完善现有技术的10条捷径

让业务搭乘大数据技术确实是件非常有吸引力的事情,而Apache Hadoop让这个诱惑来的更加的猛烈。Hadoop是个大规模可扩展数据存储平台,构成了大多数大数据项目基础。Hadoop是强大的,然而却需要公司投入大量的学习精力及其它的资源。

大数据 NOSQL hadoop 数据库 数据仓库 数据分析 解决方案 存储

比章鱼哥还准的比赛预测

运动员和极客之间长久的竞争终于结束了——Nik Bonaddio是终结者。他是numberFire的创始人及CEO。这是一个将梦幻体育的运动数据分析带往全新高度的平台。通过将数学推算的衡量标准与考虑了环境因素变量的先进算法结合,numberFire将运动中“无章法的混乱数据”转变为高度精确的统计和预测,NFL、MLB和NBA的球员和团队都将因此获利。

云栖社区 大数据 算法 数据分析

1872
GO