1. 云栖社区>
  2. 全部标签>
  3. #数据挖掘#
数据挖掘

#数据挖掘#

已有3人关注此标签

内容分类:
博客 | 问答 | 视频 | 资料 |

【转】如何实现小型WEB搜索引擎(C# SQL Server全文检索 Asp.net)

SOSO-----为您量身定做的 WEB搜索引擎 1 引言 21世纪,中国互联网搜索引擎领域可谓群雄逐鹿,百度、Yahoo、中搜、搜狗等等都使出浑身解数吸引着网民的眼球。这些大网站可谓是各有所长,总的来说虽然他们搜索功能都很强,但是搜索得到的结果基本上是千篇一律,信息的冗余量很大,网民不得不在一次又一次的翻页中浪费时间,或者为了想出一个好的关键词而绞尽脑汁。

SQL 线程 数据库 web 数据挖掘 搜索引擎 Server c# 多线程 asp

为我国特高压交直流混联大电网安上智慧大脑

调度是控制电网安全稳定运行的大脑,是维系电力生产过程的基础,是保障智能电网运行和发展的重要手段。相比于国外,我国电网调度控制技术研究起步较晚,但发展迅速,很多技术已达到世界领先水平。其中,2008年国家电网公司组织研发的智能电网调度控制系统(D5000),基于一体化平台集成了实时监控与预警等4大类应用,获得国家科技进步二等奖,目前已推广至国网运营范围内全部省级以上及众多地区电网调度机构。

分布式 安全 架构 数据挖掘

网页浏览器发展方向总结

经过国内厂商的几轮营销轰炸,不少人都知道了浏览器有内核的概念,那么相对地,就有外壳/应用层(Shell)。十年前,用户就只对外壳有认知,直到今天这几个东西仍是标配: 在HTML5/CSS3的时代,内核向Web OS发展,用户感受到在浏览器里能体验的东西越来越多。

javascript http 人工智能 web 浏览器 数据挖掘 API 高性能 Blog

独家 | PHM数据竞赛首个中国夺冠团队经验分享(常用模型&赛题详解&PPT&视频)

昆仑数据首席数据科学家田春华博士演讲视频: 团队成员代表刘家扬演讲视频: 以下内容经数据派THU整理而成: 后台回复关键词“1114”,下载两位演讲嘉宾完整版PPT。 昆仑数据首席数据科学家田春华   一、工业大数据背景知识和赛题背景 田春华:竞赛是促进大家研究和交流的一种机制,而各个赛事侧重点不同。

大数据 算法 数据分析 数据挖掘

Hadoop,HBase,Storm,Spark到底是什么?

Hadoop,HBase,Storm,Spark到底是什么? Hadoop=HDFS+Hive+Pig+... HDFS: 存储系统MapReduce:计算系统Hive:提供给SQL开发人员(通过HiveQL)的MapReduce,基于Hadoop的...

分布式 算法 storm hbase hdfs hadoop Apache 数据处理 数据库 数据仓库 集群 数据挖掘 spark Hive Mapreduce

写给想从事数据库方面工作的朋友

经常有人问我,有关数据库方面的职位、职业规划、转型等相关的问题。对于经常听到的“DBA(数据库管理员)、数据库开发工程师、数据挖掘工程师、数据库架构师......”这些职位,之前我也比较迷惑,甚至搞不清楚这些岗位具体的工作任务和职责,更别提什么职业规划了。

Oracle 数据库 集群 操作系统 数据挖掘 Sqlserver 数据库开发 DBA 培训

web开发性能优化---项目架构篇

项目技术架构层级规划和介绍 简称四横两纵 四横即四大层次,分别为: 1、用户渠道层:用户渠道层是直接面向最终用户。通过网站的形式向用户提供产品展示、企业市场宣传、对产品的订购、互动分享、客户关怀以及用户中心入口等功能,并提供后期扩展移动终端接入; 2、应用业务层:该层面向的是系统管理人员。

安全 架构 性能优化 数据库 基础设施 web 数据挖掘 系统安全

解析机器学习应用:数据中心和云计算成为企业新战场

机器学习作为一种实现人工智能的方法,近年来成功案例数日益攀升,已经从一个相对模糊的计算机科学概念,迅速发展成为企业经济的影响因素,因此,机器学习领域存在大量的资金投入也就一点儿也不让人感到奇怪了。 麦肯锡公司的一项调查显示,在2013年至2016年期间,人工智能开发投资总额增加了两倍,其中大部分投资——200亿至300亿美元——都来自一些科技巨头,这些公司希望能够产生机器学习以及其他人工智能模型,而这些技术在未来对于他们的客户来说,会变成像今天的移动和网络一样至关紧要的东西。

深度学习 架构 算法 人工智能 数据挖掘 数据中心 培训 神经网络

邬贺铨:大数据共享与开放面临哪三大挑战?

2013年,在北爱尔兰召开的G8会议,签署了《开放数据宪章》,提出了开放14个重点领域数据。要求发布的数据不是一般的数据,而是高价值的数据,不仅仅是加工过的数据,还要有源数据。以往我们认为,政府发布的数据是加工过的,实际上只要不影响国家安全和公民隐私,政府应该开放原始数据。

大数据 数据处理 数据挖掘 存储

基于物联网技术的智能远程医疗系统构建

智能远程医疗系统的主要作用和目的在于利用物联网技术实现对医疗行业的资源整合,优化社会医疗卫生资源配置,提供具有个性服务、全面感知、智能监控等特点的智能远程医疗服务。 远程医疗 智能远程医疗系统的架构设计是以 SOA 架构为基础,同时结合物联网三层架构的技术特点进行设计,以 SaaS 形式向各类医疗服务主体提供软件系统服务,以PaaS 形式向个人或家庭提供各类 Web 服务,通过对医疗资源的数据挖掘实现医疗资源的优化配置。

云栖社区 系统软件 大数据 架构 监控 配置 中间件 数据挖掘 物联网 医疗 数据采集

当空间数据遇上机器学习,城市的颜值有了新的度量方法

每个人都生活在一定的空间,城市的各项公共服务设施也需要占据一定的空间。通过对这些空间数据的挖掘和分析,我们能够比以往更科学、更清晰地观察我们所在的城市。 把机器学习应用到空间数据挖掘 我们公司主要做的是空间数据挖掘,在国内外,类似的公司目前并不是很多。

算法 数据挖掘

数据挖掘笔记 第一章:引言

教科书:数据挖掘:概念与技术(第二版),Jiawei Han和Micheline Kamber 著,机械工业出版社(2007)   Lecture 1: Introduction 1)  Why data mining? Necessity Is the Mother of Inventio...

数据库 数据流 数据仓库 数据挖掘 多媒体 database 异构数据

PHP 挖掘 XML 和 HTML 数据

数据挖掘及其重要性 常用缩略词 API: 应用程序编程接口 CDATA: 字符数据 DOM: 文档对象模式 FTP: 文件传输协议 HTML: 超文本标记语言 HTTP: 超文本传输协议 REST: 具象状态传输 URL: 统一资源定位符 W3C: 万维网联盟 XML: 可扩展标记语言 Wikipedia 对 “数据挖掘” 的定义是 “数据挖掘是采用统计学方法和人工智能方法,结合数据库管理,从大型数据集提取模式的过程”。

php web 数据挖掘 API xml html 存储

数据挖掘中的十大实用分析方法

1.基于历史的MBR分析 基于历史(Memory-Based Reasoning)的MBR分析方法最主要的概念是用已知的案例(case)来预测未来案例的一些属性(attribute),通常找寻最相似的案例来做比较。

算法 函数 数据挖掘 神经网络

NLPIR技术助力中文智能数据挖掘

  随着数据技术的飞速发展以及广泛应用,许多企业和部门建立了自身的数据管理系统,经过长年努力,已经积累了越来越多的数据。于是,人们开始渴望通过对这些庞大的数据分析得到更多的有助于决策的信息。虽然,目前的数据系统可以高效率地实现数据的录入、查询、统计等功能,但由于数据量庞大以及数据库系统中分析方法的严重缺乏,使得它无法发现数据中隐藏的相互联系,更无法根据当前和历史的数据去预测未来的发展趋势。

安全与风控 深度学习 大数据 网络安全 数据库 人工智能 中间件 数据挖掘 并行计算 自然语言理解 数据类型

当空间数据遇上机器学习,城市的颜值有了新的度量方法

每个人都生活在一定的空间,城市的各项公共服务设施也需要占据一定的空间。通过对这些空间数据的挖掘和分析,我们能够比以往更科学、更清晰地观察我们所在的城市。 把机器学习应用到空间数据挖掘 我们公司主要做的是空间数据挖掘,在国内外,类似的公司目前并不是很多。

算法 数据挖掘

当城市数据和社会关系被可视化,每个人都可能是福尔摩斯

现代城市是由人、机、物等组成的繁复的生活系统,其间产生的数据可用巨量来形容。要对这些宏大的数据进行收集、梳理并作分析,难度有之。在日前举办的杭州云栖大会上,浙江大学陈为教授为我们分享了其团队近几年在城市大数据可视化方面的部分科研成果,并探讨了机器学习等在城市数据研究中的重要性。

数据挖掘 关联分析 可视分析

人们应该知道的大数据术语

大数据带来了许多新的术语,但一些术语往往不太好理解。以下是人们应该了解的大数据术语列表: 以下进行一个简短的回顾,以前曾经介绍了算法,分析,描述性分析,预处理分析,预测分析,批处理,Cassandra,云计算,集群计算,暗数据,数据湖,数据挖掘,数据科学家,分布式文件系统,ETL,Hadoop,内存计算,物联网,机器学习,Mapreduce,NoSQL,R,Spark,流处理,结构化。

大数据 算法 hadoop Apache 数据库 人工智能 数据流 数据仓库 数据挖掘 物联网 自然语言处理 存储 神经网络

使用Sklearn进行数据挖掘

1 使用sklearn进行数据挖掘 1.1 数据挖掘的步骤 数据挖掘通常包括数据采集,数据分析,特征工程,训练模型,模型评估等步骤。使用sklearn工具可以方便地进行特征工程和模型训练工作,在《使用sklearn做单机特征工程》中,我们最后留下了一些疑问:特征处理类都有三个方法fit、transform和fit_transform,fit方法居然和模型训练方法fit同名(不光同名,参数列表都一样),这难道都是巧合? 显然,这不是巧合,这正是sklearn的设计风格。

函数 数据挖掘 pipeline

浅谈:物联网、云计算、大数据、人工智能怎么区分与彼此关系?

一、物联网 1、什么是物联网? 物联网在之前被定义为通过射频识别(RFID)、红外线感应器、全球定位系统、激光扫描器、气体感应器等信息传感设备按约定的协议把任何物品与互联网连接起来进行信息交换,以实现智能化识别、定位、跟踪、监控和管理的一种网络,简言之物联网就是“物物相连的互联网”。

云栖社区 分布式 大数据 服务器 互联网 人工智能 SaaS PaaS 云存储 数据挖掘 分布式架构 物联网 分布式文件系统 分布式数据库 存储

70
GO