《社会调查数据管理——基于Stata 14管理CGSS数据》一第3章 概念与术语3.1 和计算机及软件有关的术语

本文涉及的产品
数据管理 DMS,安全协同 3个实例 3个月
推荐场景:
学生管理系统数据库
简介: 本节书摘来自异步社区《社会调查数据管理——基于Stata 14管理CGSS数据》一书中的第3章,第3.1节,作者 唐丽娜,更多章节内容可以访问云栖社区“异步社区”公众号查看 第3章 概念与术语 社会调查数据管理——基于Stata 14管理CGSS数据 在开始讲解数据管理每个流程的工作内容之前,需要简单介绍一下和数据管理相关的概念。

本节书摘来自异步社区《社会调查数据管理——基于Stata 14管理CGSS数据》一书中的第3章,第3.1节,作者 唐丽娜,更多章节内容可以访问云栖社区“异步社区”公众号查看

第3章 概念与术语

社会调查数据管理——基于Stata 14管理CGSS数据
在开始讲解数据管理每个流程的工作内容之前,需要简单介绍一下和数据管理相关的概念。

在讲解相关概念和术语之前,首先需要了解一下什么是数据。很多耳熟能详、天天挂在嘴边的词,不见得人人都能对其做出精准的解释。

数据:在人类历史很长一段时期中,数据指的就是数字。当计算机诞生后,得益于数据处理技术的飞速发展,数据的外延不断扩大,而今,信息时代的数据除了包含数字数据外,还包括文本、图片、录音、录像等,数据的表现形式变得多样化,数据已无形化解于个人生活和工作的每个细节中。数据已经变成了一种非常重要的生产资料。

数据管理是一个专业性、综合性、跨学科的事业。好的数据管理人员要具备的基础知识背景主要包括:社会调查技术、抽样技术、统计学、计算机科学,此外,针对专业的数据,如经济数据、心理数据、医疗数据等,还需具备深厚的专业知识,方能做好数据管理。

3.1 和计算机及软件有关的术语

现在,数据管理和计算机技术的发展密不可分,而且从某种意义上讲,计算机技术的发展推动了数据管理,计算机科学的发展提高了数据的利用率和效用,因此,要做好数据管理工作,必需具备一定的计算机基础知识。

程序(program):简言之,就是让计算机做事的指令。人们通过程序和计算机发生交互。

编程(programming):就是编写计算机程序。采用某种编程语言,根据一定的算法编写计算机程序。

编程语言(programming language):人与人之间通过语言沟通交流。人与计算机进行沟通交流的语言,就是编程语言。现在全世界有几千种语言,同样,编程语言也有很多,如常见的BASIC、JAVA、C、Pyhon、PHP等。

算法(algorithm):是计算机完成某个工作所遵循的一系列步骤。比如,要计算出一个班级的平均英语成绩,其算法是:先把全班同学的成绩加总,然后用这个加总值除以全班人数,算出这个班的平均英语成绩。当然,在计算机中,程序的算法会更加复杂,但基本原理一样。

软件(包)(software):是一系列程序的集合。比如,Excel是一个软件,它里面包含大量的程序,像sum就是其中的一个小程序,通过输入命令=sum告诉计算机做求和任务。再如word软件,同时输入control和B就能完成给字体加粗的任务。

语法(syntax):相信很多人都听说过“编程语言”,我们知道语言都有一定语法,否则无法用于交流和书写。编程语言也有自己的语法,下面就是Stata的命令语法:

[prefix :] command [varlist] [=exp] [if] [in] [weight] [using filename] [, options]

变量(variable):在计算机里,变量是用来存储数据的工具。内存中的海量数据以变量作为它们的标签,当研究者使用数据时,只需要知道变量名,就能调用所需的数据。

在社会调查里,变量指的是调查对象某一特征的变化情况。比如,如果调查对象是人,那么性别就是调查对象的一个特征,这个变量的变化只有两种可能:男和女。

变量的分类标准很多,如根据存储格式分为数值型变量和字符型变量,根据取值分为数字变量和字符变量,依据测量水平分为定类变量、定序变量、定比变量和定距变量。

定量变量(quantitative variable):从取值角度讲,定量变量是数值变量,如在CGSS中调查对象的年龄就是一个变量,这个变量的取值范围是18~100周岁。从计算角度讲,定量变量可以用于各种数学运算(包括加、减、乘、除等)和统计分析。

类别变量(qualitative variable):从取值角度讲,类别变量是字符变量,如性别这个变量的取值就是男和女。从计算角度讲,类别变量只能用于简单的统计描述和统计分析。

类别变量和定量变量之间的区分不是绝对的,定量变量可以转化成类别变量,如年龄这个变量,取值可以是数字从18~100周岁,也可以是青年人、中年人、老年人三个类别。

变量名(variable name):变量和变量名是一回事,如我们说gender这个变量,它的变量名就是gender。初学者很容易被一些术语搞得晕头转向。特别是同一个概念的不同叫法更具有迷惑性。不要着急,多看,多练,自然就能娴熟于心。

相关文章
|
28天前
|
Web App开发 缓存 数据库
DMS产品常见问题之DMS数据规定失败如何解决
DMS(数据管理服务,Data Management Service)是阿里云提供的一种数据库管理和维护工具,它支持数据的查询、编辑、分析及安全管控;本汇总集中了DMS产品在实际使用中用户常遇到的问题及其相应的解答,目的是为使用者提供快速参考,帮助他们有效地解决在数据管理过程中所面临的挑战。
|
4月前
|
数据管理 数据库 数据安全/隐私保护
数据管理与持久化:深度解析Docker数据卷
Docker 数据卷在容器化应用中扮演着关键角色,它们提供了一种灵活且可持久化的方式来处理应用数据。本文将深入讨论 Docker 数据卷的基本概念、使用方法以及一系列高级应用场景,通过更为丰富和实际的示例代码,帮助大家全面掌握数据卷的使用和管理。
|
1月前
|
SQL 数据采集 存储
数据仓库(12)数据治理之数仓数据管理实践心得
这边文章聊聊自己对数据治理开发实践的一些思路,就是聊聊怎么开始去做数据治理这件事情。说起数据治理,有时候虽然看了很多文章,看了很多的介绍,了解数据治理的理论,但是实际上需要我们去搞的时候,就会踩很多的坑。这里记一下自己做数据治理的一些思路,做做笔记,也分享给需要的同学。 当然,想要做数据治理,想要学习了解,一下数据治理的范围,理论等,最好可以看看别人怎么做的,了解数据治理可以参考:[数据仓库(11)什么是大数据治理,数据治理的范围是哪些](https://zhuanlan.zhihu.com/p/467433967)。
230 0
|
7月前
|
关系型数据库 分布式数据库 数据库
PolarDB MySQL通过DMS恢复误操作数据
本场景介绍日常访问PolarDB MySQL数据库时,由于操作导致数据不符合预期,需要将数据快速恢复到正常状态。误操作受影响的数据量在10万以内时,可使用DMS数据追踪的方式恢复数据。
134 0
|
3月前
|
存储 数据管理 数据挖掘
数据管理DMS:构建高效数据生态的关键
数据管理DMS:构建高效数据生态的关键
|
4月前
|
SQL 运维 安全
客户说|享道出行 x DMS,构建一站式高效、安全的数据运维管理平台
享道出行通过引入一站式运维管理系统DMS,有效地降低数据运维的复杂性,提升运维团队的工作效率,同时保障IT系统的稳定性和安全性,最终实现业务的持续性和稳定发展。
|
9月前
|
JSON 前端开发 JavaScript
Echarts实战案例代码(15):月收入年龄分段等MYSQL分类统计PHP后台数据管理接口API数据的解决方案
Echarts实战案例代码(15):月收入年龄分段等MYSQL分类统计PHP后台数据管理接口API数据的解决方案
129 0
|
4月前
|
数据管理
宜搭流程中,数据管理批量发起如何成功导入 年-月-日 时:分格式数据 当前数据管理批量发起,Excel文本中编辑时间格式如2023-12-07 20:00,批量导入生成后显示为20231207 00:00,请问如何让时:分正确显示。
宜搭流程中,数据管理批量发起如何成功导入 年-月-日 时:分格式数据 当前数据管理批量发起,Excel文本中编辑时间格式如2023-12-07 20:00,批量导入生成后显示为20231207 00:00,请问如何让时:分正确显示。
61 2
|
5月前
|
SQL 数据库管理
DMS数据归档
DMS数据归档
46 1
|
5月前
|
存储 数据采集 安全
什么是数据管理,数据治理,数据中心,数据中台,数据湖?
什么是数据管理,数据治理,数据中心,数据中台,数据湖?
160 0