小白谈数据脱敏

简介: 数据脱敏是指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。在涉及客户安全数据或者一些商业性敏感数据的情况下,在不违反系统规则条件下,对真实数据进行改造并提供测试使用,如身份证号、手机号、卡号、客户姓名、客户地址、等个人敏感信息都需要通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。

什么是数据脱敏?

百度百科是这样描述的:

数据脱敏是指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。在涉及客户安全数据或者一些商业性敏感数据的情况下,在不违反系统规则条件下,对真实数据进行改造并提供测试使用,如身份证号、手机号、卡号、客户姓名、客户地址、等个人敏感信息都需要通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。这样就可以在开发、测试和其他非生产环境以及外包环境中可以安全的使用脱敏后的真实数据集。

生活中的常见例子

1、火车票:

2、淘宝网页上的收获地址信息:

敏感数据梳理

在进行数据脱敏之前我们应该要确定公司的哪些数据(哪些表、哪些字段)要作为脱敏的目标,下面从用户、公司、卖家反面分析:

1、用户:名字、手机号码、身份证号码、固定电话、收货地址、电子邮箱、银行卡号、密码等

2、卖家:名字、手机号码、身份证号码、固定电话等

3、公司:交易金额、优惠券码、充值码等

确定脱敏规则

确定好了公司的哪些数据要作为脱敏目标后,我们就需要制定脱敏的规则(具体的实施方法)。

常见方法:

1、替换:如统一将女性用户名替换为F,这种方法更像“障眼法”,对内部人员可以完全保持信息完整性,但易破解。

2、重排:序号12345 重排为 54321,按照一定的顺序进行打乱,很像“替换”, 可以在需要时方便还原信息,但同样易破解。

3、加密:编号 12345 加密为 23456,安全程度取决于采用哪种加密算法,一般根据实际情况而定。

4、截断:13811001111 截断为 138,舍弃必要信息来保证数据的模糊性,是比较常用的脱敏方法,但往往对生产不够友好。(丢失字段的长度)

5、掩码: 123456 -> 1xxxx6,保留了部分信息,并且保证了信息的长度不变性,对信息持有者更易辨别, 如火车票上得身份信息。(常用方法)

6、日期偏移取整:20130520 12:30:45 -> 20130520 12:00:00,舍弃精度来保证原始数据的安全性,一般此种方法可以保护数据的时间分布密度。

目前我的脱敏规则想法是:

1、【中文姓名】只显示第一个汉字,其他隐藏为2个星号,比如:李**

2、【身份证号】显示最后四位,其他隐藏。共计18位或者15位,比如:*************1234

3、【固定电话】 显示后四位,其他隐藏,比如:*******3241

4、【手机号码】前三位,后四位,其他隐藏,比如:135****6810

5、【地址】只显示到地区,不显示详细地址,比如:上海徐汇区漕河泾开发区***

6、【电子邮箱】 邮箱前缀仅显示第一个字母,前缀其他隐藏,用星号代替,@及后面的地址显示,比如:d**@126.com

7、【银行卡号】前六位,后四位,其他用星号隐藏每位1个星号,比如:6222600**********1234

8、【密码】密码的全部字符都用代替,比如:*

根据以上规则进行数据脱敏!

具体思路目前是这样的:

从原数据源查询到的生产数据 ——> 数据脱敏 ——> 更新到目标数据源。

原数据源、目标数据源、需要脱敏的表、字段等都放在配置文件中,做到可扩展性!

脱敏工具代码

根据以上规则已经写好了一份简单的脱敏规则工具类。


/**
 * 数据脱敏工具类
 */
public class DesensitizedUtils {
    /**
     *
     * 【中文姓名】只显示第一个汉字,其他隐藏为2个星号,比如:李**
     *
     * @param fullName
     *
     * @return
     *
     */
    public static String chineseName(String fullName) {
        if (StringUtils.isBlank(fullName)) {
            return "";
        }

        String name = StringUtils.left(fullName, 1);

        return StringUtils.rightPad(name, StringUtils.length(fullName), "*");
    }

    /**
     *
     * 【身份证号】显示最后四位,其他隐藏。共计18位或者15位,比如:*************1234
     *
     *
     *
     * @param id
     *
     * @return
     *
     */
    public static String idCardNum(String id) {
        if (StringUtils.isBlank(id)) {
            return "";
        }

        String num = StringUtils.right(id, 4);

        return StringUtils.leftPad(num, StringUtils.length(id), "*");
    }

    /**
     *
     * 【固定电话】 显示后四位,其他隐藏,比如:*******3241
     *
     *
     *
     * @param num
     *
     * @return
     *
     */
    public static String fixedPhone(String num) {
        if (StringUtils.isBlank(num)) {
            return "";
        }

        return StringUtils.leftPad(StringUtils.right(num, 4),
            StringUtils.length(num), "*");
    }

    /**
     *
     * 【手机号码】前三位,后四位,其他隐藏,比如:135****6810
     *
     *
     *
     * @param num
     *
     * @return
     *
     */
    public static String mobilePhone(String num) {
        if (StringUtils.isBlank(num)) {
            return "";
        }

        return StringUtils.left(num, 3)
                          .concat(StringUtils.removeStart(StringUtils.leftPad(
                    StringUtils.right(num, 4), StringUtils.length(num), "*"),
                "***"));
    }

    /**
     *
     * 【地址】只显示到地区,不显示详细地址,比如:上海徐汇区漕河泾开发区***
     *
     *
     *
     * @param address
     *
     * @param sensitiveSize
     *            敏感信息长度
     *
     * @return
     *
     */
    public static String address(String address, int sensitiveSize) {
        if (StringUtils.isBlank(address)) {
            return "";
        }

        int length = StringUtils.length(address);

        return StringUtils.rightPad(StringUtils.left(address,
                length - sensitiveSize), length, "*");
    }

    /**
     *
     * 【电子邮箱】 邮箱前缀仅显示第一个字母,前缀其他隐藏,用星号代替,@及后面的地址显示,比如:d**@126.com
     *
     *
     *
     * @param email
     *
     * @return
     *
     */
    public static String email(String email) {
        if (StringUtils.isBlank(email)) {
            return "";
        }

        int index = StringUtils.indexOf(email, "@");

        if (index <= 1) {

            return email;
        }
        else {

            return StringUtils.rightPad(StringUtils.left(email, 1), index, "*")
                              .concat(StringUtils.mid(email, index,
                    StringUtils.length(email)));
        }
    }

    /**
     *
     * 【银行卡号】前六位,后四位,其他用星号隐藏每位1个星号,比如:6222600**********1234
     *
     *
     *
     * @param cardNum
     *
     * @return
     *
     */
    public static String bankCard(String cardNum) {
        if (StringUtils.isBlank(cardNum)) {
            return "";
        }

        return StringUtils.left(cardNum, 6)
                          .concat(StringUtils.removeStart(StringUtils.leftPad(
                    StringUtils.right(cardNum, 4), StringUtils.length(cardNum),
                    "*"), "******"));
    }

    /**
     *
     * 【密码】密码的全部字符都用*代替,比如:******
     *
     *
     *
     * @param password
     *
     * @return
     *
     */
    public static String password(String password) {
        if (StringUtils.isBlank(password)) {
            return "";
        }

        String pwd = StringUtils.left(password, 0);

        return StringUtils.rightPad(pwd, StringUtils.length(password), "*");
    }
}


目录
相关文章
|
6月前
|
SQL 算法 前端开发
技术分享-动态脱敏
数据脱敏(Data Masking),又称数据混淆、数据漂白、数据去隐私化。用虚假的数据掩饰真实数据,以达到防止数据泄漏的目的。
145 0
|
2月前
如何用二维码高效收集信息?表单功能轻松实现
表单作为草料二维码的高级功能之一,可用于收集格式统一的数据。你可以通过组合姓名、图片、检查项等组件搭建出电子表单,关联到二维码中,扫码填写表单即可更快速、规范的收集数据。这篇文章为大家介绍下表单的制作教程。
|
9月前
|
Cloud Native
【刷题日记】2028. 找出缺失的观测数据
本次刷题日记的第 12 篇,力扣题为:2028. 找出缺失的观测数据赛 ,中等
|
Java 关系型数据库 MySQL
数据脱敏的 3 种常见方案,好用到爆!
数据脱敏的 3 种常见方案,好用到爆!
635 0
数据脱敏的 3 种常见方案,好用到爆!
|
数据安全/隐私保护
Mindopt上新数据脱敏功能,方便外发数据
V0.24.0版本的MindOpt优化求解器新增了数据脱敏功能,可以对输入模型文件进行数据脱敏。将优化问题中问题名、决策变量、约束条件名称这些和业务场景相关的数据进行脱敏变更,使得优化问题的数据仅保留看不出用途的数值信息,隐藏业务信息。方便外发数据去做技术可行性验证、方案咨询、测试等。
Mindopt上新数据脱敏功能,方便外发数据
java后端数据脱敏看这一篇就够了.
现在的项目中需要对展示的数据进行脱敏处理,类似的场景很常见,比如说展示的手机号、银行卡、用户姓名等全部用***这类的特殊字符进行代替。
java后端数据脱敏看这一篇就够了.
|
数据库
数据库实验二:数据查询中难题、易错题合集
数据库实验二:数据查询中难题、易错题合集
116 0
数据库实验二:数据查询中难题、易错题合集
|
存储 SQL 算法
数据脱敏技术与应用
数据脱敏技术与应用
数据脱敏技术与应用
|
数据采集 消息中间件 算法
数据预处理-数据脱敏-需求及实现思路|学习笔记
快速学习数据预处理-数据脱敏-需求及实现思路
387 0
数据预处理-数据脱敏-需求及实现思路|学习笔记
|
数据采集 大数据 数据安全/隐私保护
数据预处理-数据脱敏-手机号码脱敏代码|学习笔记
快速学习数据预处理-数据脱敏-手机号码脱敏代码
433 0