从真假美猴王谈起 - 让套牌车、克隆x 无处遁形的技术手段思考

本文涉及的产品
云原生数据库 PolarDB MySQL 版,Serverless 5000PCU 100GB
云数据库 Redis 版,社区版 2GB
推荐场景:
搭建游戏排行榜
云数据库 RDS MySQL Serverless,0.5-2RCU 50GB
简介: 标签 PostgreSQL , RFID , 物联网 , IoT , 套牌车 , 克隆车 , Wavelet , 图像相似度 , 传输加密 , 伪装 背景 西游记想必大家小时候都看过吧,其中有一集“真假美猴王”还记得吗? 假的美猴王简直是克隆的,和孙悟空一模一样。一开始菩提祖师、如来佛祖

标签

PostgreSQL , RFID , 物联网 , IoT , 套牌车 , 克隆车 , Wavelet , 图像相似度 , 传输加密 , 伪装


背景

西游记想必大家小时候都看过吧,其中有一集“真假美猴王”还记得吗?

假的美猴王简直是克隆的,和孙悟空一模一样。一开始菩提祖师、如来佛祖、观音菩萨、就连最亲近的师父、师兄弟都分辨不出来,最后师父使出紧箍咒的绝招才辨别出来。

pic

打假在现实世界中的需求也非常旺盛,诸如我们看到的一些商品的防伪码验证、水印验证、钞票的一些特征验证等等。

但是大多数的防伪手段是很容易模仿的,包括电话,网站的防伪验证。钞票也一样,再难也有人会去搞。

再往广泛的场景去想,还有更多的真假美猴王,比如套牌车(克隆车),克隆人,ip伪装,MAC伪装。

有什么技术手段可以真正的解决真假美猴王的问题呢?

我们接下来从套牌车谈起.

什么是套牌车

套牌车正是克隆车。这种车是参照真牌车的型号和颜色,将号码相同的假牌套在同样型号和颜色的车上,其中有很多是报废后偷运出来的旧车翻新的。

假设你的车牌号是“京A00001”,有一整套档案资料,做套牌车的人就找一部和你同厂牌型号同颜色的车,也做一副号牌也是“京A00001”,把原车的的发动机号和大架号码磨去,重新按照你的车档案中的发动机号和大架号做上去,这样就出现了一套档案两部同样的车,然后伪造行驶执照,此为套牌!

驾驶套牌车的危害非常多

一是害自己

根据《道路交通安全法》的规定,一旦发现套牌现象,对于套牌车主除了给予经济处罚外,严重者还要予以刑事处罚,最终是" 搬起石头砸自己的脚" ;

二是害他人

套牌车主因为套用别人的牌照,所以在路上行驶就胆大妄为,闯红灯、轧黄线,几乎没他不敢做的;

三是害社会

由于套牌车主在路上行驶极少以交通法规来约束自己,随之带来的交通事故、法律纠纷势必给社会带来更大的不稳定因素!  

传统手段判断套牌车的方法和难度

传统的检测方法完全靠人,靠经验

套牌车的方法有四招,可以简单概括成“望、摸、问、查”四种方法来识别真假牌。

望是观察车牌外形,从形、色、字的角度进行基本判断。正规的车牌经过高科技处理,并采用一次成型技术,给人的视觉感受很好。而伪造的“套牌”在正常阳光下存在颜色偏红或者偏黄、字体较瘦等“硬伤”,只要细加端详就能发现。   

摸是用手触摸车牌,尤其是周边棱角处,这是判断一辆车是否存在套牌的重要标志。由于并非一次性成型,“套牌”上的字体边缘会有棱角,即使打磨过也难以掩盖痕迹,拆下车牌,其背面会有敲打过的痕迹。   

问是判断是否套牌的重要方法。目前二手车市场上一些“黄牛”喜欢把二手车牌卖掉,用打磨的“套牌”随车出售,从中牟取暴利。遇上这种情况,购车人只要多问几次可疑“套牌车”的车主就会发现,这些车主对正常领证程序说不清,或者说车牌是别人帮忙办的。   

查是最有效的一招:记下车牌号码后,到车辆管理部门上网查询车辆登记档案。挪用牌照的套牌车有的是“套”不同车型牌照,有的是“套”同种车型牌照,有的还涂改车架号和相关标志。

我们回想一下美猴王的鉴别,其实一开始用的都是传统的手段,望闻问切、甚至照妖镜都用上了,都没识别出来。

紧箍咒与RFID

最后假的美猴王是怎么鉴别出来的呢?没错紧箍咒,这是唯一不一样的地方。

从紧箍咒,我们可以联想到RFID,比如你去迪卡侬买衣服,衣服标签里就包含了一个RFID(由天线,耦合元件及芯片组成,一般来说都是用标签作为应答器,每个标签具有唯一的电子编码,附着在物体上标识目标对象)。

rfid就是唯一的,你买了两件一模一样,尺寸颜色都一样的衣服时,就可以通过RFID来辨别。

pic

rfid除了防伪,还可以用来监控产品的生产流程,每一步都能唯一的挂钩起来。

https://en.wikipedia.org/wiki/Radio-frequency_identification

http://baike.baidu.com/subview/531097/13865303.htm

RFID介绍

最初在技术领域,应答器是指能够传输信息回复信息的电子模块,近些年,由于射频技术发展迅猛,应答器有了新的说法和含义,又被叫做智能标签或标签。RFID电子标签的阅读器通过天线与RFID电子标签进行无线通信,可以实现对标签识别码和内存数据的读出或写入操作。RFID技术可识别高速运动物体并可同时识别多个标签,操作快捷方便。

在未来,RFID技术的飞速发展对于物联网领域的进步具有重要的意义。

比如在高速收费中的应用(ETC)

pic

好了,回到套牌车(克隆车),传统方法在识别度、识别成本上就决定了,无法杜绝套牌车(原因是识别度低(纯靠经验)、识别成本高(纯靠人力))。

RFID给真正杜绝套牌车带来了希望,我们只需要在汽车上牌时,同时也给汽车贴上RFID,那么这事就好办了。

但是前路并不是一帆风顺的,我们来分析一下还有什么难点。

难题一、车牌与RFID的配对泥潭

首先我们要搞清楚车牌与RFID的识别手段。

车牌的识别手段,拍摄,识别车牌,海康威视是一个典型的供应商代表。

RFID的识别手段,磁场识别,当RFID终端进入识别磁场时,就会被识别。

由于识别手段的差异,决定了不能同时识别同一辆车。

比如同一个路口多辆车并排通过,一张照片中可能涉及多辆车,同时RFID识别也一样,可能一次识别到多辆车,导致RFID与车牌无法在识别时一一挂钩。

pic

如何解决被识别的车牌与RFID的多对多的配对问题呢?

一般来说道路下面都埋设了路感,当汽车经过时,触发拍摄和RFID的识别,并且触发时,可以产生一个唯一的ID,然后拍摄与RFID都带上这个ID,这样RFID与照片就能关联起来了。

但是这可能还是无法解决一对一的关联问题,由于一次可以识别多个设备,所以可能还是多对多的。

pic

难题一解法、多对多的问题解决

1. 数组类型

由于一次或一个短暂的时间窗口内,可能拍摄到多个车牌,或者识别到多个RFID,所以我们在设计结构时,可以使用两个数组分别来存储车牌与RFID。

2. 流式计算

识别套牌车只是公共服务的其中之一,我还写过一些文章,比如抓捕人贩,识别遮挡车牌,公安刑侦等都可能会调用到RFID与车牌的数据。

《金融风控、公安刑侦、社会关系、人脉分析等需求分析与数据库实现 - PostgreSQL图数据库场景应用》

《一场IT民工 与 人贩子 之间的战争 - 只要人人都献出一点爱》

流式计算是必不可少的,不能等数据都汇总了之后再进行处理,那样延迟会很大,办事效率就低了。

pic

3. 流式计算时间窗口

前面讲了,由于识别手段的差别,一辆车的RFID与车牌可能不是同一时刻被识别到的,比如前后有可能会差几秒。

所以在进行配对时,我们需要用到前后几秒的数据进行配对。

4. 流式计算地域窗口

除了时间维度,我们还有另一个维度,即位置维度,比如RFID的识别可能不是与拍摄系统共同建设的,不如说RFID的识别在A路段,而拍摄在附近几百米的某个信号灯附近。

那么时间可能不是差几秒,可能差分钟以上,此时,需要的是地域维度的配对手段,比如说圈定出一个区域,在该区域内的摄像头与RFID识别设备,识别到的车牌与RFID进行配对。

这里需要用到的是GIS技术,如何根据区域快速的赛选记录(GIS索引)。

PostgreSQL可以很好的支撑。

参考PostGIS。

《如何建立GIS测试环境 - 将openstreetmap的样本数据导入PostgreSQL PostGIS库》

《PostgreSQL 百亿地理位置数据 近邻查询性能》

流计算细节

配对的问题解决掉之后,就需要用到流式计算,及时的

定义transform udf

输入(车牌数组,RFID数组)

处理逻辑,根据车牌找出RFID,RFID与RFID数组进行匹配,如果不能匹配,告警。

例子、未做任何优化,仅展示功能(依赖PostGIS地理位置插件)

采集流  
create stream tbl_chepai (  
  sid timestamp, -- 序列或时间的epoch值, 入库时减去offset值,形成时差  
  -- loc geometry, -- 位置  
  loc point,  -- 测试时使用point代替经纬度  
  chepai text[]  
);  

create stream tbl_rfid (  
  sid timestamp, -- 序列或时间的epoch值  
  -- loc geometry, -- 位置  
  loc point,  -- 测试时使用point代替经纬度  
  rfid text[]  
);  

字典库  
车牌, RFID对应表  
create table chepai_rfid(  
  chepai text unique,  
  rfid text unique  
);  

被套牌车库  
create table tbl_taopaiche(sid timestamp, chepai text, loc point);  

流视图  
1. RFID 流视图,保留30分钟的值  
CREATE CONTINUOUS VIEW rfid_cv WITH (ttl = '30 min', ttl_column = 'sid') AS  
  SELECT sid, loc, rfid FROM tbl_rfid;  

2. 车牌 事件机制  
create or replace function tg1() returns trigger as $$  
declare   
  v_rfid text := null;  
  cv_rfid text[] := null;  
  v_loc point := null;  
  v_chepai text := null;  
  cv_chepai text[] := NEW.chepai;  
begin  
  for v_chepai in select chepai from (select chepai from unnest(NEW.chepai) as t(chepai)) t where not exists (select 1 from chepai_rfid where chepai_rfid.chepai=t.chepai)   
  loop  
    raise notice '% 是套牌车', v_chepai;  
    -- 告警,这里可以写成异步通知,发现假车牌,或未登记RFID的车牌   
    -- 本例使用插入审计代替异步调用
    insert into tbl_taopaiche(sid, chepai, loc) values (now(), v_chepai, NEW.loc);  
    cv_chepai := array_remove(cv_chepai, v_chepai);  
  end loop;  

  raise notice '%', cv_chepai;
  for v_rfid, v_chepai in select rfid,chepai from chepai_rfid where chepai = any(cv_chepai)   
  loop   
    raise notice '%,%', v_rfid, v_chepai;
    if v_loc is null then   
      select loc into v_loc from rfid_cv order by loc <-> NEW.loc limit 1;  
      raise notice '%', v_loc;
    end if;   
    if cv_rfid is null then   
      select array_agg(t.unnest) into cv_rfid from (select unnest(t1.rfid) from rfid_cv t1 where t1.loc::text=v_loc::text and t1.sid between NEW.sid-interval '1 min' and NEW.sid+interval '1 min') t;  

      if cv_rfid is null then
        -- 该时间段内RFID没有上报信息,可能是RFID故障,也可能是套牌车造成
    raise notice '% 是套牌车', NEW.chepai;  
        -- 告警,异步通知,可能发现套牌车   
        -- 本例使用插入审计代替异步调用
        insert into tbl_taopaiche(sid, chepai, loc) values (now(), v_chepai, NEW.loc);  
    continue;
      end if;

      raise notice '%', cv_rfid;
    end if;  

    if (not cv_rfid && array[v_rfid]) then   
      raise notice '% 是套牌车', NEW.chepai;  
      -- 告警,异步通知,可能发现套牌车   
      -- 本例使用插入审计代替异步调用
      insert into tbl_taopaiche(sid, chepai, loc) values (now(), v_chepai, NEW.loc);  
    end if;  
  end loop;  
  RETURN NEW;  
end;  
$$ language plpgsql strict;  

CREATE CONTINUOUS TRANSFORM ct AS  
  SELECT sid::timestamp, loc::point, chepai::text[] FROM tbl_chepai  
  THEN EXECUTE PROCEDURE tg1();    

数据测试

insert into chepai_rfid values('浙A00001', '123');  
insert into chepai_rfid values('浙A00002', '234');  

insert into tbl_rfid (sid, loc, rfid) values (now(), '(1,2)', array['123']);  
insert into tbl_chepai (sid, loc, chepai) values (now()-interval '30 s', '(1,2)', array['浙A00002', '浙A00001']);  

车牌 '浙A00002' 可能被套牌  

关于流计算的其他案例和部署方法,请参考

《流计算风云再起 - PostgreSQL携PipelineDB力挺IoT》

数据风险与安全解法

1. 在识别RFID时,需要确保无线传输的数据不被窃取,比如使用加密的手段进行通信

2. 数据采集后,传输给后台(比如数据库)的过程中也需要加密

3. 由于RFID与车牌绑定,所以RFID的数据安全非常的重要,一旦RFID值被泄露,就有可能被不法分子拿去伪造携带一样信息的RFID。从而继续制造克隆车。 数据库的安全(SQL注入、密码复杂度等。。。)也是需要注意的。

关于数据库的安全,可以参考如下

《DBA专供 冈本003系列 - 数据库安全第一,过个好年》

小结

随着物联网的发展,数据正发生爆炸式的增长,流式的数据处理也会成为将来的热门需求。

pipelineDB的优势

这是个拼爹的年代,pipelinedb有个很牛逼的爸爸PostgreSQL,出身伯克利大学,有扎实的理论基础,历经了43年的进化,在功能、性能、扩展能力、理论基础等方面无需质疑一直处于领先的位置。

搞流式计算,计算是灵魂,算法和支持的功能排在很重要的位置。

pic

PostgreSQL的强大之处在于统计维度极其丰富,数据类型也极其丰富。

build-in 数据类型参考

https://www.postgresql.org/docs/9.6/static/datatype.html

build-in 聚合,窗口,数学函数请参考

https://www.postgresql.org/docs/9.6/static/functions.html

同时还支持扩展,常见的例如

MADLib

PostGIS

路径规划

wavelet

基因

化学

还有好多好多(为什么这么多?原因是PostgreSQL的BSD-Like许可,致使了PG的生态圈真的很大很大,深入各行各业)。

你能想到的和想不到的几乎都可以在pipelinedb 中进行流式处理,大大提高开发效率。

参考

《DBA专供 冈本003系列 - 数据库安全第一,过个好年》

《流计算风云再起 - PostgreSQL携PipelineDB力挺IoT》

《金融风控、公安刑侦、社会关系、人脉分析等需求分析与数据库实现 - PostgreSQL图数据库场景应用》

《一场IT民工 与 人贩子 之间的战争 - 只要人人都献出一点爱》

《PostgreSQL 在视频、图片去重,图像搜索业务中的应用》

《如何建立GIS测试环境 - 将openstreetmap的样本数据导入PostgreSQL PostGIS库》

《PostgreSQL 百亿地理位置数据 近邻查询性能》

相关实践学习
使用PolarDB和ECS搭建门户网站
本场景主要介绍基于PolarDB和ECS实现搭建门户网站。
阿里云数据库产品家族及特性
阿里云智能数据库产品团队一直致力于不断健全产品体系,提升产品性能,打磨产品功能,从而帮助客户实现更加极致的弹性能力、具备更强的扩展能力、并利用云设施进一步降低企业成本。以云原生+分布式为核心技术抓手,打造以自研的在线事务型(OLTP)数据库Polar DB和在线分析型(OLAP)数据库Analytic DB为代表的新一代企业级云原生数据库产品体系, 结合NoSQL数据库、数据库生态工具、云原生智能化数据库管控平台,为阿里巴巴经济体以及各个行业的企业客户和开发者提供从公共云到混合云再到私有云的完整解决方案,提供基于云基础设施进行数据从处理、到存储、再到计算与分析的一体化解决方案。本节课带你了解阿里云数据库产品家族及特性。
相关文章
|
7月前
|
Cloud Native 容灾 程序员
三点“揭露”内向技术人如何做好分享?
希望本文能帮助所有内向者发现自身的优势,实现由内而外的成长。
689 22
三点“揭露”内向技术人如何做好分享?
|
11月前
|
人工智能 小程序
行动派:想到就做,无关乎与成功或失败,重在过程!
行动派:想到就做,无关乎与成功或失败,重在过程!
151 0
Zp
|
XML 算法 IDE
提升:抛弃七条不良编码习惯
提升:抛弃七条不良编码习惯
Zp
95 0
|
存储 编译器 Linux
C生万物 | 窥探数组设计的种种陷阱
数组在设计的时候为何会出现那么多纰漏?数组越界是如何导致的?,我们来一探究竟🔍
52 0
C生万物 | 窥探数组设计的种种陷阱
|
Java Spring
9条消除if...else的锦囊妙计,助你写出更优雅的代码(下)
9条消除if...else的锦囊妙计,助你写出更优雅的代码(下)
|
设计模式 算法 Java
9条消除if...else的锦囊妙计,助你写出更优雅的代码
9条消除if...else的锦囊妙计,助你写出更优雅的代码
还在担心工作要被取代?现实却是机器人已经开始被开除了
短时间内,所谓的“机器人酒店”都是噱头。
324 0
|
存储 数据中心 安全