备案控制台

开发者社区

开发者社区云计算文章正文

简单、直观的实现优于复杂、难懂的实现，最近开发扑克识别过程的总结

2017-02-28 944

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

最近开发了款通用的扑克识别程序，本文谈下心得。最开始是准备使用Shape Context或Zernike矩来识别的，写出了Shape Context，发现识别率达不到理想状态。接着准备用Zernike矩实现，查找文献发现，Zernike矩虽然理论上对旋转是不变的，但实际上，图像的旋转会导致识别率降低，加上样本不多，就放弃了这两种方法。最后，还是用最基本的模板匹配和Blob分析来解决的，在只有单一的样本的情况下，对不同字体不同印刷的扑克，对有扭曲、旋转以及轻微模糊的扑克，达到了99.9%的识别率（这0.1%还没出现，也就是说，理论上达到了100%）。由于是商业性开发，代码就不贴了，只谈原理。

模板匹配就不详谈了，这是最最基本的识别方法，详见《车牌识别及验证码识别的一般思路》。而所谓Blob，就是一个整体连着的图像像素块。Blob有许多特征，比如，长、宽、重心、面积等等，还有些更复杂的Blob特征，这里就不详述了，反正都没用上。这里只谈最简单最基本的Blob的特征。基本识别过程是：

（1）Blob特征识别，将图像分为几大组。

（2）对每一组使用模板匹配，进行识别。

（3）对于（2）中一些易混淆结果，再使用Blob特征，进行识别。

一、Blob特征识别

本文中的Blob指的是连通的黑色像素块。比如：

这就是一个Blob。

将这个Blob图像的颜色取反，也就是黑变成白，白变成黑，颠倒黑白，指鹿为马，得到这样一个图：

数一下是几块？——8块！

不过，这里的8块这个特征是不稳定的，因为图像可能会旋转变形。为了得到稳定的特征，将这个图像向上、下、左、右分别扩张几个像素，得到这样一个图像：

这个图像有几块？——3块！这个3块的特征非常稳定，不受旋转及字体的影响。

这样一来，根据图像的反色->扩大->Blob计数就可以将它分成几组：

A组：有1个块的——2，3，5……

B组：有2个块的——4，6……

C组：有3个块的——8，Q（有时）……

二、对每一组进行模板匹配

详细就不讲了，网上一搜一大堆。

三、对易混淆结果，再使用Blob特征进行识别。

一些易混淆的字符，如3和5等…黑桃和草花…，再使用Blob特征进行识别。这里识别的方式五花八门，略举一二典型的。

拿3和5来说，首先将它们取反，再扩张几个像素，再从中线劈开：3和5就变成了：

数一下几个Blob？3是1个，5是2个。

再拿黑桃和草花来说：

分别取它们最左上的块。黑桃的左上块比较规则，一般都是近似三角形，而草花的就不规则，尤其是当图比较模糊时，会近似矩形：

怎么分辨这两类呢？我定义了个对称因子: 以该Blob所属矩形的中心为对称中心，对矩形中的某一点A（x，y），找到它的对称点A’（w-x,h-y）。由于图像中像素是离散的，实际对称点是A’（w-x-1,h-y-1）。

计算对称点的颜色相同的点的个数，然后用这个个数除以总的像素数量，就得到Blob的对称因子。这个定义简单、直接，方便计算。黑桃左上块的对称因子很小，而草花的左上块对称因子较大，两个就识别开了。当然，这里还辅助了其它的Blob特征，就不详述了。

小结：

简单的好啊。但由于简单的东西很多时候上不了台面，所以书上啊，论文上啊，很少谈。书上、论文上都喜欢谈些复杂的牛逼的东东。具体到开发项目上来说，还是能简单就简单最好。本文使用的就是最基本的模板匹配、最简单的Blob分析及最初级的决策树模型，在最少样本的情况下，达到了最高的识别率。

本文转自xiaotie博客园博客，原文链接http://www.cnblogs.com/xiaotie/archive/2010/05/23/1741946.html如需转载请自行联系原作者

xiaotie 集异璧实验室(GEBLAB)

最美的回忆

目录

相关文章

TJUTCM-策士之九尾

|

8月前

|

算法

计算机算法设计与分析

笔记

TJUTCM-策士之九尾

47 0 0

-开发达人-

|

8月前

|

Web App开发监控安全

研究实锤GPT-4真变笨了：3个月内数学能力雪崩式下降，代码能力也变差

研究实锤GPT-4真变笨了：3个月内数学能力雪崩式下降，代码能力也变差

-开发达人-

80 0 0

测试开发干货

|

11月前

|

XML 测试技术数据格式

【实测】有奇效！用测试用例设计的路子去学习新知识点。

【实测】有奇效！用测试用例设计的路子去学习新知识点。

测试开发干货

93 0 0

-开发达人-

|

11月前

|

机器学习/深度学习人工智能自然语言处理

扩散模型背后数学太难了，啃不动？谷歌用统一视角讲明白了

扩散模型背后数学太难了，啃不动？谷歌用统一视角讲明白了

-开发达人-

188 0 0

IT运维技术圈

|

11月前

|

运维

ChatGPT的引申想法及其功能全介绍

ChatGPT的引申想法及其功能全介绍

IT运维技术圈

73 0 0

柳鲲鹏

|

程序员

软件基本功：垃圾代码的共同特征

软件基本功：垃圾代码的共同特征

柳鲲鹏

82 0 0

互联网-小阿宇

|

存储关系型数据库 MySQL

第十三章《优化》

第十三章《优化》

互联网-小阿宇

89 0 0

3ewaj2jnqceye

|

存储搜索推荐数据可视化

Logseq 评测：优点、缺点、评价、学习教程

双链笔记：知识管理神器

3ewaj2jnqceye

1003 0 0

Logseq 评测：优点、缺点、评价、学习教程

云栖号资讯小哥

|

算法 Shell 决策智能

只用一行代码就能搞定，博弈论究竟是什么神仙算法？

云栖号资讯：【点击查看更多行业资讯】在这里您可以找到不同行业的第一手的上云资讯，还在等什么，快来！博弈论是一门很庞大的学科，它算是数学的一个分支，也和运筹学甚至是经济学有关。虽然它严格说起来并不是算法领域的内容，但是有不少关于博弈论有趣的算法和问题。

云栖号资讯小哥

859 0 0

金色海洋

|

存储 SQL 前端开发

【自然框架】——思路、结构、特点的介绍（初稿，欢迎大家多提意见）

开场白　　面向过程：面向过程是“写代码”，根据客户提出来的需求来写代码，包括函数。一步一步的写，都写完了，功能也就实现了。　　面向对象：面向对象是“做设计”，先不考虑细节，而是先做总体设计。都设计好了，再去实现细节。

金色海洋

1027 0 0

热门文章

最新文章

Mac安装并使用telnet命令操作

OSS回源的几种方式和应用场景

[剑指offer] 孩子们的游戏(圆圈中最后剩下的数)

网络安全系列之二十二 Windows用户账号加固

我理解的一个程序员如何学习前端开发

《社交网站界面设计（原书第2版）》——1.9　为设备之间的空间进行设计

《Microduino实战》——1.2　为什么要开源

.Net函数Math.Round你会用吗？

麻省理工大学新发明：暗黑WiFi透视技术

2014秋C++第19周补充代码哈希法的存储与查找

R语言关联规则模型(Apriori算法)挖掘杂货店的交易数据与交互可视化

R语言近似贝叶斯计算MCMC（ABC-MCMC）轨迹图和边缘图可视化

r语言中对LASSO回归，Ridge岭回归和弹性网络Elastic Net模型实现-4

Sentieon | 每周文献-Multi-omics-第四十一期

数据分享|R语言广义线性模型GLM：线性最小二乘、对数变换、泊松、二项式逻辑回归分析冰淇淋销售时间序列数据和模拟-2

数据分享|R语言广义线性模型GLM：线性最小二乘、对数变换、泊松、二项式逻辑回归分析冰淇淋销售时间序列数据和模拟-1

基于RT-Thread摄像头车牌图像采集系统

R语言极值理论：希尔HILL统计量尾部指数参数估计可视化

【视频】R语言中的分布滞后非线性模型（DLNM）与发病率，死亡率和空气污染示例

sql语句创建数据库

相关课程

更多

机器学习入门-概念原理及常用算法

【算法实战】15. 利用SVD来简化数据

【算法实战】8. 集成方法-Adaboost

【算法实战】7. 集成方法-随机森林

【算法实战】14. 利用PCA来简化数据

【新人赛】工业蒸汽量预测建模算法代码开源分享合集

相关电子书

更多

如何成为一名优秀的工程师(语义篇）

大数据可视化与自然之美

强化学习在电商环境下的若干应用与研究

相关实验场景

更多

函数计算部署AI艺术字应用，生成新春文字头像

免费撸A10显卡！在PAI-DSW里用FaceChain训练专属形象照

【图生图】一键部署3D卡通风格模型

【文生文】一键部署ChatYuan模型

实验手册指导文档

一键创建和部署高分电影推荐语音技能

下一篇

部署LAMP环境（Alibaba Cloud Linux 3）