【独家】一文读懂文字识别(OCR)

  1. 云栖社区>
  2. 数据派THU>
  3. 博客>
  4. 正文

【独家】一文读懂文字识别(OCR)

行者武松 2017-05-01 15:36:00 浏览4204
展开阅读全文


前言


640?wx_fmt=png&wxfrom=5&wx_lazy=1


文字识别是计算机视觉研究领域的分支之一,归属于模式识别和人工智能,是计算机科学的重要组成部分


本文将以上图为主要线索,简要阐述在文字识别领域中的各个组成部分。


一 ,文字识别简介


计算机文字识别,俗称光学字符识别,英文全称是Optical Character Recognition(简称OCR),它是利用光学技术和计算机技术把印在或写在纸上的文字读取出来,并转换成一种计算机能够接受、人又可以理解的格式。OCR技术是实现文字高速录入的一项关键技术。


在OCR技术中,印刷体文字识别是开展最早,技术上最为成熟的一个。早在1929年德国科学家Taushek就取得了一项光学字符识别(Optical Character Recognition,简称OCR)的专利131。欧美国家为了将浩如烟海、与日俱增的大量报刊杂志、文件资料和单据报表等文字材料输

网友评论

登录后评论
0/500
评论
行者武松
+ 关注
所属云栖号: 数据派THU