光学字符识别(OCR)是将印刷材料转换成文本或文字处理文件的过程,这些文件易于编辑和存储。这项技术使这些材料比硬拷贝材料使用更少的储存空间。OCR技术对信息的存储、共享和编辑方式产生了巨大的影响。在光学字符识别之前,如果有人想把一本书转换成文字处理文件,那么每一页都必须手动逐字输入。
OCR技术需要硬件和软件,此外,复杂的OCR系统需要在计算机中额外安装一块电路板来完成这一过程。光学扫描器扫描页面上的文本,然后将字体分解成一系列点,称为位图。该软件可以读取常见的字体,并区分行开始和结束的位置,这个位图然后被翻译成计算机文本。
虽然光学字符识别近年来取得了巨大的进步,但它在识别笔迹或与笔迹相似的字体方面仍然表现不佳。银行业内部有一些系统使用OCR技术试图读取手写支票上的金额,以配合计算机读取路由和账户号码的能力。
要了解OCR的强大功能,可以参考一个真实的示例。想象一下,一个警察部门把所有犯罪记录都储存在巨大的文件柜里,使用OCR扫描数百万页资料可能是一项昂贵和耗时的工作。
一旦OCR系统将数百万纸质资料转换成计算机可读的文本,例如,警察可以在几秒钟内搜索整个历史记录。手动查找一个特定的纸质记录可能不是很困难,但是想象一下,一个警察试图在8:00到8:30之间的某个十字路口搜索所有犯罪行为,计算机搜索就显得尤为重要。
这个例子仅仅触及了可搜索文本的表面,这是许多公司和机构花费数百万美元使用OCR的原因之一。