c# – 如何检测文本文件是否通过OCR转换
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了c# – 如何检测文本文件是否通过OCR转换,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含1056字,纯文字阅读大概需要2分钟。
内容图文
![c# – 如何检测文本文件是否通过OCR转换](/upload/InfoBanner/zyjiaocheng/801/986f99b74d8a4b0a9ae437d4dc491437.jpg)
我想使用C#创建一个应用程序来检查文件是通过OCR转换还是通过键盘输入
解决方法:
这项工作一般很难解决,并且在特定情况下很容易解决.
例如,如果您的OCR软件插入一堆非ASCII字符,并且您的所有文档仅包含字母A到Z,小写字母a-z,数字和标点符号,那么您的工作相当简单.
要解决这个问题,可以对文档中的字符使用for循环,并使用if语句(如if(char.IsLetter(currentChar))和if(char.IsDigit(currentChar)),或者使用char.GetUnicodeCategory switch语句.
如果有特定的单词/字母总是出错,你可以制作一个字典< string,bool>对象,并用你知道OCR总是出错的单词填充它,和/或你知道人类不会出错的单词.然后,循环遍历文档中的所有单词,看看你是否在词典中得到匹配,证明它是人类或OCR.
如果您使用的OCR软件不容易以易于检测的方式搞砸,那么您必须使用人工智能来解决它??.希望你不必诉诸于此,因为这对于编程来说真的很难,并且需要做大量工作才能正确设置和维护.根据您的描述和您的评论,听起来您可以使用更简单的解决方案.
无论如何,做这种工作的软件都会让一些文件出错.用户可能输入了一些奇怪的内容,或者以某些非ASCII字符(例如简历一词)复制/粘贴,或者OCR以某种方式没有发现任何可检测到的错误.希望你有办法处理这个事实,或者你的情况不够危险,这是一个问题.
内容总结
以上是互联网集市为您收集整理的c# – 如何检测文本文件是否通过OCR转换全部内容,希望文章能够帮你解决c# – 如何检测文本文件是否通过OCR转换所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。