- 积分
- 212
- 最后登录
- 2022-5-14
- 精华
- 0
- 阅读权限
- 30
- 主题
- 4
- UID
- 2475080
- 帖子
- 530
- PB币
- 576
- 威望
- 0
- 贡献
- 0
- 技术
- 0
- 活跃
- 968
- UID
- 2475080
- 帖子
- 530
- PB币
- 576
- 贡献
- 0
- 技术
- 0
- 活跃
- 968
|
30F
发表于 2016-2-28 01:30:15
IP属地湖北
|只看该作者
无聊实现了我之前说的那个算法,虽然思想不严谨,但是只要不刻意制造文本去误导程序,识别率还马马虎虎,关键是速度确实相当快。
程序只是单线程,CPU i5 480M,415个文本,总计166MB,应该有一亿的字符,耗时18秒。
可能是文本都缓存在内存中了,如果是硬盘载入得慢一些。
容差值在20%或者以上时,会有不少误报,误报总比漏掉好。
你就那么百来个文本,最终结果未必有几条,在程序的结果基础上再一一手动对比都可以接受了。
命令行界面,所以使用方法请使用参数 /?
程序如果报缺少dll,说明得装vc++ 2015 redistributable x64
不支持xp以及以下系统。
代码没有签名,所以几乎可以肯定不被某些杀软信任,所以玩不玩请自便。
同时提供源码,大可自行编译。
a.zip
(56.2 KB, 下载次数: 4)
|
|