当前位置:首页 » 《关注互联网》 » 正文

简单的 OCR 识别验证码 Demo | Keras 实现_XianxinMao的博客

24 人参与  2022年01月21日 10:35  分类 : 《关注互联网》  评论

点击全文阅读


How to implement an OCR model using CNNs, RNNs, and CTC loss.

This example demonstrates a simple OCR model built with the Functional API. Apart from combining CNN and RNN, it also illustrates how you can instantiate a new layer and use it as an “Endpoint layer” for implementing CTC loss. For a detailed guide to layer subclassing, please check out this page in the developer guides.

我把本次用到的数据集下载过来了,我们要解决的是验证码识别问题,然后每张图片里的验证码就是图片名称

The dataset contains 1040 captcha files as png images. The label for each sample is a string, the name of the file (minus the file extension). We will map each character in the string to an integer for training the model. Similary, we will need to map the predictions of the model back to strings. For this purpose we will maintain two dictionaries, mapping characters to integers, and integers to characters, respectively.

关于这篇 OCR 识别验证码文章,我只会解读关键代码部分,完整的代码我会放在 Github 仓库: https://github.com/MaoXianXin/Tensorflow_tutorial/blob/ViT/OCR/demo.py,大家可以自取。

# Get list of all the images
images = sorted(list(map(str, list(data_dir.glob("*.png")))))
labels = [img.split(os.path.sep)[-1].split(".png")[0] for img in images]
characters = set(char for label in labels for char in label)

print("Number of images found: ", len(images))
print("Number of labels found: ", len(labels))
print("Number of unique characters: ", len(characters))
print("Characters present: ", characters)

images 的展示如下所示,所以此处我们得到的 images 其实是一个图片路劲列表

labels 的展示结果如下所示,这里每个 labels 里的元素都是和上面的 images 的元素一一对应的。

这里我们通过 set 进行去重,最后得到了 1040 张图片的 label name 所用到的所有字符集合

# Mapping characters to integers
char_to_num = layers.StringLookup(
    vocabulary=list(characters), mask_token=None
)

# Mapping integers back to original characters
num_to_char = layers.StringLookup(
    vocabulary=char_to_num.get_vocabulary(), mask_token=None, invert=True
)

下图展示上面代码中的 vocabulary,也就是我们基于 characters 的 19 个字符,建立起来的字典,用于 StringLookup

_, ax = plt.subplots(4, 4, figsize=(10, 5))
for batch in train_dataset.take(1):
    images = batch["image"]
    labels = batch["label"]
    for i in range(16):
        img = (images[i] * 255).numpy().astype("uint8")
        label = tf.strings.reduce_join(num_to_char(labels[i])).numpy().decode("utf-8")
        ax[i // 4, i % 4].imshow(img[:, :, 0].T, cmap="gray")
        ax[i // 4, i % 4].set_title(label)
        ax[i // 4, i % 4].axis("off")
plt.show()

下图是对原始验证码图片的展示结果:

从图片来看,这个验证码是 N 多年前的了,现在的难多了,不过也算一个 Demo 供大家学习吧

最后放一下预测的结果吧,因为我才刚接触 OCR 所以很多实验也没做,更多的经验心得方面估计要后面才能分享

从预测结果来看,用这个 Demo 的网络,解决这种简单问题,看来没毛病哈。


点击全文阅读


本文链接:http://m.zhangshiyu.com/post/33648.html

验证码  图片  展示  
<< 上一篇 下一篇 >>

  • 评论(0)
  • 赞助本站

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

最新文章

  • 前传_笔趣阁(洛妗依慕瑾怀)洛妗依慕瑾怀小说(他道歉,她就必须接受吗?)章节在线阅读
  • 如今却像是一把把刀,直戳我的心窝子小说(苏时梨顾屿舟)全文+后续(如今却像是一把把刀,直戳我的心窝子)畅享阅读
  • (芮宁周津嗣)离婚后,前夫他从六年前回来了芮宁周津嗣无删减小说在线无广告高口碑小说
  • 毕业旅行时,全班坐上驶向深山的大巴车在线阅读_齐修钟明娇晚晚快手热门_小说后续在线阅读_无删减免费完结_
  • 丈夫死后,婆婆怀上他和青梅的孩子新上_青梅陈纪文婆婆更新_小说后续在线阅读_无删减免费完结_
  • 她死三年,霍总红眼挖坟撞墓碑:+后续现已上架(霍绍梃苏楚):结局+番外评价五颗星
  • 偏心父亲为救大儿子用我抵债,后悔疯了隐藏剧情_罗嘉婷婷青岚爽文_小说后续在线阅读_无删减免费完结_
  • 前妻惊艳回国后,乔总跪求父凭女贵小说(苏禾乔南州)章节目录+起点章节(前妻惊艳回国后,乔总跪求父凭女贵)全篇清爽版在线
  • 订婚当天,老公的白月光出狱了完结爽文_谢景川程依陆恒无错版_小说后续在线阅读_无删减免费完结_
  • 初夏的古董店(老祖宗林慕风)全书免费_(老祖宗林慕风)初夏的古董店后续(老祖宗林慕风)
  • 佚名的攻略对象让我怀上畸形儿后,我不要他了沈亦川洛清河全书在线
  • (苏迎夕贺严燊)我把京圈***oss当小白脸养延伸在线下载无广告章节清单

    关于我们 | 我要投稿 | 免责申明

    Copyright © 2020-2022 ZhangShiYu.com Rights Reserved.豫ICP备2022013469号-1