OCR技术资料

技术博客

白翔:趣谈“捕文捉字”– 场景文字检测 | VALSE2017之十
https://mp.weixin.qq.com/s/Y7Xpe1DlhGR9XRB7GunGnA
人工智能前沿讲习班【AIDL专栏】白翔:基于合成数据的场景文本深度表示方法[附PPT]
https://mp.weixin.qq.com/s?src=11&timestamp=1522043323&ver=777&signature=*A0URm9g4ud4Xy7F*1ai37DFvvLyKVtYja139Z1KqXKm2Qd67FV
腾讯数平精准推荐 | OCR技术之检测篇
https://mp.weixin.qq.com/s?src=11&timestamp=1522054897&ver=777&signature=ukxuWvKzmk7gl9mnhecv*BYnjrhadrcvKZCdzgTENkWLzr-4u4iN6rxHoKzJ00oYKSI31EwnJMj0uZC2r7zeMQ*33uGPJKb6tVBdVBrmGFczm2EImZzRh3ba6Z0KsmHb&new=1
腾讯数平精准推荐 | OCR技术之识别篇
https://mp.weixin.qq.com/s?src=11&timestamp=1522054897&ver=777&signature=1n1eLHQ6UH-0ybeJSMnrqcA*5JHNHr5ueOx-Inburx*Lzbs9qFzlW4UOc4xD4Llywovu9np8Kj-0TVEhfwGyXkFhhGbzqaRdb6TxRQGflKNZrCQgQgJ76pTSZ0dSz0Gy&new=1
资源 | 百万级字符:清华大学提出中文自然文本数据集CTW
https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650738568&idx=3&sn=92a17c297fafa5e5da25e53ad153cb8e&chksm=871acbf6b06d42e07ea521c508216eb7ff975222ecfb31171d7d940e8023f3e1e4956ddde274#rd

手写笔记的图像压缩增强算法

介绍:https://mzucker.github.io/2016/09/20/noteshrink.html
代码:https://github.com/mzucker/noteshrink

这篇首先是找到背景颜色,具体是从2000x2000大小的图像中随机抽取5%的像素,然后找到像素值最多的像素值作为背景填充色,实际中占比最多的像素通常仍然占比较低,这里把8位图像深度降低到6位来提高最多像素的占比,降低误差。
背景的填充方法首先将颜色空间转换到HSV空间,并将该像素在S和V附近的值都用该背景颜色统一表示。
剩余的像素就是前景了,对其进行聚类,得到聚类中心,并将得到的聚类进行颜色增强,并将类别的像素都用聚类中心填充。

Chinese Text in the Wild

https://ctwdataset.github.io/
清华放出来的一个非常全面的中文ocr的实现,包含实现代码、数据集、训练好的模型。
数据集有32285张图像和1018402个中文字符。

开源实现

ctpn+crnn中文识别
https://github.com/bear63/sceneReco
ctpn+crnn英文识别
https://github.com/AKSHAYUBHAT/DeepVideoAnalytics/tree/master/docs/experiments/ocr
crnn
https://github.com/AimeeKing/crnn-tensorflow
https://github.com/Belval/CRNN/tree/master/CRNN
验证码识别
https://github.com/ypwhs/captcha_break