2018-03-31

OCR技术资料

技术博客

白翔：趣谈“捕文捉字”– 场景文字检测 | VALSE2017之十
https://mp.weixin.qq.com/s/Y7Xpe1DlhGR9XRB7GunGnA
人工智能前沿讲习班【AIDL专栏】白翔：基于合成数据的场景文本深度表示方法[附PPT]
https://mp.weixin.qq.com/s?src=11&timestamp=1522043323&ver=777&signature=*A0URm9g4ud4Xy7F*1ai37DFvvLyKVtYja139Z1KqXKm2Qd67FV
腾讯数平精准推荐 | OCR技术之检测篇
https://mp.weixin.qq.com/s?src=11&timestamp=1522054897&ver=777&signature=ukxuWvKzmk7gl9mnhecv*BYnjrhadrcvKZCdzgTENkWLzr-4u4iN6rxHoKzJ00oYKSI31EwnJMj0uZC2r7zeMQ*33uGPJKb6tVBdVBrmGFczm2EImZzRh3ba6Z0KsmHb&new=1
腾讯数平精准推荐 | OCR技术之识别篇
https://mp.weixin.qq.com/s?src=11&timestamp=1522054897&ver=777&signature=1n1eLHQ6UH-0ybeJSMnrqcA*5JHNHr5ueOx-Inburx*Lzbs9qFzlW4UOc4xD4Llywovu9np8Kj-0TVEhfwGyXkFhhGbzqaRdb6TxRQGflKNZrCQgQgJ76pTSZ0dSz0Gy&new=1
资源 | 百万级字符：清华大学提出中文自然文本数据集CTW
https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650738568&idx=3&sn=92a17c297fafa5e5da25e53ad153cb8e&chksm=871acbf6b06d42e07ea521c508216eb7ff975222ecfb31171d7d940e8023f3e1e4956ddde274#rd

手写笔记的图像压缩增强算法

介绍：https://mzucker.github.io/2016/09/20/noteshrink.html
代码：https://github.com/mzucker/noteshrink

这篇首先是找到背景颜色，具体是从2000x2000大小的图像中随机抽取5%的像素，然后找到像素值最多的像素值作为背景填充色，实际中占比最多的像素通常仍然占比较低，这里把8位图像深度降低到6位来提高最多像素的占比，降低误差。
背景的填充方法首先将颜色空间转换到HSV空间，并将该像素在S和V附近的值都用该背景颜色统一表示。
剩余的像素就是前景了，对其进行聚类，得到聚类中心，并将得到的聚类进行颜色增强，并将类别的像素都用聚类中心填充。

Chinese Text in the Wild

https://ctwdataset.github.io/
清华放出来的一个非常全面的中文ocr的实现，包含实现代码、数据集、训练好的模型。
数据集有32285张图像和1018402个中文字符。

开源实现

ctpn+crnn中文识别
https://github.com/bear63/sceneReco
ctpn+crnn英文识别
https://github.com/AKSHAYUBHAT/DeepVideoAnalytics/tree/master/docs/experiments/ocr
crnn
https://github.com/AimeeKing/crnn-tensorflow
https://github.com/Belval/CRNN/tree/master/CRNN
验证码识别
https://github.com/ypwhs/captcha_break

杨现的个人博客

分享计算机视觉、算法、生活累积的点滴

OCR技术资料

技术博客

手写笔记的图像压缩增强算法

Chinese Text in the Wild

开源实现