低门槛AI应用

| 分类 技术随笔 

最近想做一个漫画气泡自动识别的应用,因为漫画的图像复杂,ABBYY之类的软件不能很好的识别文字。而且在翻译漫画时,识别的气泡区域信息可以用于遮盖原来的文字,填上译文。

关于气泡分割,已经有相关的论文了,比如:Deep CNN-based Speech Balloon Detection and Segmentation for Comic Books。该篇论文是精确的场景分割,并不是粗略的目标检测。

而对于普通人而言,要理解深度学习技术的原理还是有难度的,但是我们又有定制自己的深度学习应用的需求。这一方面,国内企业中还是百度做得最好,它提供的easyDL可以支持用户自己上传数据,训练模型。图形处理方面,它目前支持图像分类和目标检测。

以下是使用训练的模型的识别效果:

bubble_detection

easyDL基于百度自己的Paddlepaddle深度学习框架实现,只需用户上传自己的数据就可以完成模型的训练,而且提供各种优化模型的方法。中文的文档、视频教程也比较齐全。百度在AI方面还是很良心的。

easyDL降低了人工智能应用的入门门槛,可以让普通用户、企业专注于自己的业务。而提供这类服务的公司可以不断精进自己在AI领域的技术。可能以后AI科学家和工程师主要都是在这类大型企业谋职,做基础的AI研究,而AI在行业的落地则是由各个行业基于百度这类企业提供的AI服务来实现。


上一篇     下一篇