首页 > 编程语言 > 详细

小白学Python——用 百度AI 实现 OCR 文字识别

时间:2019-08-31 21:43:57      阅读:312      评论:0      收藏:0      [点我收藏+]

百度AI功能还是很强大的,百度AI开放平台真的是测试接口的天堂,免费接口很多,当然有量的限制,但个人使用是完全够用的,什么人脸识别、MQTT服务器、语音识别等等,应有尽有。

技术分享图片

 

技术分享图片

   

看看OCR识别免费的量

技术分享图片

 

技术分享图片

  

快速安装:执行 pip install baidu-aip 即可

 

新建一个AipOcr:

from aip import AipOcr

""" 你的 APPID AK SK """
APP_ID = 你的 App ID
API_KEY = 你的 Api Key
SECRET_KEY = 你的 Secret Key

client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

通用文字识别

""" 读取图片 """
def get_file_content(filePath):
    with open(filePath, rb) as fp:
        return fp.read()

image = get_file_content(example.jpg)

""" 调用通用文字识别, 图片参数为本地图片 """
client.basicGeneral(image);

""" 如果有可选参数 """
options = {}
options["language_type"] = "CHN_ENG"
options["detect_direction"] = "true"
options["detect_language"] = "true"
options["probability"] = "true"

""" 带参数调用通用文字识别, 图片参数为本地图片 """
client.basicGeneral(image, options)

url = "http//www.x.com/sample.jpg"

""" 调用通用文字识别, 图片参数为远程url图片 """
client.basicGeneralUrl(url);

""" 如果有可选参数 """
options = {}
options["language_type"] = "CHN_ENG"
options["detect_direction"] = "true"
options["detect_language"] = "true"
options["probability"] = "true"

""" 带参数调用通用文字识别, 图片参数为远程url图片 """
client.basicGeneralUrl(url, options)

 

通用文字识别 请求参数详情

技术分享图片

通用文字识别 返回数据参数详情

技术分享图片

 

通用文字识别

 

from aip import AipOcr

#更换为自己的注册信息
APP_ID = ---
API_KEY = ---
SECRET_KEY = ---

client = AipOcr(APP_ID, API_KEY, SECRET_KEY)#创建连接
fp=open("tu2.png","rb").read()#打开并读取文件内容
res=client.basicGeneral(fp)#普通
#print(res)

#将所有的文字都合并到一起
strx=""
for tex in res["words_result"]:#遍历结果
    strx+=tex["words"]#每一行
print(strx)#输出内容

 最终代码

from aip import AipOcr
 
# 定义常量
APP_ID = 14544448
API_KEY = yRZGUXAlCd0c9vQj1kAjBEfY
SECRET_KEY = sc0DKGy7wZ9MeWFGZnbscbRyoDB2IQlj
 
# 初始化AipFace对象
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
 
# 读取图片
def get_file_content(filePath):
    with open(filePath, rb) as fp:
        return fp.read()
 
image = get_file_content(binary_best.jpg)
# 调用通用文字识别, 图片为本地图片
res=client.general(image)
print(res)
 
for item in res[words_result]:
    print(item[words])

例:

from aip import AipOcr
import re
APP_ID=17010327
API_KEY=X2MWCU1LG1PX5H6GAXgdlWD7
SECRET_KEY=vz6GZ6TkhSFvY3quqcuC3EG8oEW3kThB
client=AipOcr(APP_ID,API_KEY,SECRET_KEY)

i=open(rC:\Users\Administrator\Desktop\example.png,rb)
image = i.read()

result=client.basicGeneral(image)

#将所有的文字都合并到一起
for item in result[words_result]:
    print(item[words])

 

技术分享图片

 

通用文字识别client.basicGeneral(image)

通用文字识别(高精度版)client.basicAccurate(image);

通用文字识别(含位置信息版)client.general(image);

通用文字识别(含位置高精度版)client.accurate(image);

通用文字识别(含生僻字版)client.enhancedGeneral(image);

网络图片文字识别client.webImage(image);

 

Python SDK文档 http://ai.baidu.com/docs#/OCR-Python-SDK/53932383

OCR文字识别笔记总结   https://www.cnblogs.com/wj-1314/p/9580387.html  

 

小白学Python——用 百度AI 实现 OCR 文字识别

原文:https://www.cnblogs.com/adam012019/p/11440353.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!