 我们正处于各种图像识别的场景里,你去某些生鲜超市不用手机可以实现刷脸支付,去银行ATM机不用卡片可以刷脸取现,在很多城市的许多十字路口没有交警但是你如果违规驾驶你的车辆被AI摄像头识别的清清楚楚等等场景里均有机器视觉的应用图像识别的产品应用。 本文不复述图像识别在安防、金融、旅游等方面的产品应用过程,本文仅仅用AI子任务图像识别技术来看AI产品实现的过程,为啥AI产品要懂实现过程? 因为目前的AI处于快速发展时期,无论是对AI产品、AI技术还是AI从业相关的AI爱好者,在AI快速发展的时期跟随AI技术懂AI产品的实现过程是非常有意义的事情。 因此本文重点讲述基于成熟的第三方AI平台阿里、某度、腾讯、谷歌等等中选择一个可供使用的SDK基于Python语言实现图像识别功能的GUI界面,从而一观图像识别车型、图像识别文本产品的实现过程。 一、首先实现工具介绍 语言:Python 产品开发工具平台:下载某度AI项目下的SDK 产品开发设计工具:Tkinker,Python的GUI设计工具有Tkinter,Wxpython,PyQt等各有优缺点。Tkinter是Python自带的标准GUI库,安装Python后直接使用Tkinter,不需额外安装,使用前用from tkinter import*导入tkinter。第三方GUI界面设计后经过转换成Python语言才可使用。 产品开发的关键技术: 设计产品是,利用Tkinter技术开发GUI界面,基于某度AI提供的开源技术,实现5个功能:人脸检测、动物识别、植物识别、车型识别、文字识别。用户选择图片后,单击对应的按钮,获得识别结果,其中文字识别的结果以txt形式保存在硬盘上,其余结果显示在窗体上。 某度AI结果抓取: 某度AI提供的结果信息量大,用户需要对其中数据进行抓取。下列代码对某度人脸检测功能颜值结果进行抓取,结果存放在变量,详情知识点见链接http://996.pm/MeANw resul=result[‘result’] resul=resul[‘face_list’] res=resu[0] linelian=res[‘beauty’] 二、其次功能实现过程 1. 产品界面设计实现过程 程序运行后,首先显示欢迎界面(核心代码是,tkinter、messagebox、showinfo(欢’迎’,”某度AI人工智能”+”\n”+”2018年11月出品”))。 界面设计,在界面上设置3个标签,5个按钮等控件。3个标签分别显示图片,某度AI结果,运行时间等。7个按钮有“选择图片”,“结束”以及五个实现某度图像功能按钮。 采用place函数设置各个控件的位置,以下代码分别实现标签和按钮的位置: btn=button(root,text=”选择图片”,command=xz)。place(x=120,y=20) label=Label(root,width=23,height=6,bg=’blue’,fg=’white’)。 place(x=450,y=150) 2. 选择图片功能实现过程 选择图片,按钮打开选择文件对话框,并将其显示在界面的标签Label上,其核心代码是: pilImage=tkinter。filedialog。askopenfilename() pil=Image。open(pilImage) tkImage=ImageTk。PhotoImage(image=pilImage) label=Label(root,image=tkImage,width=ww,height=hh) 3. 识别按钮功能设计实现过程 采用def函数功能将按钮与某度AI结果进行定义。以下代码实现,动物检测,按钮与某度AI结果的链接。 def dongwujiance client=AipImageClassify(APP_ID,API_KEY,SECRET_KEY) defget_file_content(filePath): withopen(filePath,’rb’)asfp: return fp.read() byn=Button(root,text=”动物识别”,command=dongwujiance) 4. 菜单设计实现过程 菜单设计的代码是: smenul=Menu(fmenul,tearoff=0) fmenul.add_cascade(label=’关于’,menu=smenul) for item in[‘版权信息’]: smenul.add_command(label=item,command=syu) root[‘menu’]=fmenul 5. 版权信息的代码实现过程 defsyu(): tkinter.messagebox.showinfo(‘版权’,’版本号0.5.2’+’\n’+’制作:LineLian的微信号是firstodytm赋能团队’) 6. 生成可执行文件实现过程 编写代码后进行测试。测试后,删除全部断点及部分注释,生成可执行文件,提供给用户使用。生成可执行文件exe的方法是在DOS中输入代码: >pip install pyinstaller >pyinstaller–F-wpython.py 三、然后实现结果 应用程序执行“车型识别”界面如下图:  文字识别保存在:“d:\ocr。txt”。 功能结果如下图:  四、总结+AI产品实现的关键要素 - +AI的场景例如本文用于识别车辆、文字等场景。
- +AI的产品需要的技术本文是调用用成熟的第三方图像识别接口,这也是典型的对+AI型产品快速实现的方法,同时也是区别于纯AI、AI+的特征。
- 对算力的需求,如果公司产生图像的业务比较稳定发展,可以借用第三方云服务来实现。
最后AI助力图像识别、文本识别效率比较高,关键是商业化应用,有商业意义的地方本文图像识别技术落地就更更符合产品逻辑,不会像有的AI技术朋友问笔者:“你不是应该更关注产品怎么吸引用户吗?为何还要懂技术呢?” 答案是:AI处于快速发展时期,对于从事AI产品和AI领域相关的人非常有必要懂AI实现的过程。因为AI技术和AI的相关都处于快速发展状态下。不像传统技术那么死板和已经技术固话,所以很多产品懂AI相关的技术更能创新应用AI。 进一步知识点见链接:http://996.pm/MeANw #专栏作家# 连诗路,公众号:LineLian。人人都是产品经理专栏作家,《产品进化论:AI+时代产品经理的思维方法》一书作者,前阿里产品专家,希望与创业者多多交流。 本文原创发布于人人都是产品经理。未经许可,禁止转载。
在不久的将来,多智时代一定会彻底走入我们的生活,有兴趣入行未来前沿产业的朋友,可以收藏多智时代,及时获取人工智能、大数据、云计算和物联网的前沿资讯和基础知识,让我们一起携手,引领人工智能的未来!
|