+AI場景,3步懂圖像識別產(chǎn)品
本文重點講述基于成熟的第三方AI平臺阿里、某度、騰訊、谷歌等等中選擇一個可供使用的SDK基于語言實現(xiàn)圖像識別功能的GUI界面,從而一觀圖像識別車型、圖像識別文本產(chǎn)品的實現(xiàn)過程。
我們正處于各種圖像識別的場景里,你去某些生鮮超市不用手機(jī)可以實現(xiàn)刷臉支付,去銀行ATM機(jī)不用卡片可以刷臉取現(xiàn),在很多城市的許多十字路口沒有交警但是你如果違規(guī)駕駛你的車輛被AI攝像頭識別的清清楚楚等等場景里均有機(jī)器視覺的應(yīng)用圖像識別的產(chǎn)品應(yīng)用。
本文不復(fù)述圖像識別在安防、金融、旅游等方面的產(chǎn)品應(yīng)用過程,本文僅僅用AI子任務(wù)圖像識別技術(shù)來看AI產(chǎn)品實現(xiàn)的過程,為啥AI產(chǎn)品要懂實現(xiàn)過程?
因為目前的AI處于快速發(fā)展時期,無論是對AI產(chǎn)品、AI技術(shù)還是AI從業(yè)相關(guān)的AI愛好者,在AI快速發(fā)展的時期跟隨AI技術(shù)懂AI產(chǎn)品的實現(xiàn)過程是非常有意義的事情。
因此本文重點講述基于成熟的第三方AI平臺阿里、某度、騰訊、谷歌等等中選擇一個可供使用的SDK基于語言實現(xiàn)圖像識別功能的GUI界面,從而一觀圖像識別車型、圖像識別文本產(chǎn)品的實現(xiàn)過程。
一、首先實現(xiàn)工具介紹
語言:
產(chǎn)品開發(fā)工具平臺:下載某度AI項目下的SDK
產(chǎn)品開發(fā)設(shè)計工具:,的GUI設(shè)計工具有,,PyQt等各有優(yōu)缺點。是自帶的標(biāo)準(zhǔn)GUI庫,安裝后直接使用,不需額外安裝,使用前用from *導(dǎo)入。第三方GUI界面設(shè)計后經(jīng)過轉(zhuǎn)換成語言才可使用。
產(chǎn)品開發(fā)的關(guān)鍵技術(shù):
設(shè)計產(chǎn)品是,利用技術(shù)開發(fā)GUI界面,基于某度AI提供的開源技術(shù),實現(xiàn)5個功能:人臉檢測、動物識別、植物識別、車型識別、文字識別。用戶選擇圖片后,單擊對應(yīng)的按鈕,獲得識別結(jié)果,其中文字識別的結(jié)果以txt形式保存在硬盤上,其余結(jié)果顯示在窗體上。
某度AI結(jié)果抓?。?/p>
某度AI提供的結(jié)果信息量大,用戶需要對其中數(shù)據(jù)進(jìn)行抓取。下列代碼對某度人臉檢測功能顏值結(jié)果進(jìn)行抓取,結(jié)果存放在變量,詳情知識點見鏈接
=[‘’]
=[‘’]
res=resu[0]
=res[‘’]
二、其次功能實現(xiàn)過程1. 產(chǎn)品界面設(shè)計實現(xiàn)過程
程序運行后,首先顯示歡迎界面(核心代碼是,、、(歡’迎’,”某度AI人工智能”+”\n”+”2018年11月出品”))。
界面設(shè)計,在界面上設(shè)置3個標(biāo)簽,5個按鈕等控件。3個標(biāo)簽分別顯示圖片,某度AI結(jié)果,運行時間等。7個按鈕有“選擇圖片”,“結(jié)束”以及五個實現(xiàn)某度圖像功能按鈕。
采用函數(shù)設(shè)置各個控件的位置,以下代碼分別實現(xiàn)標(biāo)簽和按鈕的位置:
btn=(root,text=”選擇圖片”,=xz)。(x=120,y=20)
=(root,=23,=6,bg=’blue’,fg=’’)。
(x=450,y=150)
2. 選擇圖片功能實現(xiàn)過程
選擇圖片,按鈕打開選擇文件對話框,并將其顯示在界面的標(biāo)簽上,其核心代碼是:
=。。()
pil=。open()
=。(=)
=(root,=,=ww,=hh)
3. 識別按鈕功能設(shè)計實現(xiàn)過程
采用def函數(shù)功能將按鈕與某度AI結(jié)果進(jìn)行定義。以下代碼實現(xiàn),動物檢測,按鈕與某度AI結(jié)果的鏈接。
def
=(,,)
():
(,’rb’)asfp:
fp.read()
byn=(root,text=”動物識別”,=)
4. 菜單設(shè)計實現(xiàn)過程
菜單設(shè)計的代碼是:
=Menu(,=0)
.(=’關(guān)于’,menu=)
for item in[‘版權(quán)信息’]:
.(=item,=syu)
root[‘menu’]=