+AI場景，3步懂圖像識別產(chǎn)品

由網(wǎng)絡(luò) 分享時間：2023-12-31 15:43:50 收藏本文

本文重點講述基于成熟的第三方AI平臺阿里、某度、騰訊、谷歌等等中選擇一個可供使用的SDK基于語言實現(xiàn)圖像識別功能的GUI界面，從而一觀圖像識別車型、圖像識別文本產(chǎn)品的實現(xiàn)過程。

我們正處于各種圖像識別的場景里，你去某些生鮮超市不用手機(jī)可以實現(xiàn)刷臉支付，去銀行ATM機(jī)不用卡片可以刷臉取現(xiàn)，在很多城市的許多十字路口沒有交警但是你如果違規(guī)駕駛你的車輛被AI攝像頭識別的清清楚楚等等場景里均有機(jī)器視覺的應(yīng)用圖像識別的產(chǎn)品應(yīng)用。

本文不復(fù)述圖像識別在安防、金融、旅游等方面的產(chǎn)品應(yīng)用過程，本文僅僅用AI子任務(wù)圖像識別技術(shù)來看AI產(chǎn)品實現(xiàn)的過程，為啥AI產(chǎn)品要懂實現(xiàn)過程？

因為目前的AI處于快速發(fā)展時期，無論是對AI產(chǎn)品、AI技術(shù)還是AI從業(yè)相關(guān)的AI愛好者，在AI快速發(fā)展的時期跟隨AI技術(shù)懂AI產(chǎn)品的實現(xiàn)過程是非常有意義的事情。

因此本文重點講述基于成熟的第三方AI平臺阿里、某度、騰訊、谷歌等等中選擇一個可供使用的SDK基于語言實現(xiàn)圖像識別功能的GUI界面，從而一觀圖像識別車型、圖像識別文本產(chǎn)品的實現(xiàn)過程。

一、首先實現(xiàn)工具介紹

語言：

產(chǎn)品開發(fā)工具平臺：下載某度AI項目下的SDK

產(chǎn)品開發(fā)設(shè)計工具：，的GUI設(shè)計工具有，，PyQt等各有優(yōu)缺點。是自帶的標(biāo)準(zhǔn)GUI庫，安裝后直接使用，不需額外安裝，使用前用from *導(dǎo)入。第三方GUI界面設(shè)計后經(jīng)過轉(zhuǎn)換成語言才可使用。

產(chǎn)品開發(fā)的關(guān)鍵技術(shù)：

設(shè)計產(chǎn)品是，利用技術(shù)開發(fā)GUI界面，基于某度AI提供的開源技術(shù)，實現(xiàn)5個功能：人臉檢測、動物識別、植物識別、車型識別、文字識別。用戶選擇圖片后，單擊對應(yīng)的按鈕，獲得識別結(jié)果，其中文字識別的結(jié)果以txt形式保存在硬盤上，其余結(jié)果顯示在窗體上。

某度AI結(jié)果抓?。?/p>

某度AI提供的結(jié)果信息量大，用戶需要對其中數(shù)據(jù)進(jìn)行抓取。下列代碼對某度人臉檢測功能顏值結(jié)果進(jìn)行抓取，結(jié)果存放在變量，詳情知識點見鏈接

=[‘’]

res=resu[0]

=res[‘’]

二、其次功能實現(xiàn)過程1. 產(chǎn)品界面設(shè)計實現(xiàn)過程

程序運行后，首先顯示歡迎界面（核心代碼是，、、(歡’迎’，”某度AI人工智能”+”\n”+”2018年11月出品”)）。

界面設(shè)計，在界面上設(shè)置3個標(biāo)簽,5個按鈕等控件。3個標(biāo)簽分別顯示圖片，某度AI結(jié)果，運行時間等。7個按鈕有“選擇圖片”，“結(jié)束”以及五個實現(xiàn)某度圖像功能按鈕。

采用函數(shù)設(shè)置各個控件的位置，以下代碼分別實現(xiàn)標(biāo)簽和按鈕的位置：

btn=(root,text=”選擇圖片”,=xz)。(x=120,y=20)

=(root,=23,=6,bg=’blue’,fg=’’)。

(x=450,y=150)