- 資訊首頁(yè) > 互聯(lián)網(wǎng) >
- 從美團云GPU云主機談起 揭秘美團外賣(mài)的AI技術(shù)
提起人工智能,很多人會(huì )想到戰勝人類(lèi)的AlphaGo, 想到具有情感認知能力的機器人, 殊不知你每天訂餐的外賣(mài)平臺也應用了大量的AI技術(shù),AI正滲透到生活的方方面面。
以占據近六成市場(chǎng)份額的美團外賣(mài)為例,為了應對復雜的場(chǎng)景,美團外賣(mài)搭建了平均送達時(shí)間28分鐘的智能調度系統、訓練機器自動(dòng)審核提高了運營(yíng)效率以及采用圖片識別技術(shù)提升了用戶(hù)體驗。
其實(shí),美團外賣(mài)平臺從技術(shù)的最底層便開(kāi)始使用AI技術(shù)——利用美團云GPU云主機來(lái)加速DNN(Deep Neural Network深度神經(jīng)網(wǎng)絡(luò ))算法,并通過(guò)深度學(xué)習對平臺上的圖像、文字進(jìn)行自動(dòng)識別,實(shí)現了美團外賣(mài)的高效、平穩運行。
GPU云主機加速DNN算法解決核心難題
深度學(xué)習作為機器學(xué)習的一個(gè)重要分支,能夠建立、模擬人腦進(jìn)行分析學(xué)習的神經(jīng)網(wǎng)絡(luò ),以人腦的機制解釋數據,例如圖像,聲音和文本等。這使得機器能從海量數據中摸索規律,具有和人類(lèi)相似的思考能力,從而對新的樣本做智能識別或對未來(lái)做出預測。
圖一:DNN深度神經(jīng)網(wǎng)絡(luò )與人工智能的關(guān)系
目前支撐深度學(xué)習的算法中,比較常用的是DNN算法。它能較好地模擬人腦神經(jīng)元多層深度傳遞的過(guò)程,在語(yǔ)音識別和圖像識別方面表現突出。但是,人腦的構成異常復雜,一個(gè)健康的成年人的大腦中約有860億個(gè)神經(jīng)元,每個(gè)神經(jīng)元之間形成大約1000個(gè)突觸。機器想要模擬人腦就需模擬出更多的神經(jīng)元和神經(jīng)突觸,這帶來(lái)了超高的計算復雜度。
因此,美團外賣(mài)技術(shù)團隊選擇了美團云GPU云主機來(lái)對DNN算法進(jìn)行加速。該云主機搭載了NVIDIA Tesla M60 GPU,預裝了TensorFlow 1.1-GPU框架和Keras 2.0.4框架。M60可提供最高4096個(gè)并行處理核心,16GB的GDDR5顯存及9.7TFlops 的單精度峰值性能,能夠快速處理海量數據解決深度學(xué)習中的計算難題。
有了GPU云主機提供的計算能力作為基礎支撐,美團外賣(mài)主要將深度學(xué)習用于圖片質(zhì)量識別和OCR印刷文字識別兩個(gè)場(chǎng)景,這也是和平臺用戶(hù)及商家密切相關(guān)的應用場(chǎng)景。
圖像質(zhì)量識別提升用戶(hù)體驗
用戶(hù)在外賣(mài)平臺能夠看到大量的美食圖片,圖片的美觀(guān)程度影響著(zhù)用戶(hù)在點(diǎn)餐時(shí)的視覺(jué)體驗以及下單決策結果,因此,圖片質(zhì)量尤為重要。
圖二:外賣(mài)平臺圖片示例
以上圖為例,用戶(hù)普遍認為左側的圖片在拍攝角度、色彩等方面均優(yōu)于右側。然而,人工進(jìn)行圖片質(zhì)量的評判一般較為主觀(guān),每個(gè)用戶(hù)的標準不一。此外,人工評判進(jìn)行標注又需要耗費大量的人力和時(shí)間。
基于此前的海量圖片、點(diǎn)擊率、評論等數據,美團外賣(mài)通過(guò)深度學(xué)習建模,采用多維度特征設計、自動(dòng)化數據標注的方式,用DNN算法來(lái)判斷圖片的品類(lèi)、色彩、對比度等基礎特征。最終以保證質(zhì)量較高的圖片出現在用戶(hù)眼前,不僅提升了用戶(hù)的點(diǎn)餐體驗,還能夠有效促進(jìn)商家在平臺的成單率。
圖三:針對圖片質(zhì)量問(wèn)題美團外賣(mài)給出的DNN解決方案
OCR文字識別智能審核商家資質(zhì)
美團外賣(mài)整合了超過(guò)100萬(wàn)家商戶(hù),為了提供可靠的服務(wù),平臺需要對商家牌照逐個(gè)審核并進(jìn)行監管,打造讓用戶(hù)放心的外賣(mài)平臺;商家入駐后,又需要將店鋪資料、菜單等信息錄入,為用戶(hù)提供最全面的服務(wù)信息。
無(wú)論是資質(zhì)牌照的審核還是菜單的錄入,涉及到的文字構成可能異常復雜,如各種各樣的字體、雜亂的背景等。如果全部人工操作,將產(chǎn)生極大的人工成本,肉眼識別還容易出現疏忽疏漏的情況。
為了成功在圖片中檢測到文字并進(jìn)行準確識別,美團外賣(mài)整體采用了CNN算法并加入BLSTM(bidirectional long short-termmemory雙向長(cháng)短期記憶網(wǎng)絡(luò ))的模式??紤]到整個(gè)序列建模的能力,美團外賣(mài)平臺又加入了CTC(Connectionist Temporal Classifier聯(lián)結主義時(shí)間分類(lèi)器)序列識別模型。
圖四:美團外賣(mài)的文字檢測識別方案
通過(guò)美團云GPU云主機對算法模型的加速,美團外賣(mài)平臺上的上百萬(wàn)家商戶(hù)數據能夠快速得到處理,并的到有效的審核監管。利用機器完成資質(zhì)審核、文字錄入的工作,大大提升了平臺的運營(yíng)效率,實(shí)現了精細化運營(yíng)。
人工智能的發(fā)展得益于大數據和云計算的日趨成熟。美團點(diǎn)評聚集了超6億用戶(hù)、2.4億活躍買(mǎi)家以及450萬(wàn)商戶(hù)的海量數據,從2013年起,美團云就開(kāi)始逐步承擔起集團的全部業(yè)務(wù),100%云化為美團點(diǎn)評AI技術(shù)的應用打下了良好的技術(shù)基礎。
在底層計算、算法平臺、AI應用方面,美團云也走在了行業(yè)前列。除GPU云主機外,美團云還上線(xiàn)了FPGA云主機和KNL物理機,并將推出KNM云主機,為用戶(hù)提供更多選擇。已經(jīng)上線(xiàn)的深度學(xué)習平臺和人臉識別、OCR文字識別等AI應用也進(jìn)一步提升了整個(gè)平臺的智能化水平。
免責聲明:本站發(fā)布的內容(圖片、視頻和文字)以原創(chuàng )、來(lái)自本網(wǎng)站內容采集于網(wǎng)絡(luò )互聯(lián)網(wǎng)轉載等其它媒體和分享為主,內容觀(guān)點(diǎn)不代表本網(wǎng)站立場(chǎng),如侵犯了原作者的版權,請告知一經(jīng)查實(shí),將立刻刪除涉嫌侵權內容,聯(lián)系我們QQ:712375056,同時(shí)歡迎投稿傳遞力量。
Copyright ? 2009-2022 56dr.com. All Rights Reserved. 特網(wǎng)科技 特網(wǎng)云 版權所有 特網(wǎng)科技 粵ICP備16109289號
域名注冊服務(wù)機構:阿里云計算有限公司(萬(wàn)網(wǎng)) 域名服務(wù)機構:煙臺帝思普網(wǎng)絡(luò )科技有限公司(DNSPod) CDN服務(wù):阿里云計算有限公司 百度云 中國互聯(lián)網(wǎng)舉報中心 增值電信業(yè)務(wù)經(jīng)營(yíng)許可證B2
建議您使用Chrome、Firefox、Edge、IE10及以上版本和360等主流瀏覽器瀏覽本網(wǎng)站