DAV首頁(yè)

數字音視工程網(wǎng)

微信公眾號

手機DAV

熱門(mén)搜索：

技術(shù)風(fēng)向標

我的位置：

麗臺科普 | 什么是計算機視覺(jué)？

來(lái)源：麗臺科技編輯：VI菲 2022-05-12 17:48:20 加入收藏咨詢(xún)

咨詢(xún)

所在單位:	*
姓名:	*
手機:	*
職位:
郵箱:	*
其他聯(lián)系方式:
咨詢(xún)內容:
驗證碼:	不能為空驗證碼錯誤

確定

麗臺科普 |計算機視覺(jué)是一個(gè)研究領(lǐng)域，旨在助力計算機使用復雜算法（可以是傳統算法，也可以是基于深度學(xué)習的算法）來(lái)理解數字圖像和視頻并提取有用的信息。

　　計算機視覺(jué)是一個(gè)研究領(lǐng)域，旨在助力計算機使用復雜算法（可以是傳統算法，也可以是基于深度學(xué)習的算法）來(lái)理解數字圖像和視頻并提取有用的信息。

　　什么是計算機視覺(jué)？

　　計算機視覺(jué)的主要目標是，先理解視頻和靜止圖像的內容，然后從中收集有用的信息，以便解決越來(lái)越多的問(wèn)題。作為人工智能 (AI) 和深度學(xué)習的子領(lǐng)域，計算機視覺(jué)可訓練卷積神經(jīng)網(wǎng)絡(luò ) (CNN)，以便針對各種應用場(chǎng)合開(kāi)發(fā)仿人類(lèi)視覺(jué)功能。計算機視覺(jué)包括對 CNN 進(jìn)行特定訓練，以便利用圖像和視頻進(jìn)行數據分割、分類(lèi)和檢測。

　　卷積神經(jīng)網(wǎng)絡(luò ) (CNN) 能夠針對多種應用場(chǎng)合執行分割、分類(lèi)和檢測：

　　分割：圖像分割是指將像素歸類(lèi)為特定類(lèi)別，如汽車(chē)、道路或行人。它廣泛用于自動(dòng)駕駛汽車(chē)應用(包括 NVIDIA DRIVE™ 軟件堆棧)，用于顯示道路、汽車(chē)和人員。您可以將其想象成一種可視化技術(shù)，該技術(shù)能夠使人們更容易理解計算機的工作。

　　分類(lèi)：圖像分類(lèi)用于確定圖像中的內容。例如，神經(jīng)網(wǎng)絡(luò )經(jīng)過(guò)訓練后能夠識別狗或貓，或者許多其他東西，并且具有高精確度。

　　檢測：通過(guò)圖像檢測，計算機可以定位對象的位置。在許多應用中，CNN 會(huì )在相關(guān)區域周?chē)O置矩形邊界框，將對象完全包含在內。檢測器也可以接受訓練，以便檢測圖像中汽車(chē)或人員的位置。

　　分割、分類(lèi)和檢測

分割	分類(lèi)	檢測
非常適合用于描述對象	是貓還是狗？	它存在于空間中的什么位置？
在自動(dòng)駕駛汽車(chē)中使用	精確分類(lèi)	識別關(guān)乎安全的事物

　　計算機視覺(jué)為何重要？

　　在體育、汽車(chē)、農業(yè)、零售、銀行、施工和保險等行業(yè)，計算機視覺(jué)應用非常廣泛。得益于目前機器用于識別物體的圖像處理器 – 卷積神經(jīng)網(wǎng)絡(luò ) (CNN) ，各種由 AI 驅動(dòng)的機器紛紛開(kāi)始采用仿人眼技術(shù)來(lái)獲得更多助力。CNN 已成為當今自動(dòng)駕駛汽車(chē)、石油勘探和聚變能源研究領(lǐng)域的“眼睛”。它們還有助于在醫學(xué)成像領(lǐng)域快速發(fā)現疾病并挽救生命。

　　數十年來(lái)，傳統的計算機視覺(jué)和圖像處理技術(shù)已經(jīng)應用于眾多應用和研究工作。然而，現代 AI 技術(shù)采用人工神經(jīng)網(wǎng)絡(luò )，能夠實(shí)現更高的性能準確性;高性能計算依托 GPU 取得長(cháng)足進(jìn)步，實(shí)現超人的準確性，從而在運輸、零售、制造、醫療健康和金融服務(wù)等行業(yè)廣泛應用。

　　在將圖像和視頻分類(lèi)為精細離散的類(lèi)別和分類(lèi)方面，如同醫學(xué)計算機軸向斷層掃描或 CAT 掃描中隨時(shí)間推移而產(chǎn)生的微小變化，傳統或基于 AI 的計算機視覺(jué)系統遠勝于人類(lèi)。在這個(gè)意義上，計算機視覺(jué)將人類(lèi)有可能完成的任務(wù)自動(dòng)化，但其準確性和速度要高得多。

　　當前和潛在的應用多種多樣，因此計算機視覺(jué)技術(shù)和解決方案的增長(cháng)預測相當驚人，這點(diǎn)不足為奇。一項市場(chǎng)調研表明，到 2023 年，該市場(chǎng)將以驚人的 47% 的年增長(cháng)率增長(cháng)，屆時(shí)將在全球達到 250 億美元。在整個(gè)計算機科學(xué)范疇內，計算機視覺(jué)是熱門(mén)、活躍的研發(fā)領(lǐng)域之一。

　　計算機視覺(jué)的工作原理是什么？

　　計算機視覺(jué)分析圖像，然后使用卷積神經(jīng)網(wǎng)絡(luò ) (CNN) 創(chuàng )建其 “所見(jiàn)” 的數值表示。CNN 是一類(lèi)人工神經(jīng)網(wǎng)絡(luò )，使用卷積層從輸入中篩選出有用信息。卷積運算需要綜合使用輸入數據(特征圖)與卷積內核(濾波器)，以便生成轉換后的特征圖。卷積層濾波器可根據學(xué)習參數進(jìn)行修改，以便為特定任務(wù)提取最有用的信息。卷積網(wǎng)絡(luò )可根據任務(wù)自動(dòng)調整，尋找最重要的特征。在執行一般的物體識別任務(wù)時(shí)，CNN 會(huì )過(guò)濾物體的形狀信息;但在進(jìn)行識別鳥(niǎo)的任務(wù)時(shí)，CNN 則會(huì )提取鳥(niǎo)的顏色信息。這是由于 CNN 認為，不同類(lèi)的物體會(huì )具有不同的形狀，而對于不同類(lèi)型的鳥(niǎo)而言，其顏色可能要比形狀的差異性更大。

　　計算機視覺(jué)的行業(yè)用例

　　計算機視覺(jué)用例包括圖像識別、圖像分類(lèi)、視頻標記和虛擬助手。計算機視覺(jué)領(lǐng)域中更加流行和突出的用例包括：

　　醫學(xué)。

　　醫學(xué)圖像處理需要快速提取重要的圖像數據以便對患者進(jìn)行正確診斷，包括快速檢測腫瘤和動(dòng)脈硬化。雖然計算機視覺(jué)本身無(wú)法提供診斷，但它是現代醫療診斷技術(shù)中寶貴的一部分，可以更大程度地弱化醫生的想法，并且為醫生提供越來(lái)越多的原本無(wú)法看到的信息。

　　自動(dòng)駕駛汽車(chē)。

　　另一個(gè)非?；钴S的計算機視覺(jué)調研領(lǐng)域，自動(dòng)駕駛車(chē)輛可以完全由計算機視覺(jué)解決方案接管，或者其操作可以得到顯著(zhù)增強。目前已有的常用應用包括汽車(chē)中的早期警報系統。

　　行業(yè)用途。

　　制造業(yè)中有很多計算機視覺(jué)解決方案的當前和潛在用途，以支持制造流程。目前的用途包括質(zhì)量控制，其中計算機視覺(jué)系統會(huì )檢查部件和產(chǎn)品成品是否有缺陷。在農業(yè)領(lǐng)域，計算機視覺(jué)系統使用光學(xué)分揀去除食品中不需要的材質(zhì)。

　　數據科學(xué)家和計算機視覺(jué)

　　Python 是機器學(xué)習 (ML) 領(lǐng)域的熱門(mén)編程語(yǔ)言，許多數據科學(xué)家都熟悉其易用性及其大型庫(其中大多數庫都是免費和開(kāi)源的)。數據科學(xué)家在 ML 系統中使用 Python 進(jìn)行數據挖掘和數據分析，因為 Python 支持各種 ML 模型和算法。鑒于 ML 和計算機視覺(jué)之間的關(guān)系，數據科學(xué)家可以利用計算機視覺(jué)應用向各類(lèi)企業(yè)的擴展，從圖像和視頻存儲中提取重要信息，增強數據驅動(dòng)的決策制定。

　　借助 GPU 加速卷積神經(jīng)網(wǎng)絡(luò )

　　在架構方面，CPU 僅由幾個(gè)具有大緩存內存的核心組成，一次只可以處理幾個(gè)軟件線(xiàn)程。相比之下，GPU 由數百個(gè)核心組成，可以同時(shí)處理數千個(gè)線(xiàn)程。

　　由于神經(jīng)網(wǎng)絡(luò )由大量相同的神經(jīng)元構建而成，因此本質(zhì)上具有高度并行性。這種并行性自然地會(huì )映射到 GPU ，能夠提供數據并行的算術(shù)架構，并且相比僅限 CPU 的訓練，計算速度大幅增加。這種類(lèi)型的架構對一系列圖像數據執行類(lèi)似的計算。GPU 的單指令多數據 (SIMD) 功能使其適合運行計算機視覺(jué)任務(wù)，這些任務(wù)通常涉及對整個(gè)圖像進(jìn)行類(lèi)似的計算。具體而言，NVIDIA GPU 可顯著(zhù)加速計算機視覺(jué)操作，為其他工作釋放 CPU 。此外，在同一臺機器上可以使用多個(gè) GPU ，創(chuàng )建能夠并行運行多個(gè)計算機視覺(jué)算法的架構。

　　NVIDIA GPU 加速的深度學(xué)習框架

　　GPU 加速深度學(xué)習框架為 Python 等常用編程語(yǔ)言提供編程接口。其還具備輕松創(chuàng )建和探索自定義 CNN 和 DNN 的靈活性，同時(shí)能夠實(shí)現實(shí)驗和工業(yè)部署所需的超高速度。NVIDIA CUDA-X AI 能夠加快 Caffe 、Microsoft Cognitive Toolkit (CNTK) 、TensorFlow 、Theano 和 Torch 等廣泛使用的深度學(xué)習框架以及眾多其他機器學(xué)習應用的運行速度。深度學(xué)習框架在 GPU 上的運行速度更快，并可以在單節點(diǎn)內的多個(gè) GPU 間擴展。要將框架與 GPU 一起用于卷積神經(jīng)網(wǎng)絡(luò )的訓練和推理過(guò)程，NVIDIA 分別提供 cuDNN 和 TensorRT™ 。cuDNN 和 TensorRT 可為卷積層、池化層、歸一化和激活層等標準例程實(shí)現高度調整。

　　單擊此處查看 NVCaffe 安裝步驟和使用指南?？稍诖颂幷业骄矸e神經(jīng)網(wǎng)絡(luò ) C++/CUDA 快速實(shí)施。

　　為快速開(kāi)發(fā)和部署視覺(jué)模型，NVIDIA 向視覺(jué) AI 開(kāi)發(fā)者提供 DeepStream SDK 。其中包含 TAO 工具包，可用于為計算機視覺(jué)領(lǐng)域創(chuàng )建準確高效的 AI 模型。

　　NVIDIA GPU 加速的端到端數據科學(xué)

　　建立在 CUDA 基礎上的 NVIDIA RAPIDS™ 開(kāi)源軟件庫套件使您能夠完全在 GPU 上執行端到端數據科學(xué)和分析流程，同時(shí)仍然使用 Pandas 和 Scikit-Learn API 等熟悉的界面。

　　*本文轉載自NVIDIA英偉達

免責聲明：本文來(lái)源于麗臺科技，本文僅代表作者個(gè)人觀(guān)點(diǎn)，本站不作任何保證和承諾，若有任何疑問(wèn)，請與本文作者聯(lián)系或有侵權行為聯(lián)系本站刪除。(原創(chuàng )稿件未經(jīng)許可,不可轉載,轉載請注明來(lái)源)

掃一掃關(guān)注數字音視工程網(wǎng)公眾號

評論comment

推薦閱讀recommend

重磅！建碁AOPEN攜ChromeOS OPS電腦BP5130亮相2025年臺北國際電腦展！
查看詳情
光影與文化的交響：奧圖碼投影科技重塑夜游文旅新體驗
查看詳情
建碁 AOPEN 邀請函 | 2025年臺北國際電腦展COMPUTEX 2025！
查看詳情
【Infocomm 2025】DAV專(zhuān)訪(fǎng)?？低曇詧?chǎng)景化創(chuàng )新引領(lǐng)音視頻新時(shí)代
查看詳情

国产av福利久久精品can动漫|2021精品国产自在现线|亚洲无线观看国产高清|欧洲人妻丰满av无码久久不卡|欧美情侣性视频