您需要AI互联网
顾问提供专业咨询
AI人工智能 · VR · AR · 智慧博物馆 · 智慧公园 · 景区 · 文创 · 动画 · 游戏 · 年度运营
大模型定制 · WEB3 · 元宇宙 · 区块链 · 高端网站建设 · 小程序 · APP · 微信 · H5 · 电商
AI人工智能知识科普篇—计算机视觉技术
2019.10.06


  1.计算机视觉技术(ComputerVision),什么是计算机视觉?

  “人的大脑皮层的活动,大约70%是在处理视觉相关信息。视觉就相当于人脑的大门,其它如听觉、触觉、味觉那都是带宽较窄的通道。视觉相当于八车道的高速,其它感觉是两旁的人行道。如果不能处理视觉信息的话,整个人工智能系统是个空架子,只能做符号推理,比如下棋、定理证明,没法进入现实世界。计算机视觉之于人工智能,它相当于说芝麻开门。大门就在这里面,这个门打不开,就没法研究真实世界的人工智能。”——朱松纯,加州大学洛杉矶分校UCLA统计学和计算机科学教授根据科普中国撰写的对计算机视觉的定义,这是一门研究如何让机器“看”的科学,更进一步的说,是指用计算机代替人眼对目标进行识别、跟踪和测量的机器视觉,并进一步做图形处理,使计算机处理成为更适合人眼观察或传送给仪器检测的图像。

  2.计算机视觉VS机器视觉

  计算机视觉更关注图像信号本身以及图像相关交叉领域(地图、医疗影像)的研究;机器视觉则偏重计算机视觉技术工程化,更关注广义上的图像信号(激光和摄像头)和自动化控制(生产线)方面的应用。

  3.计算机视觉识别技术的分类

  物体识别分为“1VSN”对不同物体进行归类,以及“1VS1”对同类型的物体进行区分和鉴别;物体属性识别,结合地图模型让物体在视觉的三维空间里得到记忆的重建,进而进行场景的分析和判断;物体行为识别分为3个进阶的步骤,移动识别判断物体是否做了位移,动作识别判断物体做的是什么动作,行为识别是结合视觉主体和场景的交互做出行为的分析和判断。

  4.计算机视觉的识别流程

  训练模型:样本数据包括正样本(包含待检目标的样本)和负样本(不包含目标的样本),视觉系统利用算法对原始样本进行特征的选择和提取训练出分类器(模型);此外因为样本数据成千上万、提取出来的特征更是翻番,所以一般为了缩短训练的过程,会人为加入知识库(提前告诉计算机一些规则),或者引入限制条件来缩小搜索空间。

  识别图像:会先对图像进行信号变换、降噪等预处理,再来利用分类器对输入图像进行目标检测。一般检测过程为用一个扫描子窗口在待检测的图像中不断的移位滑动,子窗口每到一个位置就会计算出该区域的特征,然后用训练好的分类器对该特征进行筛选,判断该区域是否为目标。

  5.计算机视觉技术模式图和对应企业图

  目前世界上图像识别最大的数据库,是斯坦福大学人工智能实验室提供的ImageNet,针对诸如医疗等细分领域也需要收集相应的训练数据;Google、Microsoft此类科技巨头会面向市场提供开源算法框架,为初创视觉识别公司提供初级算法。
400-6446-365 / 010-64928252 我想要个更针对我需求的方案
让决策变的简单
好的开始是成功的一半
请输入关键字