什么是计算机视觉?
作者:维基百科   文章来源: 维基百科    更新时间:2006年05月03日   打印此文    浏览数:

计算机视觉

是当前计算机科学中的一个非常活跃的领域。人类的感官信息中,大多数是来自于视觉。要实现人工智能,对视觉的计算机处理是很重要的方面。在人工智能领域,有人所共知的M.A. Simon(司马贺)的物理符号系统假设,这一假设认为智能的本质就是计算。与此相应,计算机视觉这一学科的基本假设是:可以用计算的方式来模拟人类的视觉机制。

这些假设与哲学中一些基本的问题有密切的关系,例如假设人可以出具有智能的机器,那么人自身就完全可能是另一种智能体制造出来的。这些假设是否成立,还有待进一步的研究进展来验证,计算科学家正在做自己的努力。计算机视觉需要数学、计算机、人工智能、人体科学、硬件等多个学科支持。

机器视觉是计算视觉的产业化部分。这两者之间存在的微妙区别就在于前者假设计算是能够模拟视觉的,而后者只是认为人类视觉的处理机制可以用机器来模拟,而具体利用何种手段,则没有说。

我们也可以把计算机视觉视为人工智能的一个分支。从这个角度来讲,可以认为计算机视觉的目的就是利用计算的手段来处理人类的视觉信息和实现对实际三维场景的理解。

计算机视觉领域与图像处理,模式识别,投影几何,统计推断,统计学习等学科密切相关,近年来,与计算机图形学,三维表现等学科也发生了很强的联系。

最早的,而且目前还具有巨大影响的一种计算机视觉的框架理论是由David Marr在1970年代末期提出的,在他看来,计算机视觉系统的输入是现实世界的二维图像,而输出应该是基于3D表示的定性的和定量的场景理解。这是一种自底向上的研究思路,在这一体系中涉及到对信息的四种不同表示:

(1)输入的二维图像;

(2)初始简图(Primal Sketch):提取出明显的轮廓和边缘信息;

(3)2.5维简图(2.5D Sketch):提取图像中物体在3D世界中的深度信息和其表面各处的方向信息;

(4)以物体为中心的3维表示(3D representation):得到场景的三维几何信息。

其中,从(1)到(2)主要利用各种图像边缘检测算子或工具,其中比较著名的有Canny/Deriche算法、Shen算法,Sobel算子,LoG算子等。目前人们已经提出了数百种边缘检测算法。

从(2)到(3)由各种shape from X来实现。比如shape from shading,shape from contour, shape from texture, shape from motion, shape from stereo 等等。遗憾的是,这些过程大多是病态问题,即使是良态的,结果也极易受到噪声的干扰。

同样的,从(3)到(4)的过程也不简单,这些都是David Marr理论框架为人诟病的地方。

在David Marr(此君英年早逝)之后,又相继提出了active vision,purposive vision等有一定影响的理论框架,并在这些理论的指导下,取得了一些进展。

计算机视觉的应用

一些典型的计算机视觉应用如下所列:

- 从一幅图像(或一系列图像)中自动提取,分割有兴趣的物体(例如提取人的面部);

- 从多幅图像或序列中自动提取场景的三维信息(如从几幅CT图片中实现对人体器官的三维重建);

- 在图像序列中自动跟踪有意义的移动物体(如跟踪停车场中可疑的人的去向);

- 从数字图像的数据库中根据图像的视觉特征实现检索(如从犯罪记录库中查找特定的嫌犯图像);

- 根据摄像头抓取的实时信息进行交通监管。

与其它人工智能分支一样,计算机视觉与認知心理學和生物计算密切相关。这些基础学科的研究进展可以为计算机视觉提供新的思路或处理手段。或许完全的实现对人类视觉的模拟是不可能的,但是部分的实现对改善人类的生存状况却无疑是有益的。

目前,计算机视觉的商用化系统已经出现,在医学图像处理,工业流水线生产,产品自动检测,智能交通,现场监视,数字图书馆,智能搜索引擎,数字娱乐,数字化电影等方面均得到了成功的应用。目前这一市场已经达到每年数十亿美元的规模并且还在飞速成长中。

数字图像处理

在计算机视觉应用领域中,如果要让我们的计算机明白图像的信息就必须经过一系列的处理过程,这一过程称之为“数字图像处理”。数字图像的处理一般包括5个步骤:

    1. - 图像预处理 (Preprocessing)
    2. - 分割 (Segmentation)
    3. - 处理分割后区域 (Processiong Segmented Regions)
    4. - 测量 (measurement)
    5. - 图像判读 (Image interpretation)

转载声明:凡文章出处为www.RoboticFan.com的,系本站的原创文章。其它媒体在注明出处为RoboticFan.com并给出原始链接后可以自由转载,否则将视为侵权!

上一篇:人工智能历史 下一篇:机器人三定律

最近更新
  • 世嘉玩具与孩之宝将上市音乐机器人
  • Vstone携手KumoTek推出KT-X类人机器人系列
  • iRobot军用机器人最新杰作:“金属风暴”
  • 机器人工具包开始预定
  • 迪士尼与WowWee联手打造Wall-E系列产品
  • Arduino-目前为止最容易开发的控制板
  • 微软发布Robotics Developer Studio 2008 CTP
  • roBlocks——“块状”机器人
  • 后AIBO时代的机器狗——G-dog
  • 机器恐龙Pleo升级战

  • 相关文章
  • 很抱歉!还没有相关内容

  • 推荐新闻

    赞助商广告