三维重建方法

流程与发展思路

阶段 一 三维点的重构

这个是基础,相标的标定,内外参数问题,以及多视图中同一点判断以及特征点提取都是为解决这个问题。

阶段 二 聚类 /建模

对于简单的模型就可以这些点进行建模了,计算几何,三角化等等方法点线面建模了。 对于大的复杂的物体来说,那先分块了,也就是聚类问题,对于二维的图像就是图像分割,而于三维点以及更加通用就是聚类算法。

-阶段 三 判别器

对于分好块的空间类来进行判别是属于物体,简单几何判断解决了这些问题,例如判别这块的特征点是头部信息呢。而不是脚呢。 这个需要运用深度学习的神经网络来进行模糊判断了。 等判别好之后,再根据子块进一步的进行细化。

当然阶段 二与三不断的进行反复迭代分形一样,例如先认出来头,然后再认出五官。

阶段 四 动作捕捉

走到这一段,就可以做动作的捕捉与分析了。


行为分析

能够实现动作捕捉,再进一步进行为的分析,例如利用人的走路习惯来判断一个人的行为。 [[摄像机模型]] ===================

[[基础矩阵]]

[[RANSAC]]

刚体变换和仿射变换:

刚体变换是放射变换的一种特殊情况。刚体变换就是保证长度和角度正交。比如在黄丽芬的变换中,就是一个刚体,如果旋转矩阵被一个任意奇异矩阵替换,就变成了仿射变换。因此刚体变换就是放射变换的一种特殊情况。其实仿射变换也是一种线性变换,目的就是保持源图像中的直线和圆保持不变,是一个旋转,收缩加平移的过程。在Opencv中有关于affine transform 的一些code。

齐次坐标主要是为了区分点和向量而设置的,并且方便进行反射变换。

投影变换,我觉得就是图像在现实的图像和实际的成像出来的比例吧。

理想的透视模型满足针孔摄像机模型。对三维空间的一个点(X,Y,Z),投影到二维投影平面的坐标为(x,y),上述投影过程可以表示为:

各种变换是坐标变换基础,坐标变换,也就是基变换。我们实际在做那就是找到各种变换转换关系,然后再进行反算求解,得到自己想要东东。 对于运动物体动态捕捉会比较难一点,因为并不一定是线性变换,反解可能就不容易。 变换过程不可逆时,也求解呢,一个方法那就是找到不动点,在不动点进行参数拟合,得到原来方程,然后插值预测,得到一个原值。 http://www.voidcn.com/blog/waeceo/article/p-5003833.html 转换,关键是明白世界坐标系,相机坐标系,像坐标系,底片坐标的关系。也就是内参与外参了。

  1. 用单张2D图像重构3D场景 我想未来的趋势结合红外和光学信息,光学镜头用来获取感光信息,雷达用来获得距离信息
  2. 3D重构总资讯 有空看下别人做的吧
  3. 仿射变换(Affine Transformation)
  4. 深入探索透视投影变换(转) 这个对于齐次变换和投影变换讲的比较清楚,看一下
  5. 如何根据相机的参数知道摄像机的内参数矩阵
  6. 立体视觉基础
  7. Computing a disparity map in OpenCV opencv计算视差
  8. how to find disparity of two stereo images in degree 两幅图像中找到视差
  9. 视差估计方法综述
  10. stereo网站
  11. 在OpenCV中用cvCalibrateCamera2进行相机标定(附程序)
  12. calibrate.py@5549 标定opencv
  13. 深圳先进技术研究院
  14. ` 使用OpenGL对单幅照片进行三维重建 <http://blog.csdn.net/xeric&#95;w/article/details/5867254>`_
  15. Interactive 3D Graphics 交互三维图形 video
  16. 3D角色动画
  17. Alexei (Alyosha) Efros My research is in the area of computer vision and computer graphics, especially at the intersection of the two
  18. 计算机视觉、机器学习相关领域论文和源代码大集合–持续更新
  19. CV牛人
  20. Multi-View Stereo for Community Photo Collections 华盛顿大学三维重构
  21. Robot data set Data for development of accurate computer vision methods 计算机视觉数据集
  22. 脸部识别数据集
  23. 图像数据集 现在还没有仔细看
  24. 立体匹配算法介绍

图像处理领域如果能够和3D打印结合起来,我想会有很大作用的

– Main.GegeZhang - 02 Aug 2013

这个里面用了运动模型,但是我真的 不知道什么是3D重构?

– Main.GegeZhang - 21 Aug 2013

为什么有的图片无法打开。

– Main.GegeZhang - 02 Sep 2013

什么是图像下采样 downsamples ? 目前来看,下采样就是数据大小变小了

– Main.GegeZhang - 04 Sep 2013

标定就是了解摄像机参数,实现对未来图像预测

– Main.GegeZhang - 02 Dec 2013

直接全用2D照片来恢复3D物体 其中之一那就是image based modeling. C:快盘gameEnginemodelingpaper 现在已经很火了。看来现在要抓紧时间把计算机视觉给整理出来。

– Main.GegeZhang - 21 Apr 2014

SFM

  1. 图像获取
  2. 摄像机标定
  3. 特征点的提取
  4. 立体匹配
  5. 深度的确定
  6. 后处理

相机的标定,以及特片点提取计算量,同时还有立体匹配。 到底需要多少张照片。 照片的数据最后精度是什么关系。

大尺度的照片,特征点丰富,容易提取,但小尺度特征的定位精度高,表达描述简单。 匹配时可能会出现失误。

http://blog.csdn.net/linczone/article/details/46237197 Structure from Motion (SfM)算法测试—3D重建简介, 3D重建的精度很重要,扫描精度与照片的分辨率,拍摄距离,对焦的准确性,灯光系统很大关系。 运算的时间与照片数量的关系是n!/(n-m)! 的增长。 并且精度 1024*768 =83mm, 83/1024mm = 0.08mm.

http://ccwu.me/vsfm/#demo 现成的可视化操作

从一堆照片中重建三维信息,把二维变成三维。当然用来重建地图也不是错的。
Structure from Motion and 3D reconstruction on the easy in OpenCV 2.3+ &#91;w/ code ] 实现3D重构opencv

https://en.wikipedia.org/wiki/Structure_from_motion 从动态的2D序列中恢复3D的信息,就像人眼实时处理一样。 或者快速实现点与点之间的对应。除了那些相似度计算的SIFT/SURF等方法。

而距离,拓扑和方向是空间关系的三个组成部分。

视觉系统的三个层次

Marr理论,计算理论层次,表达与算法层次,硬件实现层次。

难点:

  1. 图像对景物的约束不充分,
  2. 多种因素在图像中相互混淆
  3. 理解自然景物要求大量知识