三维重建方法¶
流程与发展思路¶
阶段 一 三维点的重构¶
这个是基础,相标的标定,内外参数问题,以及多视图中同一点判断以及特征点提取都是为解决这个问题。
阶段 二 聚类 /建模¶
对于简单的模型就可以这些点进行建模了,计算几何,三角化等等方法点线面建模了。 对于大的复杂的物体来说,那先分块了,也就是聚类问题,对于二维的图像就是图像分割,而于三维点以及更加通用就是聚类算法。
-阶段 三 判别器¶
对于分好块的空间类来进行判别是属于物体,简单几何判断解决了这些问题,例如判别这块的特征点是头部信息呢。而不是脚呢。 这个需要运用深度学习的神经网络来进行模糊判断了。 等判别好之后,再根据子块进一步的进行细化。
当然阶段 二与三不断的进行反复迭代分形一样,例如先认出来头,然后再认出五官。
[[基础矩阵]]¶
[[RANSAC]]¶
刚体变换和仿射变换:¶
刚体变换是放射变换的一种特殊情况。刚体变换就是保证长度和角度正交。比如在黄丽芬的变换中,就是一个刚体,如果旋转矩阵被一个任意奇异矩阵替换,就变成了仿射变换。因此刚体变换就是放射变换的一种特殊情况。其实仿射变换也是一种线性变换,目的就是保持源图像中的直线和圆保持不变,是一个旋转,收缩加平移的过程。在Opencv中有关于affine transform 的一些code。
齐次坐标主要是为了区分点和向量而设置的,并且方便进行反射变换。
投影变换,我觉得就是图像在现实的图像和实际的成像出来的比例吧。
理想的透视模型满足针孔摄像机模型。对三维空间的一个点(X,Y,Z),投影到二维投影平面的坐标为(x,y),上述投影过程可以表示为:
各种变换是坐标变换基础,坐标变换,也就是基变换。我们实际在做那就是找到各种变换转换关系,然后再进行反算求解,得到自己想要东东。 对于运动物体动态捕捉会比较难一点,因为并不一定是线性变换,反解可能就不容易。 变换过程不可逆时,也求解呢,一个方法那就是找到不动点,在不动点进行参数拟合,得到原来方程,然后插值预测,得到一个原值。 http://www.voidcn.com/blog/waeceo/article/p-5003833.html 转换,关键是明白世界坐标系,相机坐标系,像坐标系,底片坐标的关系。也就是内参与外参了。
- 用单张2D图像重构3D场景 我想未来的趋势结合红外和光学信息,光学镜头用来获取感光信息,雷达用来获得距离信息
- 3D重构总资讯 有空看下别人做的吧
- 仿射变换(Affine Transformation)
- 深入探索透视投影变换(转) 这个对于齐次变换和投影变换讲的比较清楚,看一下
- 如何根据相机的参数知道摄像机的内参数矩阵
- 立体视觉基础
- Computing a disparity map in OpenCV opencv计算视差
- how to find disparity of two stereo images in degree 两幅图像中找到视差
- 视差估计方法综述
- stereo网站
- 在OpenCV中用cvCalibrateCamera2进行相机标定(附程序)
- calibrate.py@5549 标定opencv
- 深圳先进技术研究院
- ` 使用OpenGL对单幅照片进行三维重建 <http://blog.csdn.net/xeric_w/article/details/5867254>`_
- Interactive 3D Graphics 交互三维图形 video
- 3D角色动画
- Alexei (Alyosha) Efros My research is in the area of computer vision and computer graphics, especially at the intersection of the two
- 计算机视觉、机器学习相关领域论文和源代码大集合–持续更新
- CV牛人
- Multi-View Stereo for Community Photo Collections 华盛顿大学三维重构
- Robot data set Data for development of accurate computer vision methods 计算机视觉数据集
- 脸部识别数据集
- 图像数据集 现在还没有仔细看
- 立体匹配算法介绍
图像处理领域如果能够和3D打印结合起来,我想会有很大作用的
– Main.GegeZhang - 02 Aug 2013
这个里面用了运动模型,但是我真的 不知道什么是3D重构?
– Main.GegeZhang - 21 Aug 2013
为什么有的图片无法打开。
– Main.GegeZhang - 02 Sep 2013
什么是图像下采样 downsamples ? 目前来看,下采样就是数据大小变小了
– Main.GegeZhang - 04 Sep 2013
标定就是了解摄像机参数,实现对未来图像预测
– Main.GegeZhang - 02 Dec 2013
直接全用2D照片来恢复3D物体 其中之一那就是image based modeling. C:快盘gameEnginemodelingpaper 现在已经很火了。看来现在要抓紧时间把计算机视觉给整理出来。
– Main.GegeZhang - 21 Apr 2014
SFM¶
- 图像获取
- 摄像机标定
- 特征点的提取
- 立体匹配
- 深度的确定
- 后处理
相机的标定,以及特片点提取计算量,同时还有立体匹配。 到底需要多少张照片。 照片的数据最后精度是什么关系。
大尺度的照片,特征点丰富,容易提取,但小尺度特征的定位精度高,表达描述简单。 匹配时可能会出现失误。
http://blog.csdn.net/linczone/article/details/46237197 Structure from Motion (SfM)算法测试—3D重建简介, 3D重建的精度很重要,扫描精度与照片的分辨率,拍摄距离,对焦的准确性,灯光系统很大关系。 运算的时间与照片数量的关系是n!/(n-m)! 的增长。 并且精度 1024*768 =83mm, 83/1024mm = 0.08mm.
http://ccwu.me/vsfm/#demo 现成的可视化操作
- 从一堆照片中重建三维信息,把二维变成三维。当然用来重建地图也不是错的。
- Structure from Motion and 3D reconstruction on the easy in OpenCV 2.3+ [w/ code ] 实现3D重构opencv
https://en.wikipedia.org/wiki/Structure_from_motion 从动态的2D序列中恢复3D的信息,就像人眼实时处理一样。 或者快速实现点与点之间的对应。除了那些相似度计算的SIFT/SURF等方法。
而距离,拓扑和方向是空间关系的三个组成部分。
视觉系统的三个层次¶
Marr理论,计算理论层次,表达与算法层次,硬件实现层次。
难点:¶
- 图像对景物的约束不充分,
- 多种因素在图像中相互混淆
- 理解自然景物要求大量知识