200字范文 > 计算机视觉领域会有哪些新的研究方向值得提前探索？

计算机视觉领域会有哪些新的研究方向值得提前探索？

时间：2022-07-10 04:08:37

点击上方“视学算法”，选择“星标”

干货第一时间送达

整理：3D视觉工坊 | 来源：知乎
/question/330153893/answer/1293995463
本文仅作为学术分享，如果有侵权，会删文处理

，计算机视觉领域会有哪些新的研究方向值得提前探索？

作者：罗浩.ZJU

/question/330153893/answer/721238966

作者：育心/question/330153893/answer/740254474

结合计算机视觉、机器人领域5大顶会（CVPR/ICCV/IROS/ICRA/ECCV），以及产业界的需求，总结3个当下热门及前沿的研究领域。

三维视觉是传统的研究领域，但最近5年内得到快速发展。三维视觉主要研究内容有：三维感知（点云获取及处理）、位姿估计（视觉SLAM）、三维重建（大规模场景的三维重建、动态三维重建）、三维理解（三维物体的识别、检测及分割等）。

图 1 3D 视觉的应用场景

3D视觉在CV顶会上的论文比例，也在逐年增加。

图 2 3D视觉在3大视觉顶会的论文比例

随着新型网络媒体的出现，以及5G时代的到来，视频呈现爆炸式增长，已成为移动互联网最主要的内容形式。面对于海量的视频信息，仅靠人工处理是无法完成的，因此实现视频的智能化理解则成为了亟待解决的问题。

自，深度学习在图像理解的问题上取得了较大的突破，但视觉理解比图像的目标检测识别要复杂的多。这是因为视频常有许多动作，动作往往是一个复杂概念的集合，可以是简单的行为，但也可能是带有复杂的情绪、意图。举个简单的例子，对一段视频分类，与对一幅图像分类，哪个更容易一些？

从最近几年知名的计算机视觉竞赛，也可以看出，图像层面的竞赛在减少，视频层面的竞赛在增加。

多模态融合的知识获取是指从文本、图片、视频、音频等不同模态数据中交叉融合获取知识的过程。

随着计算机视觉越来越成熟之后，有一些计算机视觉解决不了的问题慢慢就会更多地依赖于多个传感器之间的相互保护和融合。

怕什么真理无穷，进一寸有一寸的欢喜！

作者：oneTaken

/question/330153893/answer/730187742

个人感觉视觉和语言的联合还是很有前途的，虽然说目前坑比较多，但是万一那一天有了突破就是飞速的发展。

他还举了个例子，一团烟雾的行为可以用公式描述，但是一颗树的生长行为是由温度、光照、水、气候等等许多复杂的因素在很长时间内连续变化所影响的，那么它就是没办法简单地解释的。

举的这个例子并不恰当，反而恰恰说明了神经网络模型解释性的迫切性。一棵树生长的影响因素虽然说是有很多，但是至少我们明确知道控制变量条件下，恰当的温度、恰当的水分等条件可以明确引导树向生长较好的方向生长。

然后对于一个神经网络模型而言，无论是哪个任务，我们都很难说控制只控制某一种因素就可以往预期的方向发展。

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。