Yinghao Sun

快速了解一个网络:Hourglass Network

以下内容偏向于记录个人学习过程及思考,请审慎阅读。 背景 本文提出的背景是检测人体姿态。 对于这个任务 既需要局部精细的空间features来精准地检测人体关节位置 又需要全局的features来预测人体整体的朝向、姿态等。 核心思想 本文的核心目标/动机是将卷积过程中不同scale的信息全部提取并融合起来,既有深层的语义信息,也有浅层的空间细节信息。 Pipel...

快速了解一个网络:CenterNet (Objects as Points)

以下内容偏向于记录个人学习过程及思考,请审慎阅读。 背景 一阶段目标检测网络通常是按照一定规则在图像/feature map上滑动选取一系列anchors进行检测 二阶段目标检测网络通常是基于proposals的方式进行检测 以上两种方案都需要增加后处理NMS来去除大量的重复框,但后处理过程很难求导和训练。 核心思想 将目标用其中心点表示,然后利用回归网络预测其其它属性,如尺寸...

快速了解一个网络:BevDepth

以下内容偏向于记录个人学习过程及思考,请审慎阅读。 背景 作者将LSS (Lift, Splat, Shoot)网络中估计的深度进行了可视化,发现结果意外的差。 作者认为LSS网络有3大缺陷: 深度预测部份并非有loss直接监督,而是通过检测loss反传梯度间接训练的,因此导致深度预测效果并不好。 大部分像素点没有预测出合理的深度值,作者认为这些地方并没有训练的比较好,推...

1519. 子树中标签相同的节点数(Rating 1808)

以下内容偏向于记录个人练习过程及思考,请审慎阅读。 题目 1519. 子树中标签相同的节点数 Rating 1808 思路 快养成习惯了,看到只有小写字母的题,先想一下有没有O(26X)复杂度的解法。这道题也是一个比较典型的例子。 对于某个节点,如果我们知道这个节点每个子树中对应的26个小写字母出现的次数,那么加上这个节点本身统计一下即可得到这个节点对应的树的26个小写字母出现...

快速了解一个网络:CaDDN, Categorical Depth Distribution Network

以下内容偏向于记录个人学习过程及思考,请审慎阅读。 背景 单目3d检测只需要一个camera,便宜易部署,但是3d检测效果远不如lidar、stereo相关方法,本质上是缺少了深度相关的信息。 为了解决这个问题,一些工作会单独训练一个单目深度估计网络。但是网络预测的深度在3d目标检测阶段被直接使用,未考虑到深度的不确定性,会导致3d目标检测的定位精度较差。另外,单独训练的单目深度估计...

2302. 统计得分小于 K 的子数组数目(Rating 1808)

以下内容偏向于记录个人练习过程及思考,请审慎阅读。 题目 2302. 统计得分小于 K 的子数组数目 Rating 1808 思路 看到题目数据范围是 1e5,猜测大概率是个 O(n) 或者 O(nlogn) 的做法。 考虑固定子数组的右端点时,如何寻找左端点? 注意到子数组单调性,左端点越靠左,那么得分越高;反之则越低。 因此可以考虑二分: 遍历数组,将第 i 个位置当...

1594. 矩阵的最大非负积(Rating 1807)

以下内容偏向于记录个人练习过程及思考,请审慎阅读。 题目 1594. 矩阵的最大非负积 Rating 1807 思路 对于二维网格从左上走到右下的问题,大概率是动态规划问题。 因为每个格子的状态只与其上面和左面的格子状态有关。 因为负数*负数也可以得到正数,所以我们需要记录路径上乘积最小的负数,以便在后面再遇到负数时有机会得到较大的正数。 因此考虑 对每个格子维护两个值,...

快速了解一个网络:Point Pillars

以下内容偏向于记录个人学习过程及思考,请审慎阅读。 背景 背景是 lidar 3d 目标检测。 一些工作是将 3d lidar 点云投影到bev视角,再利用 2d cnn 网络进行检测。但由于点云的稀疏特性,这种做法效果并不好。 另外一些工作推广使用 3d 卷积核进行 3d 目标检测,但显然计算效率和计算量是瓶颈。 核心思想 设计了一种 3d lidar 点云的 en...