1345. 跳跃游戏 IV(Rating 1810)
以下内容偏向于记录个人练习过程及思考,非常规题解内容 题目 1345. 跳跃游戏 IV Rating 1810 思路 一眼bfs。可以连接的边是相同的数以及左右两边的数,建图后bfs即可找到最短路径。 但是潇洒写完一波后TLE了,代码如下 from collections import defaultdict from collections import deque cl...
以下内容偏向于记录个人练习过程及思考,非常规题解内容 题目 1345. 跳跃游戏 IV Rating 1810 思路 一眼bfs。可以连接的边是相同的数以及左右两边的数,建图后bfs即可找到最短路径。 但是潇洒写完一波后TLE了,代码如下 from collections import defaultdict from collections import deque cl...
以下内容偏向于记录个人学习过程及思考,非常规教学内容 背景 作者将LSS (Lift, Splat, Shoot)网络中估计的深度进行了可视化,发现结果意外的差。 作者认为LSS网络有3大缺陷: 深度预测部份并非有loss直接监督,而是通过检测loss反传梯度间接训练的,因此导致深度预测效果并不好。 大部分像素点没有预测出合理的深度值,作者认为这些地方并没有训练的比较好,...
以下内容偏向于记录个人练习过程及思考,非常规题解内容 题目 1519. 子树中标签相同的节点数 Rating 1808 思路 快养成习惯了,看到只有小写字母的题,先想一下有没有O(26X)复杂度的解法。这道题也是一个比较典型的例子。 对于某个节点,如果我们知道这个节点每个子树中对应的26个小写字母出现的次数,那么加上这个节点本身统计一下即可得到这个节点对应的树的26个小写字母出...
以下内容偏向于记录个人学习过程及思考,非常规教学内容 背景 单目3d检测只需要一个camera,便宜易部署,但是3d检测效果远不如lidar、stereo相关方法,本质上是缺少了深度相关的信息。 为了解决这个问题,一些工作会单独训练一个单目深度估计网络。但是网络预测的深度在3d目标检测阶段被直接使用,未考虑到深度的不确定性,会导致3d目标检测的定位精度较差。另外,单独训练的单目深度估...
以下内容偏向于记录个人练习过程及思考,非常规题解内容 题目 2302. 统计得分小于 K 的子数组数目 Rating 1808 思路 看到题目数据范围是 1e5,猜测大概率是个 O(n) 或者 O(nlogn) 的做法。 考虑固定子数组的右端点时,如何寻找左端点? 注意到子数组单调性,左端点越靠左,那么得分越高;反之则越低。 因此可以考虑二分: 遍历数组,将第 i 个位置...
以下内容偏向于记录个人练习过程及思考,非常规题解内容 题目 1594. 矩阵的最大非负积 Rating 1807 思路 对于二维网格从左上走到右下的问题,大概率是动态规划问题。 因为每个格子的状态只与其上面和左面的格子状态有关。 因为负数*负数也可以得到正数,所以我们需要记录路径上乘积最小的负数,以便在后面再遇到负数时有机会得到较大的正数。 因此考虑 对每个格子维护两个值...
以下内容偏向于记录个人学习过程及思考,非常规教学内容 背景 背景是 lidar 3d 目标检测。 一些工作是将 3d lidar 点云投影到bev视角,再利用 2d cnn 网络进行检测。但由于点云的稀疏特性,这种做法效果并不好。 另外一些工作推广使用 3d 卷积核进行 3d 目标检测,但显然计算效率和计算量是瓶颈。 核心思想 设计了一种 3d lidar 点云的 e...
以下内容偏向于记录个人练习过程及思考,非常规题解内容 题目 1073. 负二进制数相加 Rating 1807 思路 开始想仿照 bit0 + bit1 + carry_bit 的形式进行枚举,枚举过程中发现 1 + 1 + 0 = 110 那么按照这种思路计算 11 + 11 的话,会发现永远都算不完,1会一直往高位累加,于是就卡住了… 翻看了下题解,发现几个月前自己独立...
以下内容偏向于记录个人学习过程及思考,非常规教学内容 背景 将 yolo v1 做的更好、更快、更强 核心思想 Better Batch Normalization 引入 BN,对于网络收敛收益显著,涨掉明显,且去除了 drop out 正则操作 这一操作也带来了超过 2% 的涨点。 High Resolution Classifier 之前的 SoTa detectio...
以下内容偏向于记录个人学习过程及思考,非常规教学内容 背景 基于region proposals的二阶段目标检测网络太慢了 核心思想 提出一种一阶段的目标检测网络结构,将目标检测任务当作一种回归任务去做。 Pipeline 将输入图片分为 S x S 个 grid,每个 grid 预测 B 个框的位置和置信度 + C 个 class 的概率。 因此输出 encode 为 S ...