百度 AI Infra 校招二面 (2)

发表于 2026-04-16 更新于 2026-05-18 分类于求职面试，大厂面经

两者都是前馈神经网络，但在结构假设和参数效率上有本质区别：

DNN（全连接网络/MLP）：

CNN（卷积神经网络）：

核心区别：CNN 通过归纳偏置（局部性+共享性）在图像/语音等空间数据上极度参数高效；DNN 对输入无任何假设但参数多且不编码结构信息。

shared_ptr（引用计数共享所有权，原子操作保证计数线程安全，make_shared 高效一次分配）、unique_ptr（独占所有权零额外开销，不可拷贝只可 move，默认首选）、weak_ptr（弱引用不增计数，lock() 提升，打破循环引用/实现缓存观察）。

选择原则：默认 unique_ptr -> 需共享用 shared_ptr -> 需观察不拥有用 weak_ptr。

对比	递归	迭代
优点	代码简洁直观，天然适配分治/树形结构	无函数调用开销，不受栈深度限制
缺点	函数调用开销（压栈/出栈/寄存器保存）、栈空间有限（默认 8MB，深度 ~10 万层即溢出）	某些问题实现复杂（如树遍历需手动维护栈）
空间	O(递归深度)的栈空间	O(1)或显式数据结构
尾递归	编译器可优化为迭代（但 C++ 不保证）	天然无此问题

实践建议：递归深度可控（如平衡二叉树 ~30 层）时用递归保持代码清晰；可能深度递归时改用迭代 + 显式栈（如 DFS 的非递归实现）。

分支预测（Branch Prediction）：现代 CPU 流水线深度 15-20 级，遇到条件分支时不能等待条件计算完成再取后续指令。CPU 通过分支预测器（BPU）提前预测走向并投机执行。

预测策略：

预测失败代价：需要 flush 流水线中投机执行的指令，penalty 约 10-20 个周期（现代 CPU 约 15 cycles）。

优化手段：

（编程题）