用户: Solution/ 试卷: 深度学习

12021—2022 学年春季学期期末

一、

不定项选择题 (每小题 3 分, 共 12 分)

1.

假定在神经网络的隐藏层中使用激活函数 . 在特定神经元给定输入, 会得到输出 , 可能是以下哪一个激活函数

A.

ReLU

B.

tanh

C.

Sigmoid

D.

以上都不是

2.

下列声明哪些是正确的?

声明 1: 可以通过将所有权重初始化为 0 来训练网络

声明 2: 可以通过将偏置初始化为 0 来训练网络

A.

1 和 2 都错

B.

1 和 2 都对

C.

1 错 2 对

D.

1 对 2 错

3.

假设你在解决一个数据分布有着非常不均衡的分类问题, 即主要类别占据了训练数据的 99%. 现在你的模型在测试集上表现为 99% 的准确率. 下面表述正确的是

A.

准确率并不适合衡量不均衡类别问题

B.

准确率适合衡量不均衡类别问题

C.

精确率 (查准率) 和召回率 (查全率) 适合衡量不均衡类别问题

D.

精确率 (查准率) 和召回率 (查全率) 不适合衡量不均衡类别问题

4.

下面哪些情况可能导致神经网络训练失败

A.

梯度消失

B.

梯度爆炸

C.

激活单元死亡

D.

边点

二、

简答题 (每小题 5 分, 50 分)

1.

请用韦恩图表示深度学习、表示学习、机器学习三者之间的关系, 并给出至少 2 个有代表性的深度学习框架名称.

2.

在深度学习中, 为矩阵, 为向量, 的计算结果是什么? 当机器学习中零和非零元素之间的差异非常重要时, 范数之中, 通常会使用哪个?

3.

矩阵 的奇异值分解为 , 说明当 , 时, 线性方程组 所有可行解中, 最小的解可表示为

4.

随机变量 在给定随机变量 时是条件独立的数学表达? 给出上述 三个变量的图形化表示 (结构化概率图模型) , 并给出其联合概率密度函数.

5.

, 给出求 极小值过程的牛顿法迭代公式, 当前取 处,

6.

请给出线性可分问题 支持向量机算法的数学描述 (目标函数、约束条件) , 其对应的广义拉格朗日函数、以及 KKT 条件.

7.

请说明经过连续两个 卷积运算和一个 卷积运算的优劣 (从感受野、参数个数) ?

8.

请给出简单循环神经网络 (只有一个隐藏层) 的数学描述 (隐藏层、输出层的数学公式) , 其中记号如下: 输入 , 状态-输入权重矩阵 , 偏置向量 , 隐藏层状态 , 是非线性激活函数, 线性输出权重矩阵 , 输出 . 并指出长短期记忆 (LSTM) 模型的特点 (用语言描述) ?

9.

随机猜测作为一个分类算法是否一定比 SVM 差? 借此阐述你对 “No Free Lunch Theorem” 的理解.

10.

你有哪些深度学习调参经验?

三、

问答题 (每题 9 分, 共 18 分)

1.

Logistic 回归是一种常用的处理二分类问题的离散因变量模型, , , . 给定 个训练样本 , 试用交叉熵作为损失函数, 并使用小批量 AdaGrad 算法对参数进行更新, 给出算法伪代码.

2.

给出利用拒绝-接受法生成标准正态分布的伪代码 (可以利用的是 上的均匀分布) , 并对其中关键参数选择进行说明.

四、

问答题 (每题 10 分, 共 20 分)

1.

以线性回归模型为例, 损失函数 取为均方误差, 说明参数 正则化的影响 (分析参数的变化) .

2.

给定一个样本 , 将其输入到前馈神经网络模型 (深度为 2) 中, 得到网络输出为 . 假设损失函数为 , 计算损失函数关于网络中每个参数的导数. 记号如下: 层数 (只考虑隐藏层和输出层) , 为第 层神经元的个数, 为第 层神经元的激活函数, 为第 层到第 层的权重矩阵, 为第 层到第 层的偏置, 为第 层神经元的净输入, 为第 层神经元的输出.

22023—2024 学年春季学期期末