我要投稿 投诉建议

网易数据面试试题

时间:2022-08-09 14:51:55 面试试题 我要投稿
  • 相关推荐

网易数据面试试题

  一、问答题

网易数据面试试题

  a) 欠拟合和过拟合的原因分别有哪些?如何避免?

  欠拟合:模型过于简单;过拟合:模型过于复杂,且训练数据太少。

  b) 决策树的父节点和子节点的的大小?请解释原因。

  父节点的>子节点的

  c) 衡量分类算法的准确率,召回率,F1值。

  d) 举例序列模式挖掘算法有哪些?以及他们的应用场景。

  DTW(动态事件规整算法):语音识别领域,判断两端序列是否是同一个单词。

  Holt-Winters(三次指数平滑法):对时间序列进行预测。时间序列的趋势、季节性。

  Apriori

  Generalized Sequential Pattern(广义序贯模式)

  PrefixSpan

  二、计算题

  1) 给你一组向量a,b

  a) 计算二者欧氏距离

  (a-b)(a-b)T

  即:

  b) 计算二者曼哈顿距离

  2) 给你一组向量a,b,c,d

  a) 计算a,b的Jaccard相似系数

  b) 计算c,d的向量空间余弦相似度

  c) 计算c、d的皮尔森相关系数

  即线性相关系数。

  或者

  三、(题目记得不是很清楚)

  一个文档-词矩阵,给你一个变换公式tfij’=tfij*log(m/dfi);其中tfij代表单词i在文档f中的频率,m代表文档数,dfi含有单词i的文档频率。

  1) 只有一个单词只存在文档中,转换的结果?(具体问题忘记)

  2) 有多个单词存在在多个文档中,转换的结果?(具体问题忘记)

  3) 公式变换的目的?

  四、推导朴素贝叶斯分类P(c|d),文档d(由若干word组成),求该文档属于类别c的概率,并说明公式中哪些概率可以利用训练集计算得到。

  五、给你五张人脸图片。

  可以抽取哪些特征?按照列出的特征,写出第一个和最后一个用户的特征向量。

  六、考查ID3算法,根据天气分类outlook/temperature/humidity/windy。(给你一张离散型的图表数据,一般学过ID3的应该都知道)

  a) 哪一个属性作为第一个分类属性?

  b) 画出二层决策树。

  七、购物篮事物(关联规则)

  一个表格:事物ID/购买项。

  1) 提取出关联规则的最大数量是多少?(包括0支持度的规则)

  2) 提取的频繁项集的最大长度(最小支持>0)

  3) 找出能提取出4-项集的最大数量表达式

  4) 找出一个具有最大支持度的项集(长度为2或更大)

  5) 找出一对项a,b,使得{a}->{b}和{b}->{a}有相同置信度。

  八、一个发布优惠劵的网站,如何给用户做出合适的推荐?有哪些方法?设计一个合适的系统(线下数据处理,存放,线上如何查询?)

http://www.cnrencai.com/

【网易数据面试试题】相关文章:

网易笔试题09-26

Oracle数据库DBA经典面试题02-02

2017网易前端笔试题09-25

2017网易频道记者笔试题09-25

外企面试英语面试试题09-26

社工面试面试试题及答案08-04

java面试简答试题09-25

SEO经典面试试题09-26

硅谷面试题精选02-03

网管面试试题09-26