新浪数据分析笔试题目
################在网上找的新浪的数据分析的笔试题########################
2012新浪校园招聘数据分析师职位笔试题目。A卷(统计方向)60分钟
填空题。
1、KMO值在( )范围内,因子分析才是有效的。
解答:kmo检验统计量是用于比较变量间简单相关系数和偏相关系数的指标,主要用于多元统计的因子分析。当所有变量的简单相关系数的平方和远远大于偏相关系数的平方和时,kmo值越接近于1,原有变量越适合做因子分析。0.7-0.8适合,0.8-0.9很适合,0.9-1非常适合。0.6-0.7不太适合,0.5-0.6勉强适合,小于0.5不适合。BartlettP值小于或者等于0.01适合。
2、数据分析的方法包含( )、( )、( )等。
解答:描述性统计,回归分析。方差分析,假设检验。
选择题。较为简单
简答题。
1、某网站7月份共访问用户数4100人,已知访问网站有两种登陆方式A 和B 。使用A登陆的7月份总用户数为2835,使用B方式登陆的7月份总用户数为1400,既使用过A又使用过B登陆的7月份总用户数为985.
问:可以看出,总访问数—使用A登陆方式的总用户数=1265,那么A与B的重复用户数=B登陆用户数—1265=135,而实际得到的既使用A登陆方式又使用B登录方式的7月份总用户数为985,显然这是矛盾的,问题出在哪里?给出计算方法。
2、新浪公司楼下有一便利店,35平米,收银员2位,每天提供早餐、中餐、晚餐。如果你来做估算,计算每天的营业额是多少?
3、抽样估计的优良标准。
解答:无偏性,一致性,有效性。
4、写出相关和回归分析的内容。
解答:相关分析是对两个变量之间线性关系的描述和度量。
回归分析侧重于考察变量之间的数量伴随关系。
5、一道关于产品成本降低率和销售利润的直线回归分析的题目,记不清了。
2012新浪校园招聘数据分析师职位笔试题目。A卷(数据挖掘方向)
1、输入两个整数n 和m ,从数列1、2、3….n中随意取几个数,使其等于m,将其所有可能的组合列出来,如果考虑递归算法,请将算法的思路或者伪码写出来即可,求解思路:
2、有100个人做5道题目,第一道题目做的人有55人,第二道做对的人有89人,第三道作对的人有97人,第四道作对的人有79人,第五道作对的人有46人,已知至少作对三道才是过关,问至少多少人过关?(提供的数字我已经记不清了就随便写的几个)
3、证明根号2是无理数。
4、聚类分析方法对变量之间多重共线性的影响。
5、新浪公司楼下有一便利店,35平米,收银员2位,每天提供早餐、中餐、晚餐。如果你来做估算,计算每天的营业额是多少?
#######################2017年9月16日10点到11点做的在线笔试########################
第一次做数据分析的笔试题,跟开发岗的题目竟然差别这么大,晕晕的,已无力吐槽。
没有开摄像头的上机笔试,题目没有看完,对,没有看完。。。。
先是两个选择题,很简单。
后面的题。。前方高能。
就写一下有印象的吧,,
1.平均数,中位数,众树,方差,标准差的含义,并举例子解释。
2.你心目中的数据分析师是什么样的?
3.两个水桶,一个小点的桶可以装4升水,大的桶装11升水,问怎么操作可以两个桶盛5升水?
4.数据分布有哪些?选择熟悉的数据分布并写出其适用的场景。
5.写出三种熟悉的排序算法,选择一个写出其伪代码。
6.Hadoop生态系统组件有哪些?写出你熟悉的三个。
7.什么是幸存者偏差?
8.写出10种linux命令,写出其参数。
9.用一种编程语言,实现1+2+3+4+5+…..+100
10.实现求1,2,3,…100之间的质数。
11.给几个表,mysql语言编写。(时间来不及,就没有写,挺复杂的)
12.给了三个图表,全是英文的,对其做分析。
。。。。。
还有好多个题目,实在是没有时间做了。
数据分析的笔试题差的太多了,又开始不知所措了。。。。。