阿里巴巴往年的針對招聘資料分析實習生崗位的筆試題完整版
有幸參加阿里資料分析實習生的筆試題。在群裡發現好多人的題目多不一樣,應該是從題庫隨機發放的。
總共15題,客觀題和主觀題兩部分,答題時間60min
1、以下演算法對缺失值敏感的模型包括:
A、Logistic Regression
B、隨機森林
C、樸素貝葉斯
D、C4.5
2、找出數列2,5,13,34,89,…的下一項:
A、233
B、144
C、267
D、ABC均錯誤
3、某人賣掉了兩張面值為30元的電話卡,均是30元價格成交的,其中一張賺了20%,其中一張賠了20%。問他總體是盈利還是虧損,贏/虧多少?
A、不盈不虧
B、盈利2.5元
C、虧損2.5元
D、盈利2元
4、以下場景中,對應使用的挖掘演算法不合適的是:
A、用關聯規則演算法分析購買了羽毛球的買家,是否適合推薦羽毛球鞋
B、根據使用者最近幾年的消費金額資料,用主成分分析法你何處使用者未來一個月可能的消費金額公式
C、根據使用者最近一年的購物日誌資料,用K-means演算法聚類出淘寶賣家中的高富帥和白富美
D、根據使用者最近購買的商品資訊,用決策數演算法識別出淘寶買家可能是男是女
5、投擲均勻正六面體骰子的熵是:
A、1bit
B、2.6bit
C、3.2bit
D、3.6bit
6、某調查公司接受委託滿意度調查,滿意分數在0~20之間,隨機抽取36名消費者,平均滿意分12,標準差3,在大樣本的假設下,根據調查結果對總體平均的置信區間,結果是:
A、9~15分
B、11~13分
C、12~14分
D、6~18分
7、市場部選擇部分使用者來進行產品A的簡訊推廣,獲取了使用者在時間視窗內是否購買了A產品的資料。資料探勘同學透過這些已知的是否購買資料,用來判斷其他使用者的購買傾向,這在資料探勘中屬於什麼任務?
A、聚類
B、預測
C、探索性分析
D、關聯規則
8、如何將一個EXCEL檔案單元格C2中的手機號13501245678的第四位至第七位隱藏為*
A、=replace(C2,4,4,**)
B、=replace(C2,4,4,”**“)
C、=replace(C2,4,7,”**“)
D、=replace(C2,4,7,**)
9、邏輯迴歸中迴歸引數可以用以下哪些方法求解?
A、最小二乘法
B、牛頓迭代法
C、蒙特卡洛法
D、似然估計法
10、微軟的EXCEL軟體是強大的資料分析工具,以入門簡單、擴充套件功能強大、視覺化豐富著稱,其中EXCEL圖表是資料分析師最常用的用於展現分析結果的工具,EXCEL圖表選擇描述正確的有:
A、折線圖用來展現資料隨著時間推移而發生變化,並可以預測未來的發展趨勢
B、散點圖用來說明同一類別的數個事物中各項的組成比重,或者某一事物隨著時間推移其各個組成的比重變化
C、餅圖主要用來分析內部各個組成部分的佔總體的比重,反映對總體的影響
D、雷達圖主要是對同類別的二組事物在多種專案上的.對比
11、請說明隨機森林較一般決策樹穩定的幾點原因。
12、考察SQL語句:
有一張交易表A(trade_no為主鍵),一張交易異常表B(trade_no為主鍵),
1)、計算交易表A中的交易總數;
2)、透過關聯表的方式實現A表中去除B表異常交易(保留A中的欄位即可)
13、某業務部門在上週結束了為期一週的大促,作為業務對口分析師,需要你對活動進行一次評估,你會從哪幾方面進行分析。
14、世界上每十萬人中就有一人是艾滋病患者。某一種藥物可以幫助檢測艾滋病,如果一人真是艾滋病,可以百分百檢測出來,而如果一個人沒有艾滋病,它的檢測出錯的機率是1%。請問利用這種檢測藥物,監測正確的機率有多高?
15、閱卷官明天要去爬山,希望正在答卷的你幫他準備個包,裡面放一些必須的物品,請詳述一下你會如何處理。
【阿里巴巴往年的針對招聘資料分析實習生崗位的筆試題完整版】相關文章: