1. 在語言分析上將文章斷成有意義的要素稱為什麼?
建立詞庫
記號化
文字雲
量化分析
2. 簡單線性迴歸的函數為何?
runshiny
lm
nls
rarima
3. shiny套件中提供使用者與資料互動的檔案為何?
user.R
server.R
input.R
ui.R
4. 繪製長條圖的函數為何?
hist
barplot
qqnorm
pie
5. shiny套件中執行內建"01_hello"範例的函數為何?
runshiny
runApp
runExample
runShiny
6. ggplot2套件中facet_wrap函數的功能為何?
提供資料映射
提供繪圖型式 | | 提供分面群組條件
提供顏色設定
7. 文字探勘的敘述何者為錯誤?
文字探勘與資料探勘關係緊切,相較於後者顯著的結構化,前者文字長短不一、沒有規律
屬於資料探勘的一環
通常以結構化方式儲存
整合不同資訊領域的技術
8. 執行集群分析, 顯示資料位於哪一個集群的屬性為何?
centers
totss
withinss
cluster
9. 簡單線性迴歸的函數為何?
runshiny
lm
nls
rarima
10. 撰寫多項式迴歸(Polynomial regression)模型時, 須在多項式項目中加入哪個函數?
P
I
N
L
11. ROC curve的敘述何者為錯誤?
X軸為FPR
Y軸為TPR
愈靠近右下角愈好
可使用ROCR 套件繪製
12. 繪製散佈圖矩陣 (scatter plot matrix) 的函數為何?
pie
scatterplot
pairs
hist
13. 集群(Clustering)分析的函數為何?
kmeans
clusters
clustering
pca
14. 執行集群分析, 顯示群內資料間距離平方和的屬性為何?
tot.withinss
betweenss
totss
centers
15. 決策樹中代表分類後所獲得的分類標記為何?
根部節點(root node)
中間節點(non-leaf node)
分支(branches) ||葉節點(leaf node)
16. 混淆矩陣的敘述何者為正確?
TRP=True Positives / (True Positives + True Positives)
FPR=False Positives / (True Positives + FALSE Positives)
FPR=False Positives / (True Positives + FALSE Negatives)
TRP=True Positives / (True Positives + FALSE Negatives)
17. party 套件中建立決策樹的函數為何?
predict
tree
ctree
sample
18. 資料進行正規化的函數為何?
norm
standard
regual
scale
19. 迴歸分析模型「銷貨收入 = 10 + 1.5*廣告費用支出」的敘述何者為錯誤?
銷貨收入是依變數
廣告費用支出是自變數 ||該模型為簡單線性迴歸e
常用nls函數計算結果
20. 計算主成分分析的函數為何?
kmeans
prcomp
predict
aggregate