Skip to content

概率论与数理统计

Starslayerx edited this page Jun 29, 2021 · 40 revisions

R

R基础

  • 包管理

    install.packages() # 安装包
    library() # 导入包
    detach(package:xx) # 卸载已加载的包
    
  • 赋值给变量

    a <- 3
    A <<- 6 # 强制赋值为全局变量
    b = 9   # 多作为函数参数使用
  • 显示当前工作空间所有对象名称

    ls()
    ls.str() # 更加详细的显示
  • 删除变量

    rm()
    rm(list = ls()) # 删除所有变量、
  • 输出单个元素

    print(x, ...)
  • 拼接为字符串

    paste(..., sep = ' ', collapse = NULL)
    paste0(..., collapse = NULL) # 缩减版
    • sep: 分隔符
    • collapse: 元素内部折叠坍塌,例如拼接向量1:10
  • 输出多个元素,使用","分割元素

    cat("A", pi*2, ...)
  • 构造向量

    c(1:10, "hello") # 同时拼接数字和字符串会成为字符串类型
  • 生成数列

    m:n  # R从m到n都有,Python没有n
    seq(from = 1, to = 5, by = 2) # 增量不为1的数列
    seq(from = 0, to = 20, length.out = 5) # 指定数列数量,自动计算增量
  • 生成重复值

    rep(pi, times = 5)
  • 索引

    fib[c(1, 4, 9)] # 选择下表1,4,9元素
    fib[1:3] # R下标从1开始
    fib[-(1:3)] # 负数表示忽略1到3
    • 此外,R也支持类似Numpy中的使用 bool 索引
  • 二元运算符

    符号 含义
    %% 取模
    $/$ 取余
    %*% 矩阵乘法
    %in% 右边是否包含左边
    %>% 左侧传递给右侧 管道
  • 常用统计函数

    函数 说明 公式
    mean(x) 平均数 $E(X)=\frac{\sum_{i=1}^n x_i}{n}$
    median(x) 中位数 -
    sd(x) 标准差 $\sqrt{D(X)}$
    var(x) 方差 $Var(X)=\frac{\sum_{i=1}^n(x_i-E(X))^2}{n}$
    cov(x, y) 协方差 $Cov(X,Y)=E(XY)-E(X)E(Y)$
    cor(x, y) 相关系数 $r(X,Y)=\frac{Cov(X,Y)}{\sqrt{Var(X)Var(Y)}}$
    • 忽略NA值
      x <- c(0, 1, 1, 2, 3, NA)
      sd(x, na.rm = TRUE)
  • 倒入数据集

    data(dsname, package = "pkgname")
  • 执行R文件

    source("Script.R")

Clone this wiki locally