title |
knit |
author |
date |
site |
documentclass |
bibliography |
biblio-style |
link-citations |
description |
商业数据分析师-R 语言数据处理 |
bookdown::render_book |
Yufei Zhong |
`r Sys.Date()` |
bookdown::bookdown_site |
book |
|
apalike |
true |
商业数据分析师的 R 语言学习笔记,主要集中在数据清洗相关包的介绍,从数据导入(本地数据 数据库)到数据清洗,到固定报表输出的自动化流程。 |
# 欢迎 {#welcome .unnumbered}
本文主要是我作为商业数据分析师使用 R 语言做数据处理的学习笔记,主要是数据清洗相关包的介绍。
笔记内容包含:从数据导入到完成报表、报告、可视化等整个分析流程。
> 注意:R 包介绍时很多 demo 是照搬官方案例
如下报表:
```{r result= 'flextable-tbl-daily-report',echo=FALSE,warning=FALSE,message=FALSE}
library(flextable)
library(tidyverse)
library(formattable)
dt % mutate(
across(c(当前销额,同比销额,当前销量,同比销量),formattable::comma,digits=0),
across(c(`当前%`,`同比%`,`金额增长%`,`销量同比%`,`当前折扣`,`同比折扣`),formattable::percent,digits = 1)
) %>% dplyr::select(1:12)
ft %
merge_v(j = ~一级部门) %>%
bg(bg = "#e05297", part = "header") %>%
color(color = "white", part = "header") %>%
add_footer_lines(paste0('数据更新时间:',Sys.Date())) %>%
#valign(valign = "top") %>%
theme_box() %>%
align(j = 1:12, align = "center", part = 'body') %>%
autofit()
ft
```
## 内容概要{#abstract .unnumbered}
主要内容是为了将数据报表,数据报告,数据可视化等需求利用 R 语言自动化实现,从而解放双手。
- 数据导入导出
读 Excel:readxl,openxlsx;写 Excel:openxlsx,writexl,读写 CSV,TSV,TXT 等:readr,vroom,data.table;
- 数据操作 dplyr
- 数据整洁 tidyr
- 字符处理 stringr
- 日期时间处理 lubridate
- 因子处理 forcats
- 数据处理利器 data.table
- 数据库使用
主要是 odbc,DBI,ROracle,RMySQL等
- 循环结构
- 循环迭代之purrr包介绍
- 自定义函数功能
- 文件系统管理
在本书中,数据操作处理分为:tidyverse 系列,data.table 两大语法体系,任选其一学习即可,待对 R 语言认知更深,以及更加清楚自己的需求后再行调整数据处理框架体系。就我个人而言,我目前使用 data.table 体系做数据处理较多,当然不可避免的需要借助其他 R包。
## 授权说明 {#sec:licenses .unnumbered}
::: {.rmdwarn data-latex="{警告}"}
本书采用[Creative Commons Attribution-ShareAlike 4.0 International License](https://creativecommons.org/licenses/by-nc-nd/4.0/) 许可,请君自重。
项目中代码使用 [MIT协议](https://github.com/zyf19940501/Rbook) 开源。
:::
本文仅为个人学习笔记,仅代表个人观点,本文提供的信息仅供参考之用,不对信息正确性负责。
## 运行信息{#session .unnumbered}
本书用 R 语言以及 R 包 bookdown 制作而成,运行环境如下:
```{r}
xfun::session_info(packages = c(
"knitr", "rmarkdown", "bookdown","collapse",
"data.table", "DT", "reactable","flextable",
"patchwork", "plotly", "shiny","formattable",
"ggplot2", "dplyr", "tidyverse","DBI","ROracle","dbplyr"
), dependencies = FALSE)
```
## 关于本人{#author .unnumbered}
一名热爱R语言的商业数据分析师。`R`极大拓展了我数据处理能力,让我很轻松方便处理数据,有更多精力时间聚焦在具体问题上。
因个人能力有限,本书难免出现错误,如发现错误,欢迎联系本人更正。
Email: <598253220@qq.com>
公众号: 宇飞的世界
语雀: https://www.yuque.com/zyufei
B站视频: https://www.bilibili.com/video/BV1vK4y1R7Vz/