1 Star 7 Fork 1

zhongyf / Rbook

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
该仓库未声明开源许可证文件(LICENSE),使用请关注具体项目描述及其代码上游依赖。
克隆/下载
index.Rmd 3.83 KB
一键复制 编辑 原始数据 按行查看 历史
zhongyf 提交于 2021-06-04 18:24 . commit
title knit author date site documentclass bibliography biblio-style link-citations description
商业数据分析师-R 语言数据处理
bookdown::render_book
Yufei Zhong
`r Sys.Date()`
bookdown::bookdown_site
book
book.bib
packages.bib
apalike
true
商业数据分析师的 R 语言学习笔记,主要集中在数据清洗相关包的介绍,从数据导入(本地数据 数据库)到数据清洗,到固定报表输出的自动化流程。
# 欢迎 {#welcome .unnumbered} 本文主要是我作为商业数据分析师使用 R 语言做数据处理的学习笔记,主要是数据清洗相关包的介绍。 笔记内容包含:从数据导入到完成报表、报告、可视化等整个分析流程。 > 注意:R 包介绍时很多 demo 是照搬官方案例 如下报表: ```{r result= 'flextable-tbl-daily-report',echo=FALSE,warning=FALSE,message=FALSE} library(flextable) library(tidyverse) library(formattable) dt % mutate( across(c(当前销额,同比销额,当前销量,同比销量),formattable::comma,digits=0), across(c(`当前%`,`同比%`,`金额增长%`,`销量同比%`,`当前折扣`,`同比折扣`),formattable::percent,digits = 1) ) %>% dplyr::select(1:12) ft % merge_v(j = ~一级部门) %>% bg(bg = "#e05297", part = "header") %>% color(color = "white", part = "header") %>% add_footer_lines(paste0('数据更新时间:',Sys.Date())) %>% #valign(valign = "top") %>% theme_box() %>% align(j = 1:12, align = "center", part = 'body') %>% autofit() ft ``` ## 内容概要{#abstract .unnumbered} 主要内容是为了将数据报表,数据报告,数据可视化等需求利用 R 语言自动化实现,从而解放双手。 - 数据导入导出 读 Excel:readxl,openxlsx;写 Excel:openxlsx,writexl,读写 CSV,TSV,TXT 等:readr,vroom,data.table; - 数据操作 dplyr - 数据整洁 tidyr - 字符处理 stringr - 日期时间处理 lubridate - 因子处理 forcats - 数据处理利器 data.table - 数据库使用 主要是 odbc,DBI,ROracle,RMySQL等 - 循环结构 - 循环迭代之purrr包介绍 - 自定义函数功能 - 文件系统管理 在本书中,数据操作处理分为:tidyverse 系列,data.table 两大语法体系,任选其一学习即可,待对 R 语言认知更深,以及更加清楚自己的需求后再行调整数据处理框架体系。就我个人而言,我目前使用 data.table 体系做数据处理较多,当然不可避免的需要借助其他 R包。 ## 授权说明 {#sec:licenses .unnumbered} ::: {.rmdwarn data-latex="{警告}"} 本书采用[Creative Commons Attribution-ShareAlike 4.0 International License](https://creativecommons.org/licenses/by-nc-nd/4.0/) 许可,请君自重。 项目中代码使用 [MIT协议](https://github.com/zyf19940501/Rbook) 开源。 ::: 本文仅为个人学习笔记,仅代表个人观点,本文提供的信息仅供参考之用,不对信息正确性负责。 ## 运行信息{#session .unnumbered} 本书用 R 语言以及 R 包 bookdown 制作而成,运行环境如下: ```{r} xfun::session_info(packages = c( "knitr", "rmarkdown", "bookdown","collapse", "data.table", "DT", "reactable","flextable", "patchwork", "plotly", "shiny","formattable", "ggplot2", "dplyr", "tidyverse","DBI","ROracle","dbplyr" ), dependencies = FALSE) ``` ## 关于本人{#author .unnumbered} 一名热爱R语言的商业数据分析师。`R`极大拓展了我数据处理能力,让我很轻松方便处理数据,有更多精力时间聚焦在具体问题上。 因个人能力有限,本书难免出现错误,如发现错误,欢迎联系本人更正。 Email: <598253220@qq.com> 公众号: 宇飞的世界 语雀: https://www.yuque.com/zyufei B站视频: https://www.bilibili.com/video/BV1vK4y1R7Vz/
R
1
https://gitee.com/zhongyufei/Rbook.git
git@gitee.com:zhongyufei/Rbook.git
zhongyufei
Rbook
Rbook
master

搜索帮助