R语言读取Google Sheets的正确姿势：googlesheets4实战指南

发布时间：2026/6/22 19:21:56

1. 项目概述为什么读取 Google Sheets 在 R 里不该是场噩梦R 语言做数据分析绕不开数据源。而现实中大量业务数据、协作表格、调研问卷结果、运营日报都活在 Google Sheets 里——不是本地 CSV不是数据库就是那个开着浏览器就能编辑、多人实时协同、带版本历史的在线表格。可偏偏过去几年里我见过太多人卡在第一步怎么把 Sheet 里的数据干净、稳定、可复现地读进 R有人用readr::read_csv()硬扒公开链接导出的 CSV结果发现权限一关、链接一换脚本当场报错有人试过老版gsheet包OAuth 流程走一半弹出“403 Forbidden”控制台只显示一串看不懂的 JSON 错误还有人干脆每天手动下载 CSV 再拖进 RStudio美其名曰“确保数据新鲜”实则耗时耗力还极易出错。核心痛点就三个认证不透明、权限难理解、代码不可复用。而标题里说的“the Easy Way”指的就是googlesheets4这个包——它不是简单封装 API而是彻底重构了 R 与 Google 生态的交互逻辑用现代 OAuth 2.0 流程替代旧式密钥用资源 IDsheet_id替代 URL 解析用函数式设计屏蔽底层 HTTP 细节。它解决的不是“能不能读”而是“读得稳不稳、改得敢不敢、交出去别人会不会用”。适合三类人刚学 R 的学生不用碰 token 文件、数据分析师要嵌入自动化报表、团队协作者共享脚本时不再需要互相交换凭据。接下来我会带你从零开始不跳步、不假设、不甩文档链接把整个流程拆成你能亲手敲出来、能看懂每行为什么这么写的实操路径。2. 核心设计思路为什么googlesheets4是当前最优解2.1 旧方案的坑一个都不能踩先说清楚我们为什么要放弃其他路径。最常被提起的替代方案有三个gsheet已归档、googlesheetsv1.0依赖 Google Drive API v2、以及直接调用 REST API 手写httr请求。它们的问题不是功能缺失而是设计哲学与 R 用户实际工作流严重错位。gsheet包的问题在于它把“获取访问令牌”这件事外包给了用户。你需要自己去 Google Cloud Console 创建项目、启用 Sheets API、配置 OAuth 凭据、下载 JSON 密钥文件再手动传给gsheet_auth()。更麻烦的是这个 token 默认存放在~/.gsheet_token一旦你换电脑、重装系统、甚至只是清理了临时文件夹整个流程就得重来一遍。我去年帮市场部同事部署一个周报脚本光是教她找~目录和理解.token后缀就花了 40 分钟——这不是技术问题是体验断层。googlesheets注意没有 “4”的问题更隐蔽它用的是 Google Drive API v2 来间接访问 Sheets这意味着你读取一张表实际触发的是“列出我的所有文件检查文件类型获取文件元数据下载内容”四步操作。当你的 Google Drive 里有上千个文件时第一步“列出所有文件”就会超时当你想读取一个被设为“仅限指定人员访问”的 Sheet 时Drive API 返回的是“文件不存在”而不是“你没权限”排查起来像在迷宫里找出口。至于手写httr理论上最灵活但代价是维护成本指数级上升。Google 的 OAuth 流程包含 Authorization Code Exchange、Token Refresh、Scope 管理、Error Handling比如著名的403: Insufficient Permission每一环都要自己写 try-catch、自己存 token、自己判断是否过期。我试过写一个最小可用版本光是处理refresh_token过期重授权这一项代码量就超过了googlesheets4::read_sheet()本身。这违背了 R 的核心价值用最少的代码做最多的事。2.2googlesheets4的破局点把复杂留给自己把简单交给用户googlesheets4的作者 Jenny BryanR 社区公认的 API 封装大师做了一件关键的事把认证过程变成一次性的、可视化的、可中断的交互式流程。它不让你去 Console 折腾 JSON 文件而是直接在 R 控制台启动一个本地 HTTP 服务器默认端口 1410然后自动打开你的默认浏览器跳转到 Google 的标准登录页。你用个人 Google 账号登录、勾选所需权限比如https://www.googleapis.com/auth/spreadsheets.readonlyGoogle 返回一个授权码googlesheets4自动捕获并完成后续的 token exchange最后把加密后的凭据安全存入 R 的凭据管理器credentials包或系统钥匙串macOS Keychain / Windows Credential Manager。整个过程你只需要点两下鼠标剩下的全是后台静默完成。更重要的是它的函数设计完全遵循 R 用户的直觉。read_sheet()不需要你传入复杂的access_token参数也不需要你解析 URL 中的edit#gid0片段。你只需要提供一个sheet_id—— 就是 Google Sheets URL 里/d/后面那一长串字母数字组合例如https://docs.google.com/spreadsheets/d/1BxiMVs0XRA5nFMdKvBdBZjgmUUqptlbs74OgvE2upms/edit#gid0中的1BxiMVs0XRA5nFMdKvBdBZjgmUUqptlbs74OgvE2upms。这个 ID 是 Google 分配给每个 Sheet 的唯一标识符比 URL 稳定一万倍你改名字、改分享链接、甚至把 Sheet 移到另一个文件夹ID 都不会变。这就从根本上解决了“链接失效”这个高频故障。再看权限模型。googlesheets4明确区分了三种访问场景并为每种提供了专用函数read_sheet()只读对应spreadsheets.readonlyscopewrite_sheet()读写对应spreadsheetsscopesheet_append()追加数据对应spreadsheetsscope 但行为更安全。这种显式声明让权限管理变得可审计、可预测。你再也不用担心脚本偷偷修改了原始数据因为read_sheet()根本不具备写权限——这是由 Google API 层强制保障的不是靠 R 代码里的 if 判断。2.3 安全与合规的底层保障不是“够用就行”而是“必须可靠”很多人会问把认证交给一个第三方 R 包安全吗答案是肯定的而且比你自己手写更安全。原因有三第一googlesheets4使用的是 Google 官方推荐的OAuth 2.0 Authorization Code Flow with PKCEProof Key for Code Exchange。这是目前移动和桌面应用最安全的 OAuth 流程它通过在授权请求中加入一个动态生成的 code verifier彻底杜绝了 authorization code interception 攻击。而你自己手写大概率只会用最简单的 Implicit Flow 或者 Client Credentials Flow安全性差几个数量级。第二token 存储机制经过严格设计。默认情况下googlesheets4会尝试使用系统的原生凭据存储macOS Keychain、Windows Credential Manager、Linux Secret Service这些是操作系统级的安全模块比存在明文文件里强得多。如果系统不支持它会退回到 R 的credentials包该包使用 AES-256 加密算法对 token 进行加密并将密钥安全地绑定到当前用户的登录会话。你无法用文本编辑器打开.Rprofile或其他地方看到明文 token。第三scope 粒度控制精准。它绝不申请宽泛的https://www.googleapis.com/auth/drive即“访问你全部云盘”而是精确到spreadsheets.readonly。这意味着即使你的 token 泄露攻击者也只能读取你明确授权过的那些 Sheets无法删除你的文件、无法读取你的邮件、无法访问你的照片。这种“最小权限原则”Principle of Least Privilege是现代云安全的基石而googlesheets4把它变成了开箱即用的默认行为。3. 实操全流程从安装到读取一步一图解3.1 环境准备三行命令搞定基础依赖开始前请确认你已安装 R建议 4.2和 RStudio非必需但强烈推荐。整个过程不需要任何系统级配置纯 R 包管理。首先安装核心包。注意googlesheets4依赖credentials和gargle后者是 Google R 生态的统一认证层它负责处理所有 Google 服务Sheets、Drive、Gmail的 OAuth 流程。所以我们要一次性装齐install.packages(c(googlesheets4, credentials, gargle))如果你在国内网络环境可能会遇到 CRAN 镜像源不稳定的问题。此时请切换到清华或中科大镜像# 临时切换镜像本次 R session 有效 options(repos c(CRAN https://mirrors.tuna.tsinghua.edu.cn/CRAN/)) # 或者永久设置写入 .Rprofile usethis::edit_r_profile() # 在打开的文件中添加 # options(repos c(CRAN https://mirrors.tuna.tsinghua.edu.cn/CRAN/))安装完成后加载包并进行一次全局认证初始化。这一步非常重要它会配置gargle的默认行为比如选择哪个凭据存储后端、是否自动刷新 tokenlibrary(googlesheets4) library(credentials) # 初始化 gargle设置为交互式认证默认就是 gargle::gargle_auth_configure( email NULL, # 留空运行时会让你选账号 path NULL, # 不指定本地 JSON 文件路径 cache_path NULL # 使用默认缓存位置 )提示gargle_auth_configure()本身不触发认证它只是设置参数。真正的认证发生在你第一次调用read_sheet()或gs4_auth()时。这里提前运行是为了避免后续步骤中因配置缺失导致的意外错误。3.2 第一次认证浏览器弹窗三步完成现在让我们真正迈出第一步。执行以下命令gs4_auth()你会立刻看到 R 控制台输出类似这样的信息Waiting for authentication in browser... Press Esc/Ctrl C to abort同时你的默认浏览器会自动打开一个新的标签页地址是http://127.0.0.1:1410/页面上显示 Google 的标准登录界面。这时请用你拥有目标 Sheet 访问权限的 Google 账号登录通常是你的工作邮箱或个人 Gmail。登录成功后Google 会显示一个授权页面标题是 “R wants to access your Google Account”下方列出具体权限例如View and manage your spreadsheets in Google SheetsView your email address请务必仔细阅读确认无误后点击 “Allow”。几秒钟后浏览器页面会跳转到一个显示 “Authentication complete!” 的绿色页面R 控制台也会同步输出Authentication successful!至此认证完成。gargle已将你的access_token和refresh_token安全地存入系统凭据库。你不需要记住任何密码、不需要保存任何文件、不需要理解 JWT 结构——所有复杂性都被封装在了这个gs4_auth()调用里。注意如果你看到的是Error: OAuth error: request failed with status code 403这几乎 100% 是因为你在 Google Cloud Console 中没有为该项目启用 Google Sheets API。但好消息是googlesheets4完全绕过了 Cloud Console它使用的是 Google 的 “Public API Access” 机制即预注册的、面向所有开发者的通用客户端 ID。你不需要自己创建项目、不需要启用 API、不需要下载密钥——这就是它被称为 “Easy Way” 的根本原因。如果真遇到 403请检查是否用了公司 G Suite 账号且管理员禁用了第三方应用访问这种情况需联系 IT 部门。3.3 获取并验证 Sheet IDURL 里最值钱的那一串字符认证完成后下一步是找到你要读取的 Sheet 的唯一 ID。这是整个流程中最容易出错的环节因为很多人会试图复制整个 URL 或者edit#gid0这部分。请打开你的目标 Google Sheet观察浏览器地址栏。完整的 URL 类似这样https://docs.google.com/spreadsheets/d/1BxiMVs0XRA5nFMdKvBdBZjgmUUqptlbs74OgvE2upms/edit#gid0你需要提取的部分是/d/和/edit之间的那一长串字符即1BxiMVs0XRA5nFMdKvBdBZjgmUUqptlbs74OgvE2upms这个字符串就是sheet_id。它通常有 44 个字符全部由大小写字母和数字组成不含任何-、_或/。为了验证你拿到的 ID 是否正确可以先用gs4_find()函数搜索它。这个函数会列出所有你有访问权限的 Sheets 中名称或 ID 匹配的条目# 用你提取的 ID 搜索 gs4_find(1BxiMVs0XRA5nFMdKvBdBZjgmUUqptlbs74OgvE2upms)如果返回一个包含该 ID 的数据框说明一切正常。如果返回空有两种可能一是 ID 复制错了多了一个空格或少了一个字符二是你当前认证的账号没有该 Sheet 的访问权限比如 Sheet 只分享给了company.com邮箱而你用的是gmail.com登录的。实操心得我习惯把常用的sheet_id存在一个 R 对象里方便后续调用也避免重复复制粘贴出错# 定义一个变量名字直观好记 sales_data_id - 1BxiMVs0XRA5nFMdKvBdBZjgmUUqptlbs74OgvE2upms # 后续所有 read_sheet() 都用这个变量3.4 核心读取read_sheet()的七种调用姿势现在终于到了最激动人心的时刻把数据读进 R。read_sheet()是googlesheets4的核心函数但它绝不是“一键傻瓜式”。它提供了丰富的参数让你能精准控制读取行为。下面我按使用频率从最常用到最专业逐一拆解。3.4.1 最简模式一行代码完整读取这是 90% 场景下的首选。你只需要提供sheet_id函数会自动读取第一个工作表Sheet1的所有非空单元格# 假设 sales_data_id 已定义 sales_df - read_sheet(sales_data_id)它会返回一个标准的tibbleR 中的现代数据框列名来自第一行数据类型自动推断字符、数值、日期等。整个过程通常在 1-2 秒内完成比读取本地 CSV 还快。3.4.2 指定工作表用sheet参数切换 tab一个 Google Sheet 文件可以包含多个工作表tab比如 “Q1 Sales”、“Q2 Sales”、“Summary”。默认读取第一个但你可以用sheet参数指定名称或索引# 按名称读取推荐名称不易变 q1_sales - read_sheet(sales_data_id, sheet Q1 Sales) # 按索引读取从 1 开始计数第一个是 1 summary_tab - read_sheet(sales_data_id, sheet 3)注意sheet参数的值必须与 Google Sheets 界面上显示的 tab 名称完全一致包括空格和大小写。如果名称里有特殊字符如,#请确保它们被正确复制。一个快速验证方法是在 Google Sheets 里双击 tab 名称进入编辑模式然后全选复制。3.4.3 指定数据范围用range参数锁定区域有时你不需要整张表只需要其中一块区域比如 A1:D100或者一个命名范围Named Range。range参数支持两种格式# 标准 A1 Notation最常用 top_100 - read_sheet(sales_data_id, range A1:D100) # 命名范围需在 Google Sheets 里预先定义Data Named ranges monthly_summary - read_sheet(sales_data_id, range Monthly_Summary)A1 Notation 的规则很简单起始单元格:结束单元格例如B2:E20。它会读取这个矩形区域内所有单元格包括空白单元格返回NA。3.4.4 处理表头用col_names和skip灵活应对现实中的 Sheet 表头往往不规范可能有合并单元格、可能有标题行、可能第一行是公司 Logo。read_sheet()提供了两个关键参数来应对# col_names FALSE不把第一行当列名自动生成 X1, X2, X3... no_header - read_sheet(sales_data_id, col_names FALSE) # skip n跳过前 n 行再把接下来的一行当表头 # 例如前 2 行是标题和副标题第 3 行才是真正的列名 real_header - read_sheet(sales_data_id, skip 2) # col_names c(Name, Sales, Region)手动指定列名 manual_cols - read_sheet(sales_data_id, col_names c(Name, Sales, Region))3.4.5 数据类型控制用col_types防止自动转换错误R 的自动类型推断有时会出错比如把电话号码0123456789当作数值导致前面的0被丢弃或者把日期2023-01-01当作字符。col_types参数允许你强制指定每列的类型# c character, d double (numeric), D date, t time, ? guess # 按列顺序指定长度必须等于实际列数 sales_strict - read_sheet( sales_data_id, col_types cddD # 第一列字符第二三列数值第四列日期 )如果你不确定有多少列可以先用read_sheet(sales_data_id, n_max 10)读取前 10 行查看结构再确定col_types长度。3.4.6 大表优化用n_max和progress控制性能对于超大 Sheet10 万行以上一次性读取可能内存吃紧或耗时过长。n_max参数可以限制读取行数用于快速预览或调试# 只读前 1000 行用于检查数据结构 preview - read_sheet(sales_data_id, n_max 1000) # 启用进度条知道读取卡在哪 big_data - read_sheet(sales_data_id, progress TRUE)3.4.7 错误处理用quiet和error参数掌控异常生产环境中你不能让一个 Sheet 临时不可用就导致整个脚本崩溃。read_sheet()提供了优雅的错误处理机制# quiet TRUE不打印任何提示信息只返回结果或错误 result - read_sheet(sales_data_id, quiet TRUE) # error warn遇到错误时不报错而是发一个警告返回 NULL safe_read - read_sheet(sales_data_id, error warn) # error null同上但不发警告 silent_read - read_sheet(sales_data_id, error null)在自动化脚本中我通常会结合tryCatch()使用sales_data - tryCatch({ read_sheet(sales_data_id, error null) }, error function(e) { message(读取失败使用本地备份, e$message) readr::read_csv(data/sales_backup.csv) })4. 深度解析与避坑指南那些文档里没写的实战经验4.1 权限问题的终极排查手册权限错误是googlesheets4用户最常遇到的障碍错误信息却常常模糊不清。下面这张表是我根据三年来处理上百个客户案例总结的“权限问题速查表”覆盖了 95% 的真实场景现象具体错误信息控制台最可能原因一招解决完全无法认证Error: OAuth error: request failed with status code 403你用的是公司 G Suite 账号且管理员在 Google Admin Console 中禁用了“对第三方应用的访问”联系 IT 部门要求开启 “Allow users to access third-party apps” 或为你单独授权googlesheets4能认证但读不了表Error: Client error: (404) Not Foundsheet_id复制错误或该 Sheet 已被删除/移动到你无权访问的共享云端硬盘重新打开 Sheet从 URL 中精确复制/d/和/edit之间的字符串或用gs4_find(关键词)搜索确认能读表但数据为空返回一个只有列名、0 行的数据框Sheet 的第一行是空的或者range参数指定的区域完全空白检查 Sheet 是否真的有数据用range A1:Z1000扩大范围测试或用skip 0强制从第一行开始读读取部分数据报类型错误Warning: 1 parsing failure. 一堆col字段某一列中混杂了多种数据类型如既有数字又有文字R 无法统一推断使用col_types参数手动指定或先用read_sheet(..., col_types ?)查看各列实际类型分布脚本在服务器上跑失败Error: Cant get Google credentials. Please run gs4_auth()服务器没有图形界面无法弹出浏览器进行 OAuth使用gs4_auth(email youremail.com, cache_path /path/to/token)预先在本地认证将生成的 token 文件拷贝到服务器指定路径实操心得我在为客户部署生产脚本时一定会加上一个“权限健康检查”函数。它会在脚本开头自动运行验证sheet_id是否有效、当前账号是否有读权限、能否成功读取前 5 行。如果任一检查失败立即发送邮件告警并退出而不是等到下游分析时报错。代码如下可直接复用check_sheet_access - function(sheet_id, n 5) { tryCatch({ test_data - read_sheet(sheet_id, n_max n, quiet TRUE) if (nrow(test_data) n nrow(test_data) 0) { message(✅ 权限检查通过可读取 , nrow(test_data), 行数据) return(TRUE) } else if (nrow(test_data) 0) { stop(❌ 权限检查失败读取到 0 行数据请检查 Sheet 是否为空或 range 设置) } else { message(✅ 权限检查通过成功读取 , n, 行数据) return(TRUE) } }, error function(e) { stop(❌ 权限检查失败, e$message) }) } # 使用 check_sheet_access(sales_data_id)4.2 性能瓶颈与优化策略如何让读取快如闪电虽然read_sheet()本身已经很高效但在某些场景下你仍可能感到“慢”。这不是包的问题而是 Google Sheets API 的固有限制。理解这些限制才能对症下药。限制一API 配额Quota。每个 Google 账号每 100 秒有 500 次请求的配额。听起来很多但如果你的脚本在一个循环里反复调用read_sheet()比如遍历 100 个 Sheet很容易在几秒内耗尽。解决方案只有一个批量读取减少请求次数。不要这样写# ❌ 危险100 次独立请求 for (id in sheet_ids) { data - read_sheet(id) # ... 处理 data }而应该这样# ✅ 安全1 次请求如果数据在同一个 Sheet 的不同 tab # 先用 gs4_get() 获取整个 Sheet 的元数据再用 read_sheet() 指定 tab all_tabs - gs4_get(sales_data_id) # 然后循环读取各个 tab但都在同一个 API session 下 q1 - read_sheet(sales_data_id, sheet Q1) q2 - read_sheet(sales_data_id, sheet Q2)限制二网络延迟。read_sheet()的耗时70% 以上花在了网络往返RTT上而不是数据处理。如果你的服务器在国外而 Google 的服务器也在国外延迟可能高达 300ms。优化方法是启用 HTTP 缓存。googlesheets4底层使用httr你可以通过设置httr::set_config()来启用内存缓存对同一sheet_id的重复读取第二次会直接从内存返回耗时趋近于 0# 在脚本开头启用缓存有效期 5 分钟 httr::set_config( httr::config( timeout 30, cache httr::cache(path tempdir(), max_age 300) ) )限制三大表解析。当 Sheet 超过 10 万行时R 的内存分配和类型推断会成为瓶颈。此时n_max和col_types就不再是可选项而是必选项# ✅ 推荐的大表读取模式 large_sheet - read_sheet( big_id, n_max 50000, # 先读一半够分析用 col_types cddddc, # 强制类型避免猜测 progress TRUE # 知道进度不焦虑 )4.3 团队协作与脚本分发如何让同事不用重走你的认证路这是很多 R 用户的终极困惑我写好了一个完美的read_sheet()脚本发给同事他一运行就卡在gs4_auth()还要他重新登录一遍这显然违背了“可复现性”的科学精神。答案是利用gargle的凭据共享机制。gargle默认会把 token 存在系统级的凭据库中这意味着只要你们用的是同一个操作系统用户比如都是admin账号并且在同一台机器上运行gs4_auth()就会自动复用已有的 token无需再次登录。但更常见的情况是你们在不同电脑上。这时gargle提供了一个“凭据导出/导入”功能# 在你的电脑上导出凭据生成一个加密的 .rds 文件 gargle::gargle_credential_export( path my_google_creds.rds, email yourwork.com ) # 把这个文件发给同事让他在自己的电脑上导入 gargle::gargle_credential_import( path my_google_creds.rds )导入后同事的 R 就拥有了和你完全相同的 Google 认证状态可以无缝运行你的脚本。整个过程不涉及任何明文密码或 token安全性有保障。注意这个功能只适用于gargle1.2.0 版本。请确保你和同事都更新到了最新版。另外导出的.rds文件应被视为敏感信息不要上传到 GitHub 或公共网盘。4.4 与readr和dplyr的无缝集成构建你的数据流水线googlesheets4的设计哲学是“做一件事并把它做到极致”。它不负责数据清洗不负责可视化只负责把 Google Sheets 的数据以最干净、最标准的方式送进 R 的数据生态。因此它与tidyverse家族的集成堪称完美。一个典型的、可投入生产的分析流水线是这样的library(googlesheets4) library(dplyr) library(readr) # 1. 读取原始数据源头 raw_sales - read_sheet( sales_data_id, sheet Raw_Data, col_types cDddd # 强制Name(date), Date(date), Amount(double), Region(char), Status(char) ) # 2. 清洗与转换dplyr cleaned_sales - raw_sales %% filter(!is.na(Amount)) %% # 去掉金额为空的行 mutate(Date as.Date(Date)) %% # 确保日期是 Date 类型 mutate(Quarter floor_date(Date, quarter)) %% # 计算季度 select(Name, Date, Amount, Quarter, Region) # 只保留需要的列 # 3. 导出或进一步分析 write_csv(cleaned_sales, output/cleaned_sales.csv)你会发现read_sheet()返回的tibble和read_csv()返回的tibble接口完全一致。你可以用dplyr的filter()、mutate()、group_by()无差别操作可以用ggplot2直接绘图可以用lubridate处理日期。googlesheets4的价值正在于它消除了数据源的“异构性”让你可以把精力集中在分析本身而不是“怎么把数据弄进来”。5. 常见问题与排查技巧实录来自真实战场的 7 个血泪教训5.1 “OAuth error: request failed with status code 403” —— 不是你的错是 Google 的锅这个错误信息堪称googlesheets4用户的“梦魇”。但我要告诉你一个残酷的真相99% 的情况下它和你的代码、你的网络、你的 R 版本都无关纯粹是 Google 的 API 服务端在抖动。Google Sheets API 作为全球数亿用户共用的服务偶尔会出现区域性、短暂性的 403 响应尤其是在高峰时段工作日上午 9-11 点。我的应对策略是“三连重试”# 封装一个带重试的读取函数 read_sheet_safe - function(...) { for (i in 1:3) { tryCatch({ result - read_sheet(...) message(✅ 第 , i, 次尝试成功) return(result) }, error function(e) { if (grepl(403, e$message) i 3) { message(⚠️ 第 , i, 次尝试失败 (403)等待 2 秒后重试...) Sys.sleep(2) } else { stop(e$message) } }) } } # 使用 data - read_sheet_safe(sales_data_id)这个函数会在遇到 403 时自动等待 2 秒后重试最多 3 次。实践证明95% 的 403 错误都能在第二次重试时解决。这比你手动刷新页面、重启 R、重装包要高效得多。5.2 读取的日期变成了数字Excel 日期序列的陷阱Google Sheets 和 Excel 一样内部用“自 1899-12-30 起的天数”来存储日期。当你用read_sheet()读取一个格式为“日期”的单元格时如果col_types没有明确指定为DR 会把它当作普通数字读进来比如44927这其实是2023-01-01。解决方案有两个层级预防层永远在read_sheet()中为日期列指定col_types D。补救层如果已经读进来了用as.Date(x, origin 1899-12-30)转换# 假设 Date 列被读成了数字 df$Date - as.Date(df$Date, origin 1899-12-30)提示Google Sheets 的日期序列起点是1899-12-30而不是 Excel 的1900-01-01这是因为 Google 为了兼容 Excel 的一个著名 bug1900 年是闰年而做了调整。这个细节文档里不会写但你必须知道。5.3 中文乱码字符编码的隐形杀手如果你的 Sheet 里有中文而read_sheet()读出来是????或一堆方块那一定是字符编码问题。googlesheets4默认使用 UTF-8这在绝大多数

文章详情

R语言读取Google Sheets的正确姿势：googlesheets4实战指南

相关新闻

最新新闻

日新闻

周新闻

月新闻