聚合/折叠数据框

提问者：小点点

R中是否有“多合一”便利函数可以折叠/聚合数据框以解决多对多问题？动机是减少多对多关系，以便可以在某个主键（具有唯一标识符值的列）上联接两个或多个表。为了阐明这一点，请考虑一个数据框，例如：

set.seed(1) # for reproducibility
df <- data.frame(id = sort(rep(seq(1,3),4)), # primary key
           geo_loc = state.abb[sample(seq(1,length(state.name)), # state abbreviations
                           size=length(sort(rep(seq(1,3),4))), 
                           replace = TRUE)],
           revenue = c(sample(seq(0,50),size=3), sample(c(seq(101,200)),size=3),
                          sample(seq(201,300),size=4), sample(seq(301,1000),size=2)),
           prod_id = sample(LETTERS[c(seq(1,4))],size=12, replace=TRUE),
           quant = c(sample(seq(0,5),size=4), sample(c(seq(3,8)),size=4),
                        sample(seq(6,11),size=2), sample(seq(9,14),size=2))) ; df

   id geo_loc revenue prod_id quant
1   1      MN      47       D     0
2   1      MA      29       B     3
3   1      SD      50       B     4
4   1      NM     174       A     1
5   2      NC     136       D     6
6   2      LA     143       B     5
7   2      IN     215       C     8
8   2      WY     202       A     4
9   3      NY     271       A    10
10  3      HI     211       C     9
11  3      CT     613       C    10
12  3      MS     748       A    14

是否已经存在一个函数来折叠此表，以便每个唯一 id 只有一行？它必须将geo_loc和prod_id列转换为 k 级 - 1 个虚拟列。如果这样的函数可以允许根据分位数将收入自动聚类到多个块中，那也很好。

共1个答案

匿名用户

仅当有适当的分组变量时才进行聚合。例如，按< code>prod_id进行聚合更符合逻辑。

要执行这些数据整理和聚合操作，我个人建议使用tidyr包中的spread（）和gather（），以及dplyrpackage中的summary（）和group_by（）。


		      
                相关问题
                

																                
					
										   JavaHashMap内部数据结构在重新散列期间如何变化？
										   共享可观察数据的正确方式和地点是什么
										   RxJava：防止一个可观察对象发射，直到另一个可观察对象的数据被发射
										   Angular2/4：实时刷新数据
										   MongoDB计数，最小，最大，平均使用带有对象列表的字段进行聚合
										   按日期分组Mongo聚合
										   带有聚合管道的文本搜索-MongoDB/PHP
										   MongoDB聚合
										   Mongo不会使用$gte和$date返回聚合中的文档
										   JavaFX边框窗格网格[重复]
										   如何使用selenium WebDrive（java）抓取表中的数据？
										   如何使用Selenium和Python在reCAPTCHA演示页面上的多个框架内查找和交互多个元素
										   导出到PDF时，表格中每页结尾行缺少边框底部
										   对于固定高度的表格，不延伸到底部的列边框
										   文档数组字段的每个元素的MongoDB聚合
										   ggplot：子集使用管道传递数据的层
										   如何在R中读取utf-8格式的数据？
										   如何在PHP中通过ODBC为普适数据库设置编码？
										   Apache FOP使用Service中的数据进行PDF
										   AMQ214013：解码数据包失败：java. lang.IllegalArgumentException：AMQ119032：无效类型：1

聚合/折叠数据框

共1个答案

相关问题

热门标签

微信关注