This file is associated with the course on Functional Analysis, accessible at this link: https://moodle.france-bioinformatique.fr/course/view.php?id=37. This file shows the code to perform over-representation analysis (ORA) and gene set enrichment analysis (GSEA). The analyses are based on the clusterProfiler package:

citation("clusterProfiler")

## Please cite S. Xu (2024) for using clusterProfiler. In addition, please
## cite G. Yu (2010) when using GOSemSim, G. Yu (2015) when using DOSE and
## G. Yu (2015) when using ChIPseeker.
## 
##   G Yu. Thirteen years of clusterProfiler. The Innovation. 2024,
##   5(6):100722
## 
##   S Xu, E Hu, Y Cai, Z Xie, X Luo, L Zhan, W Tang, Q Wang, B Liu, R
##   Wang, W Xie, T Wu, L Xie, G Yu. Using clusterProfiler to characterize
##   multiomics data. Nature Protocols. 2024, 19(11):3292-3320
## 
##   T Wu, E Hu, S Xu, M Chen, P Guo, Z Dai, T Feng, L Zhou, W Tang, L
##   Zhan, X Fu, S Liu, X Bo, and G Yu. clusterProfiler 4.0: A universal
##   enrichment tool for interpreting omics data. The Innovation. 2021,
##   2(3):100141
## 
##   Guangchuang Yu, Li-Gen Wang, Yanyan Han and Qing-Yu He.
##   clusterProfiler: an R package for comparing biological themes among
##   gene clusters. OMICS: A Journal of Integrative Biology 2012,
##   16(5):284-287
## 
## To see these entries in BibTeX format, use 'print(<citation>,
## bibtex=TRUE)', 'toBibtex(.)', or set
## 'options(citation.bibtex.max=999)'.

Environment

We load packages of interest:

library(clusterProfiler)  # Make enrichment analysis
library(enrichplot)       # Awesome graphs
library(org.At.tair.db)   # A. Thaliana annotation

.libPaths()

## [1] "/shared/ifbstor1/software/miniconda/envs/r-4.5.1/lib/R/library"

Data

We load the data from the differential expression analysis.

deseq_genes = read.table(
  file = "./tables/KOvsWT.complete.txt",
  sep = "\t",
  header = TRUE
)

We assess the dimensions of the data. First, the column names:

colnames(deseq_genes)

##  [1] "Id"             "WT1"            "WT2"            "WT3"           
##  [5] "KO1"            "KO2"            "KO3"            "norm.WT1"      
##  [9] "norm.WT2"       "norm.WT3"       "norm.KO1"       "norm.KO2"      
## [13] "norm.KO3"       "baseMean"       "WT"             "KO"            
## [17] "FoldChange"     "log2FoldChange" "stat"           "pvalue"        
## [21] "padj"           "dispGeneEst"    "dispFit"        "dispMAP"       
## [25] "dispersion"     "betaConv"       "maxCooks"

Second, the number of rows:

nrow(deseq_genes)

## [1] 27655

Third, the first elements from the Id column:

head(deseq_genes$Id)

## [1] "gene:AT1G01010" "gene:AT1G01020" "gene:AT1G01030" "gene:AT1G01040"
## [5] "gene:AT1G01050" "gene:AT1G01060"

We explore the data:

deseq_genes[deseq_genes$Id == "gene:AT1G61580", ]

##                  Id WT1 WT2 WT3 KO1 KO2 KO3 norm.WT1 norm.WT2 norm.WT3 norm.KO1
## 5120 gene:AT1G61580 248 231 205 119 131 125      229      210      215      131
##      norm.KO2 norm.KO3 baseMean  WT  KO FoldChange log2FoldChange  stat
## 5120      131      123   173.19 218 128      0.588         -0.766 -4.48
##            pvalue         padj dispGeneEst dispFit dispMAP dispersion betaConv
## 5120 7.465947e-06 0.0001156724           0  0.0311  0.0149     0.0149     TRUE
##      maxCooks
## 5120   0.0222

Gene identifiers

For a computer, gene:AT1G01010 is not AT1G01010. To interact properly with the database, we remove the gene: string:

head(deseq_genes$Id)

## [1] "gene:AT1G01010" "gene:AT1G01020" "gene:AT1G01030" "gene:AT1G01040"
## [5] "gene:AT1G01050" "gene:AT1G01060"

deseq_genes$Id = sub(pattern = "gene:",
                     replacement = "",
                     x = deseq_genes$Id)

head(deseq_genes$Id)

## [1] "AT1G01010" "AT1G01020" "AT1G01030" "AT1G01040" "AT1G01050" "AT1G01060"

Over-representation analysis

We need to filter differentially expressed genes in order to perform ORA. How many genes are in our data ?

nrow(deseq_genes)

## [1] 27655

How many genes are significantly differentially expressed, given an adjusted p-value threshold set to 0.001 ?

de_genes = deseq_genes[deseq_genes[, "padj"] <= 0.001, ]
de_genes = de_genes[!is.na(de_genes[, "log2FoldChange"]), ]

nrow(de_genes)

## [1] 1807

In this table, there are up- and down-regulated genes:

summary(de_genes$log2FoldChange)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
## -8.4190 -1.5990 -0.5370 -0.3679  1.0510  6.6990

Our custom gene set corresponds to the up-regulated genes only:

de_genes = de_genes[de_genes[, "log2FoldChange"] > 0, ]

nrow(de_genes)

## [1] 880

Explore the GO:BP database

We perform the ORA using the gene ontology for biological processes:

ego = clusterProfiler::enrichGO(
  gene = de_genes$Id,                     # gene list
  universe = deseq_genes$Id,            # all genes
  OrgDb = org.At.tair.db,               # annotation
  keyType = "TAIR",               # nature of the genes ID
  ont = "BP",                       # Biological Processes
  pvalueCutoff = 1,               # significance threshold (take all)
  pAdjustMethod = "BH",           # p-value adjustment method
  readable = TRUE                 # For human beings
)

What is stored in ego object ?

View(ego)

What is stored in the ego@result table ?

head(ego@result, 3)

##                    ID                           Description GeneRatio   BgRatio
## GO:0010087 GO:0010087          phloem or xylem histogenesis    19/711 130/21364
## GO:0009736 GO:0009736 cytokinin-activated signaling pathway    13/711  76/21364
## GO:0009735 GO:0009735                 response to cytokinin    17/711 134/21364
##            RichFactor FoldEnrichment   zScore       pvalue     p.adjust
## GO:0010087  0.1461538       4.391604 7.196732 6.233419e-08 0.0001004827
## GO:0009736  0.1710526       5.139759 6.707933 1.219050e-06 0.0009825546
## GO:0009735  0.1268657       3.812037 6.058607 2.330987e-06 0.0011947380
##                  qvalue
## GO:0010087 8.733348e-05
## GO:0009736 8.539769e-04
## GO:0009735 1.038394e-03
##                                                                                                                   geneID
## GO:0010087 CORD2/ATHB-15/APL/DOT1/DAR2/AGC1-3/AtSEOR1/OPS/FL2/ACS6/FL3/ATERF6/AtERF#100/BAM3/ATHB-8/ACL5/AVB1/PXY/DOF5.6
## GO:0009736                                    ARR4/ZFP5/ARR7/ATPUP14/ABCG14/GIS3/AHK4/ARR12/ARR5/ARR9/APRR8/ANAC068/ARR6
## GO:0009735      ATGRXS13/ARR4/ZFP5/ATST4B/ARR7/ATPUP14/ABCG14/GIS3/AHK4/ARR12/ARR5/ARR9/APRR8/ANAC068/ABIG1/ATMYB33/ARR6
##            Count
## GO:0010087    19
## GO:0009736    13
## GO:0009735    17

We visualize the top 5 gene ontologies are a barplot:

graphics::barplot(ego, showCategory = 5)

## Warning in fortify(object, showCategory = showCategory, by = x, ...): Arguments in `...` must be used.
## ✖ Problematic argument:
## • by = x
## ℹ Did you misspell an argument name?

## Warning: `aes_string()` was deprecated in ggplot2 3.0.0.
## ℹ Please use tidy evaluation idioms with `aes()`.
## ℹ See also `vignette("ggplot2-in-packages")` for more information.
## ℹ The deprecated feature was likely used in the enrichplot package.
##   Please report the issue at
##   <https://github.com/GuangchuangYu/enrichplot/issues>.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

We visualize the top 5 gene ontologies are a dotplot:

enrichplot::dotplot(ego, showCategory = 5)

Search for phloem-related gene sets

We search for enriched terms related to phloem

phloem_names = grep(ego@result$Description,
                    pattern = "phloem",
                    value = TRUE)
phloem_names

## [1] "phloem or xylem histogenesis"       "phloem transport"                  
## [3] "xylem and phloem pattern formation" "phloem development"

There are a lot ! What about the associated results ?

ego@result[ego@result$Description %in% phloem_names, ]

##                    ID                        Description GeneRatio   BgRatio
## GO:0010087 GO:0010087       phloem or xylem histogenesis    19/711 130/21364
## GO:0010233 GO:0010233                   phloem transport     6/711  22/21364
## GO:0010051 GO:0010051 xylem and phloem pattern formation    10/711  74/21364
## GO:0010088 GO:0010088                 phloem development     6/711  31/21364
##            RichFactor FoldEnrichment   zScore       pvalue     p.adjust
## GO:0010087  0.1461538       4.391604 7.196732 6.233419e-08 0.0001004827
## GO:0010233  0.2727273       8.194860 6.264559 6.287855e-05 0.0059623660
## GO:0010051  0.1351351       4.060516 4.893246 1.643881e-04 0.0126187466
## GO:0010088  0.1935484       5.815707 4.978394 4.807435e-04 0.0215266266
##                  qvalue
## GO:0010087 8.733348e-05
## GO:0010233 5.182127e-03
## GO:0010051 1.096745e-02
## GO:0010088 1.870964e-02
##                                                                                                                   geneID
## GO:0010087 CORD2/ATHB-15/APL/DOT1/DAR2/AGC1-3/AtSEOR1/OPS/FL2/ACS6/FL3/ATERF6/AtERF#100/BAM3/ATHB-8/ACL5/AVB1/PXY/DOF5.6
## GO:0010233                                                                      ATGSL07/BRL2/OPS/AtHMP42/SMXL5/AtNPF2.11
## GO:0010051                                                             CVP2/ABCG14/BRL2/DOT1/OPS/FL2/AMP1/FL3/CEPR1/AVB1
## GO:0010088                                                                              APL/DAR2/AGC1-3/AtSEOR1/OPS/BAM3
##            Count
## GO:0010087    19
## GO:0010233     6
## GO:0010051    10
## GO:0010088     6

We visualize the results as graphs:

graphics::barplot(ego, showCategory = phloem_names)

## Warning in fortify(object, showCategory = showCategory, by = x, ...): Arguments in `...` must be used.
## ✖ Problematic argument:
## • by = x
## ℹ Did you misspell an argument name?

enrichplot::dotplot(ego, showCategory = phloem_names)

Gene set enrichment analysis

We need to build a named vector which contains sorted numbers. So, we explore results to guess the right column to extract:

colnames(deseq_genes)

##  [1] "Id"             "WT1"            "WT2"            "WT3"           
##  [5] "KO1"            "KO2"            "KO3"            "norm.WT1"      
##  [9] "norm.WT2"       "norm.WT3"       "norm.KO1"       "norm.KO2"      
## [13] "norm.KO3"       "baseMean"       "WT"             "KO"            
## [17] "FoldChange"     "log2FoldChange" "stat"           "pvalue"        
## [21] "padj"           "dispGeneEst"    "dispFit"        "dispMAP"       
## [25] "dispersion"     "betaConv"       "maxCooks"

We choose to use the stat column

geneList = as.numeric(de_genes$stat)
names(geneList) = de_genes$Id
geneList = sort(geneList, decreasing = TRUE)

head(geneList)

## AT2G17820 AT5G19600 AT2G25760 AT3G19670 AT3G48110 AT5G11800 
##    18.377    16.078    16.002    15.616    15.249    14.443

Explore the GO:BP database

We perform the GSEA using the gene ontology for biological processes:

gsea = clusterProfiler::gseGO(
  geneList = geneList,       # ranked gene list
  ont = "BP",                # Biological Processes
  OrgDb = org.At.tair.db,    # annotation
  keyType = "TAIR",          # nature of the genes ID
  pAdjustMethod = "BH",      # p-value adjustment method
  pvalueCutoff = 1,          # significance threshold (take all)
  seed = 1                   # fix randomness for permutations
)

Visualize results

What is stored in gsea object ?

View(gsea)

What is stored in the gsea@result table ?

head(gsea@result, 3)

##                    ID                                     Description setSize
## GO:0072522 GO:0072522 purine-containing compound biosynthetic process      11
## GO:1901293 GO:1901293       nucleoside phosphate biosynthetic process      15
## GO:0000375 GO:0000375 RNA splicing, via transesterification reactions      20
##            enrichmentScore      NES       pvalue   p.adjust     qvalue rank
## GO:0072522       0.6545202 2.234595 0.0002822140 0.04609509 0.03609856  115
## GO:1901293       0.5816372 2.162722 0.0006942031 0.04609509 0.03609856  115
## GO:0000375       0.5279490 2.158984 0.0006641180 0.04609509 0.03609856  105
##                              leading_edge
## GO:0072522 tags=64%, list=13%, signal=56%
## GO:1901293 tags=53%, list=13%, signal=47%
## GO:0000375 tags=50%, list=12%, signal=45%
##                                                                                                core_enrichment
## GO:0072522                               AT1G80050/AT4G22570/AT2G17320/AT1G12350/AT2G35390/AT1G70570/AT2G17340
## GO:1901293                     AT1G80050/AT4G22570/AT2G17320/AT3G27190/AT1G12350/AT2G35390/AT1G70570/AT2G17340
## GO:0000375 AT3G19670/AT1G07350/AT3G54230/AT3G01150/AT1G10320/AT2G33435/AT4G38780/AT5G45990/AT1G09660/AT4G34140

What is the most highly and significantly enriched gene set ?

top1_gsea = gsea@result %>%
  dplyr::filter(p.adjust < 0.05) %>%
  dplyr::filter(NES == max(NES)) %>%
  dplyr::select(ID, Description, NES, p.adjust, setSize)
top1_gsea

##                    ID                                     Description      NES
## GO:0072522 GO:0072522 purine-containing compound biosynthetic process 2.234595
##              p.adjust setSize
## GO:0072522 0.04609509      11

We can draw the curve associated with this gene set:

enrichplot::gseaplot2(
  x = gsea,
  geneSetID = top1_gsea$ID,
  title = top1_gsea$Description
)

## Warning: `aes_()` was deprecated in ggplot2 3.0.0.
## ℹ Please use tidy evaluation idioms with `aes()`
## ℹ The deprecated feature was likely used in the enrichplot package.
##   Please report the issue at
##   <https://github.com/GuangchuangYu/enrichplot/issues>.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## ℹ The deprecated feature was likely used in the enrichplot package.
##   Please report the issue at
##   <https://github.com/GuangchuangYu/enrichplot/issues>.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

Search for phloem-related gene sets

We still focus on phloem-related terms:

phloem_names = grep(gsea@result$Description,
                    pattern = "phloem",
                    value = TRUE)
phloem_names

## [1] "xylem and phloem pattern formation" "phloem or xylem histogenesis"

What are the significant results associated with these terms ?

gsea@result %>%
  dplyr::filter(Description %in% phloem_names) %>%
  dplyr::select(ID, Description, NES, p.adjust, setSize)

##                    ID                        Description      NES  p.adjust
## GO:0010051 GO:0010051 xylem and phloem pattern formation 1.389843 0.3285184
## GO:0010087 GO:0010087       phloem or xylem histogenesis 1.121725 0.5207402
##            setSize
## GO:0010051      10
## GO:0010087      19

We want to visualize the GSEA curve associated with one of these terms:

gene_set_id = "GO:0010087"
gene_set_name = gsea@result$Description[which(gsea@result$ID == gene_set_id)]

enrichplot::gseaplot2(
  x = gsea,
  geneSetID = gene_set_id,
  title = gene_set_name
)

Bonus

In this section, we propose other ways to visualize the results from ORA (ego object) or GSEA (gsea object).

Visualization

Multiple GSEA curves

enrichplot::gseaplot2(
  x = gsea,
  geneSetID = c(1:3),
  title = "Most enriched terms"
)

Heatmap

enrichplot::heatplot(
  x = ego,                           # Our ORA
  showCategory = phloem_names,       # Gene sets of interest
  foldChange = setNames(nm = de_genes$Id,
                        de_genes$log2FoldChange) # Our fold changes
)

Upset plot

ego = enrichplot::pairwise_termsim(ego)

enrichplot::upsetplot(x = ego,    # Our ORA
                      n = 10)     # Nb of terms to display

Gene-concept network

enrichplot::cnetplot(ego,
                     showCategory = phloem_names,
                     foldChange = setNames(nm = de_genes$Id,
                                           de_genes$log2FoldChange))

Conversion between gene identifiers

When interacting with databases, you may need TAIR ID, Ensembl ID, ENTREZ ID, UniProt ID… For instance, we could convert TAIR ID to ENTREZ ID and gene symbol:

annotation = clusterProfiler::bitr(
  geneID   = deseq_genes$Id,          # Our gene list
  fromType = "TAIR",                  # We have TAIR ID
  toType   = c("ENTREZID", "SYMBOL"), # What we want
  OrgDb    = org.At.tair.db)          # Our annotation

## 'select()' returned 1:many mapping between keys and columns

## Warning in clusterProfiler::bitr(geneID = deseq_genes$Id, fromType = "TAIR", :
## 3.42% of input gene IDs are fail to map...

head(annotation)

##        TAIR ENTREZID  SYMBOL
## 1 AT1G01010   839580 ANAC001
## 2 AT1G01010   839580  NAC001
## 3 AT1G01010   839580   NTL10
## 4 AT1G01020   839569    ARV1
## 5 AT1G01030   839321    NGA3
## 6 AT1G01040   839574    ASU1

We merge this correspondence table without our data:

deseq_genes_with_symbol = merge(
  x = deseq_genes,
  y = annotation,
  by.x = "Id",        # In deseq_genes, TAIR IDs are stored in the Id column
  by.y = "TAIR")      # In annotation, TAIR IDs are stored in the TAIR column

head(deseq_genes_with_symbol)

##          Id WT1 WT2 WT3 KO1  KO2  KO3 norm.WT1 norm.WT2 norm.WT3 norm.KO1
## 1 AT1G01010 533 541 473 931 1052 1124      493      492      496     1023
## 2 AT1G01010 533 541 473 931 1052 1124      493      492      496     1023
## 3 AT1G01010 533 541 473 931 1052 1124      493      492      496     1023
## 4 AT1G01020  54  54  42  56   56   63       50       49       44       62
## 5 AT1G01030  24  14  18   9   15   10       22       13       19       10
## 6 AT1G01040 342 355 276 359  391  371      316      323      289      395
##   norm.KO2 norm.KO3 baseMean  WT   KO FoldChange log2FoldChange   stat
## 1     1050     1108   777.09 494 1060      2.149          1.104  9.276
## 2     1050     1108   777.09 494 1060      2.149          1.104  9.276
## 3     1050     1108   777.09 494 1060      2.149          1.104  9.276
## 4       56       62    53.78  48   60      1.253          0.325  1.239
## 5       15       10    14.75  18   12      0.647         -0.627 -1.249
## 6      390      366   346.53 309  384      1.238          0.308  2.172
##         pvalue         padj dispGeneEst dispFit dispMAP dispersion betaConv
## 1 1.765350e-20 2.582102e-18           0  0.0210  0.0087     0.0087     TRUE
## 2 1.765350e-20 2.582102e-18           0  0.0210  0.0087     0.0087     TRUE
## 3 1.765350e-20 2.582102e-18           0  0.0210  0.0087     0.0087     TRUE
## 4 2.152436e-01 4.433923e-01           0  0.0597  0.0311     0.0311     TRUE
## 5 2.115810e-01 4.387259e-01           0  0.1696  0.1105     0.1105     TRUE
## 6 2.983500e-02 1.151557e-01           0  0.0246  0.0116     0.0116     TRUE
##   maxCooks ENTREZID  SYMBOL
## 1   0.0187   839580 ANAC001
## 2   0.0187   839580  NAC001
## 3   0.0187   839580   NTL10
## 4   0.0341   839569    ARV1
## 5   0.3564   839321    NGA3
## 6   0.0356   839574    ASU1

It looks similar, BUT number of rows differ:

dim(deseq_genes)

## [1] 27655    27

dim(deseq_genes_with_symbol)

## [1] 38169    29

This is due to 1:many mapping:

head(deseq_genes_with_symbol[, c("Id", "SYMBOL", "ENTREZID")])

##          Id  SYMBOL ENTREZID
## 1 AT1G01010 ANAC001   839580
## 2 AT1G01010  NAC001   839580
## 3 AT1G01010   NTL10   839580
## 4 AT1G01020    ARV1   839569
## 5 AT1G01030    NGA3   839321
## 6 AT1G01040    ASU1   839574

And there are also NA values, which won’t be taken into account in the downstream analyses:

table(is.na(deseq_genes_with_symbol$SYMBOL))

## 
## FALSE  TRUE 
## 26440 11729

table(is.na(deseq_genes_with_symbol$ENTREZID))

## 
## FALSE 
## 38169

ORA and GSEA with a custom database

R Session

To be able to re-run the analysis or to understand why outputs are different between two compilations, it is important to display the version of the packages we used:

sessionInfo()

## R version 4.5.1 (2025-06-13)
## Platform: x86_64-conda-linux-gnu
## Running under: Ubuntu 22.04.5 LTS
## 
## Matrix products: default
## BLAS/LAPACK: /shared/ifbstor1/software/miniconda/envs/r-4.5.1/lib/libopenblasp-r0.3.30.so;  LAPACK version 3.12.0
## 
## locale:
##  [1] LC_CTYPE=en_US.UTF-8       LC_NUMERIC=C              
##  [3] LC_TIME=en_US.UTF-8        LC_COLLATE=en_US.UTF-8    
##  [5] LC_MONETARY=en_US.UTF-8    LC_MESSAGES=en_US.UTF-8   
##  [7] LC_PAPER=en_US.UTF-8       LC_NAME=C                 
##  [9] LC_ADDRESS=C               LC_TELEPHONE=C            
## [11] LC_MEASUREMENT=en_US.UTF-8 LC_IDENTIFICATION=C       
## 
## time zone: Europe/Paris
## tzcode source: system (glibc)
## 
## attached base packages:
## [1] stats4    stats     graphics  grDevices utils     datasets  methods  
## [8] base     
## 
## other attached packages:
## [1] org.At.tair.db_3.21.0  AnnotationDbi_1.70.0   IRanges_2.42.0        
## [4] S4Vectors_0.46.0       Biobase_2.68.0         BiocGenerics_0.54.1   
## [7] generics_0.1.4         enrichplot_1.28.4      clusterProfiler_4.16.0
## 
## loaded via a namespace (and not attached):
##  [1] DBI_1.2.3               gson_0.1.0              rlang_1.1.6            
##  [4] magrittr_2.0.4          DOSE_4.2.0              compiler_4.5.1         
##  [7] RSQLite_2.4.3           png_0.1-8               vctrs_0.6.5            
## [10] reshape2_1.4.4          stringr_1.5.2           pkgconfig_2.0.3        
## [13] crayon_1.5.3            fastmap_1.2.0           XVector_0.48.0         
## [16] labeling_0.4.3          rmarkdown_2.30          UCSC.utils_1.4.0       
## [19] purrr_1.1.0             bit_4.6.0               xfun_0.53              
## [22] cachem_1.1.0            aplot_0.2.9             GenomeInfoDb_1.44.3    
## [25] jsonlite_2.0.0          blob_1.2.4              BiocParallel_1.42.2    
## [28] parallel_4.5.1          R6_2.6.1                bslib_0.9.0            
## [31] stringi_1.8.7           RColorBrewer_1.1-3      jquerylib_0.1.4        
## [34] GOSemSim_2.34.0         Rcpp_1.1.0              knitr_1.50             
## [37] ggtangle_0.0.7          R.utils_2.13.0          Matrix_1.7-4           
## [40] splines_4.5.1           igraph_2.2.0            tidyselect_1.2.1       
## [43] qvalue_2.40.0           rstudioapi_0.17.1       dichromat_2.0-0.1      
## [46] yaml_2.3.10             codetools_0.2-20        lattice_0.22-7         
## [49] tibble_3.3.0            plyr_1.8.9              treeio_1.32.0          
## [52] withr_3.0.2             KEGGREST_1.48.1         S7_0.2.0               
## [55] evaluate_1.0.5          gridGraphics_0.5-1      ggupset_0.4.1          
## [58] Biostrings_2.76.0       pillar_1.11.1           ggtree_3.16.3          
## [61] ggfun_0.2.0             ggplot2_4.0.0           scales_1.4.0           
## [64] tidytree_0.4.6          glue_1.8.0              lazyeval_0.2.2         
## [67] tools_4.5.1             data.table_1.17.8       fgsea_1.34.2           
## [70] fs_1.6.6                fastmatch_1.1-6         cowplot_1.2.0          
## [73] grid_4.5.1              tidyr_1.3.1             ape_5.8-1              
## [76] nlme_3.1-168            GenomeInfoDbData_1.2.14 patchwork_1.3.2        
## [79] cli_3.6.5               rappdirs_0.3.3          dplyr_1.1.4            
## [82] gtable_0.3.6            R.methodsS3_1.8.2       yulab.utils_0.2.1      
## [85] sass_0.4.10             digest_0.6.37           ggrepel_0.9.6          
## [88] ggplotify_0.1.3         farver_2.1.2            memoise_2.0.1          
## [91] htmltools_0.5.8.1       R.oo_1.27.1             lifecycle_1.0.4        
## [94] httr_1.4.7              GO.db_3.21.0            bit64_4.6.0-1

LS0tCnRpdGxlOiAiUHJhY3RpYWwgU2Vzc2lvbiAtIEdlbmUgU2V0IEFuYWx5c2lzIgpkYXRlOiAiRUJBSUkgbjEgMjAyNSIKb3V0cHV0OgogIGh0bWxfZG9jdW1lbnQ6CiAgICBjb2RlX2Rvd25sb2FkOiB0cnVlCiAgICB0b2M6IHRydWUKICAgIHRvY19mbG9hdDogdHJ1ZQotLS0KCmBgYHtyIHNldHVwLCBpbmNsdWRlPUZBTFNFfQprbml0cjo6b3B0c19jaHVuayRzZXQoZWNobyA9IFRSVUUpCmBgYAoKVGhpcyBmaWxlIGlzIGFzc29jaWF0ZWQgd2l0aCB0aGUgY291cnNlIG9uIEZ1bmN0aW9uYWwgQW5hbHlzaXMsIGFjY2Vzc2libGUgYXQgdGhpcyBsaW5rOiBbaHR0cHM6Ly9tb29kbGUuZnJhbmNlLWJpb2luZm9ybWF0aXF1ZS5mci9jb3Vyc2Uvdmlldy5waHA/aWQ9MzddKGh0dHBzOi8vbW9vZGxlLmZyYW5jZS1iaW9pbmZvcm1hdGlxdWUuZnIvY291cnNlL3ZpZXcucGhwP2lkPTM3KS4gVGhpcyBmaWxlIHNob3dzIHRoZSBjb2RlIHRvIHBlcmZvcm0gb3Zlci1yZXByZXNlbnRhdGlvbiBhbmFseXNpcyAoT1JBKSBhbmQgZ2VuZSBzZXQgZW5yaWNobWVudCBhbmFseXNpcyAoR1NFQSkuIFRoZSBhbmFseXNlcyBhcmUgYmFzZWQgb24gdGhlIGBjbHVzdGVyUHJvZmlsZXJgIHBhY2thZ2U6CgpgYGB7ciBjaXRhdGlvbl9jbHVzdGVycHJvZmlsZXJ9CmNpdGF0aW9uKCJjbHVzdGVyUHJvZmlsZXIiKQpgYGAKCiMgRW52aXJvbm1lbnQKCldlIGxvYWQgcGFja2FnZXMgb2YgaW50ZXJlc3Q6IAoKYGBge3IgZW52aXJvbm1lbnQsIHdhcm5pbmc9RkFMU0UsIG1lc3NhZ2U9RkFMU0V9CmxpYnJhcnkoY2x1c3RlclByb2ZpbGVyKSAgIyBNYWtlIGVucmljaG1lbnQgYW5hbHlzaXMKbGlicmFyeShlbnJpY2hwbG90KSAgICAgICAjIEF3ZXNvbWUgZ3JhcGhzCmxpYnJhcnkob3JnLkF0LnRhaXIuZGIpICAgIyBBLiBUaGFsaWFuYSBhbm5vdGF0aW9uCgoubGliUGF0aHMoKQpgYGAKCiMgRGF0YQoKV2UgbG9hZCB0aGUgZGF0YSBmcm9tIHRoZSBkaWZmZXJlbnRpYWwgZXhwcmVzc2lvbiBhbmFseXNpcy4KCmBgYHtyIGxvYWRkYXRhfQpkZXNlcV9nZW5lcyA9IHJlYWQudGFibGUoCiAgZmlsZSA9ICIuL3RhYmxlcy9LT3ZzV1QuY29tcGxldGUudHh0IiwKICBzZXAgPSAiXHQiLAogIGhlYWRlciA9IFRSVUUKKQpgYGAKCldlIGFzc2VzcyB0aGUgZGltZW5zaW9ucyBvZiB0aGUgZGF0YS4gRmlyc3QsIHRoZSBjb2x1bW4gbmFtZXM6CgpgYGB7ciBjb2xuYW1lc19kYXRhfQpjb2xuYW1lcyhkZXNlcV9nZW5lcykKYGBgCgpTZWNvbmQsIHRoZSBudW1iZXIgb2Ygcm93czoKCmBgYHtyIG5yb3dfZGF0YX0KbnJvdyhkZXNlcV9nZW5lcykKYGBgCgpUaGlyZCwgdGhlIGZpcnN0IGVsZW1lbnRzIGZyb20gdGhlIGBJZGAgY29sdW1uOgoKYGBge3IgaGVhZF9kYXRhX2lkfQpoZWFkKGRlc2VxX2dlbmVzJElkKQpgYGAKCldlIGV4cGxvcmUgdGhlIGRhdGE6CgpgYGB7ciBBVDFHNjE1ODB9CmRlc2VxX2dlbmVzW2Rlc2VxX2dlbmVzJElkID09ICJnZW5lOkFUMUc2MTU4MCIsIF0KYGBgCgojIEdlbmUgaWRlbnRpZmllcnMKCkZvciBhIGNvbXB1dGVyLCBgZ2VuZTpBVDFHMDEwMTBgIGlzIG5vdCBgQVQxRzAxMDEwYC4gVG8gaW50ZXJhY3QgcHJvcGVybHkgd2l0aCB0aGUgZGF0YWJhc2UsIHdlIHJlbW92ZSB0aGUgYGdlbmU6YCBzdHJpbmc6CgpgYGB7ciByZW1vdmVfZ2VuZWRvdH0KaGVhZChkZXNlcV9nZW5lcyRJZCkKCmRlc2VxX2dlbmVzJElkID0gc3ViKHBhdHRlcm4gPSAiZ2VuZToiLAogICAgICAgICAgICAgICAgICAgICByZXBsYWNlbWVudCA9ICIiLAogICAgICAgICAgICAgICAgICAgICB4ID0gZGVzZXFfZ2VuZXMkSWQpCgpoZWFkKGRlc2VxX2dlbmVzJElkKQpgYGAKCiMgT3Zlci1yZXByZXNlbnRhdGlvbiBhbmFseXNpcwoKV2UgbmVlZCB0byBmaWx0ZXIgZGlmZmVyZW50aWFsbHkgZXhwcmVzc2VkIGdlbmVzIGluIG9yZGVyIHRvIHBlcmZvcm0gT1JBLiBIb3cgbWFueSBnZW5lcyBhcmUgaW4gb3VyIGRhdGEgPwoKYGBge3IgbmJfZ2VuZXN9Cm5yb3coZGVzZXFfZ2VuZXMpCmBgYAoKSG93IG1hbnkgZ2VuZXMgYXJlIHNpZ25pZmljYW50bHkgZGlmZmVyZW50aWFsbHkgZXhwcmVzc2VkLCBnaXZlbiBhbiBhZGp1c3RlZCBwLXZhbHVlIHRocmVzaG9sZCBzZXQgdG8gMC4wMDEgPwoKYGBge3Igc2lnbmlmX2RlX2dlbmVzfQpkZV9nZW5lcyA9IGRlc2VxX2dlbmVzW2Rlc2VxX2dlbmVzWywgInBhZGoiXSA8PSAwLjAwMSwgXQpkZV9nZW5lcyA9IGRlX2dlbmVzWyFpcy5uYShkZV9nZW5lc1ssICJsb2cyRm9sZENoYW5nZSJdKSwgXQoKbnJvdyhkZV9nZW5lcykKYGBgCgpJbiB0aGlzIHRhYmxlLCB0aGVyZSBhcmUgdXAtIGFuZCBkb3duLXJlZ3VsYXRlZCBnZW5lczoKCmBgYHtyIHVwX2Rvd25fZGVfZ2VuZXN9CnN1bW1hcnkoZGVfZ2VuZXMkbG9nMkZvbGRDaGFuZ2UpCmBgYAoKT3VyIGN1c3RvbSBnZW5lIHNldCBjb3JyZXNwb25kcyB0byB0aGUgdXAtcmVndWxhdGVkIGdlbmVzIG9ubHk6CgpgYGB7ciB1cF9kZV9nZW5lc30KZGVfZ2VuZXMgPSBkZV9nZW5lc1tkZV9nZW5lc1ssICJsb2cyRm9sZENoYW5nZSJdID4gMCwgXQoKbnJvdyhkZV9nZW5lcykKYGBgCgojIyBFeHBsb3JlIHRoZSBHTzpCUCBkYXRhYmFzZQoKV2UgcGVyZm9ybSB0aGUgT1JBIHVzaW5nIHRoZSBnZW5lIG9udG9sb2d5IGZvciBiaW9sb2dpY2FsIHByb2Nlc3NlczoKCmBgYHtyIGVnb19icH0KZWdvID0gY2x1c3RlclByb2ZpbGVyOjplbnJpY2hHTygKICBnZW5lID0gZGVfZ2VuZXMkSWQsCQkJCSAgICAgICMgZ2VuZSBsaXN0CiAgdW5pdmVyc2UgPSBkZXNlcV9nZW5lcyRJZCwJCQkjIGFsbCBnZW5lcwogIE9yZ0RiID0gb3JnLkF0LnRhaXIuZGIsCQkgICAgCSMgYW5ub3RhdGlvbgogIGtleVR5cGUgPSAiVEFJUiIsICAgICAgICAgICAgICAgIyBuYXR1cmUgb2YgdGhlIGdlbmVzIElECiAgb250ID0gIkJQIiwJICAgICAgICAgICAgICAgICAgICAjIEJpb2xvZ2ljYWwgUHJvY2Vzc2VzCiAgcHZhbHVlQ3V0b2ZmID0gMSwgICAgICAgICAgICAgICAjIHNpZ25pZmljYW5jZSB0aHJlc2hvbGQgKHRha2UgYWxsKQogIHBBZGp1c3RNZXRob2QgPSAiQkgiLCAgICAgICAgICAgIyBwLXZhbHVlIGFkanVzdG1lbnQgbWV0aG9kCiAgcmVhZGFibGUgPSBUUlVFICAgICAgICAgICAgICAgICAjIEZvciBodW1hbiBiZWluZ3MKKQpgYGAKCldoYXQgaXMgc3RvcmVkIGluIGBlZ29gIG9iamVjdCA/CgpgYGB7ciB2aWV3b19lZ28sIGV2YWwgPSBGQUxTRX0KVmlldyhlZ28pCmBgYAoKV2hhdCBpcyBzdG9yZWQgaW4gdGhlIGBlZ29AcmVzdWx0YCB0YWJsZSA/CgpgYGB7ciBlZ29fcmVzdWx0c30KaGVhZChlZ29AcmVzdWx0LCAzKQpgYGAKCldlIHZpc3VhbGl6ZSB0aGUgdG9wIDUgZ2VuZSBvbnRvbG9naWVzIGFyZSBhICoqYmFycGxvdCoqOgoKYGBge3IgYmFycGxvdCwgZmlnLndpZHRoID0gMTAsIGZpZy5oZWlnaHQgPSAzfQpncmFwaGljczo6YmFycGxvdChlZ28sIHNob3dDYXRlZ29yeSA9IDUpCmBgYAoKV2UgdmlzdWFsaXplIHRoZSB0b3AgNSBnZW5lIG9udG9sb2dpZXMgYXJlIGEgKipkb3RwbG90Kio6CgpgYGB7ciBkb3RwbG90LCBmaWcud2lkdGggPSAxMCwgZmlnLmhlaWdodCA9IDN9CmVucmljaHBsb3Q6OmRvdHBsb3QoZWdvLCBzaG93Q2F0ZWdvcnkgPSA1KQpgYGAKCiMjIFNlYXJjaCBmb3IgcGhsb2VtLXJlbGF0ZWQgZ2VuZSBzZXRzCgpXZSBzZWFyY2ggZm9yIGVucmljaGVkIHRlcm1zIHJlbGF0ZWQgdG8gcGhsb2VtCgpgYGB7ciBwaGxvZW1fbmFtZXN9CnBobG9lbV9uYW1lcyA9IGdyZXAoZWdvQHJlc3VsdCREZXNjcmlwdGlvbiwKICAgICAgICAgICAgICAgICAgICBwYXR0ZXJuID0gInBobG9lbSIsCiAgICAgICAgICAgICAgICAgICAgdmFsdWUgPSBUUlVFKQpwaGxvZW1fbmFtZXMKYGBgCgpUaGVyZSBhcmUgYSBsb3QgISBXaGF0IGFib3V0IHRoZSBhc3NvY2lhdGVkIHJlc3VsdHMgPwoKYGBge3J9CmVnb0ByZXN1bHRbZWdvQHJlc3VsdCREZXNjcmlwdGlvbiAlaW4lIHBobG9lbV9uYW1lcywgXQpgYGAKCldlIHZpc3VhbGl6ZSB0aGUgcmVzdWx0cyBhcyBncmFwaHM6CgpgYGB7ciwgZmlnLndpZHRoID0gMTAsIGZpZy5oZWlnaHQgPSAzfQpncmFwaGljczo6YmFycGxvdChlZ28sIHNob3dDYXRlZ29yeSA9IHBobG9lbV9uYW1lcykKCmVucmljaHBsb3Q6OmRvdHBsb3QoZWdvLCBzaG93Q2F0ZWdvcnkgPSBwaGxvZW1fbmFtZXMpCmBgYAoKIyBHZW5lIHNldCBlbnJpY2htZW50IGFuYWx5c2lzCgpXZSBuZWVkIHRvIGJ1aWxkIGEgbmFtZWQgdmVjdG9yIHdoaWNoIGNvbnRhaW5zIHNvcnRlZCBudW1iZXJzLiBTbywgd2UgZXhwbG9yZSByZXN1bHRzIHRvIGd1ZXNzIHRoZSByaWdodCBjb2x1bW4gdG8gZXh0cmFjdDoKCmBgYHtyIHdoaWNoX3dlaWdodH0KY29sbmFtZXMoZGVzZXFfZ2VuZXMpCmBgYAoKV2UgY2hvb3NlIHRvIHVzZSB0aGUgYHN0YXRgIGNvbHVtbgoKYGBge3IgZ2VuZUxpc3R9CmdlbmVMaXN0ID0gYXMubnVtZXJpYyhkZV9nZW5lcyRzdGF0KQpuYW1lcyhnZW5lTGlzdCkgPSBkZV9nZW5lcyRJZApnZW5lTGlzdCA9IHNvcnQoZ2VuZUxpc3QsIGRlY3JlYXNpbmcgPSBUUlVFKQoKaGVhZChnZW5lTGlzdCkKYGBgCgojIyBFeHBsb3JlIHRoZSBHTzpCUCBkYXRhYmFzZQoKV2UgcGVyZm9ybSB0aGUgR1NFQSB1c2luZyB0aGUgZ2VuZSBvbnRvbG9neSBmb3IgYmlvbG9naWNhbCBwcm9jZXNzZXM6CgpgYGB7ciBnc2VHTywgbWVzc2FnZT1GQUxTRSwgd2FybmluZz1GQUxTRX0KZ3NlYSA9IGNsdXN0ZXJQcm9maWxlcjo6Z3NlR08oCiAgZ2VuZUxpc3QgPSBnZW5lTGlzdCwgICAgICAgIyByYW5rZWQgZ2VuZSBsaXN0CiAgb250ID0gIkJQIiwgICAgICAgICAgICAgICAgIyBCaW9sb2dpY2FsIFByb2Nlc3NlcwogIE9yZ0RiID0gb3JnLkF0LnRhaXIuZGIsICAgICMgYW5ub3RhdGlvbgogIGtleVR5cGUgPSAiVEFJUiIsICAgICAgICAgICMgbmF0dXJlIG9mIHRoZSBnZW5lcyBJRAogIHBBZGp1c3RNZXRob2QgPSAiQkgiLCAgICAgICMgcC12YWx1ZSBhZGp1c3RtZW50IG1ldGhvZAogIHB2YWx1ZUN1dG9mZiA9IDEsICAgICAgICAgICMgc2lnbmlmaWNhbmNlIHRocmVzaG9sZCAodGFrZSBhbGwpCiAgc2VlZCA9IDEgICAgICAgICAgICAgICAgICAgIyBmaXggcmFuZG9tbmVzcyBmb3IgcGVybXV0YXRpb25zCikKYGBgCgojIyBWaXN1YWxpemUgcmVzdWx0cwoKV2hhdCBpcyBzdG9yZWQgaW4gYGdzZWFgIG9iamVjdCA/CgpgYGB7ciB2aWV3X2dzZWEsIGV2YWwgPSBGQUxTRX0KVmlldyhnc2VhKQpgYGAKCldoYXQgaXMgc3RvcmVkIGluIHRoZSBgZ3NlYUByZXN1bHRgIHRhYmxlID8KCmBgYHtyIGdzZWFfcmVzdWx0c30KaGVhZChnc2VhQHJlc3VsdCwgMykKYGBgCgpXaGF0IGlzIHRoZSBtb3N0IGhpZ2hseSBhbmQgc2lnbmlmaWNhbnRseSBlbnJpY2hlZCBnZW5lIHNldCA/CgpgYGB7ciBiZXN0X2dlbmVfc2V0fQp0b3AxX2dzZWEgPSBnc2VhQHJlc3VsdCAlPiUKICBkcGx5cjo6ZmlsdGVyKHAuYWRqdXN0IDwgMC4wNSkgJT4lCiAgZHBseXI6OmZpbHRlcihORVMgPT0gbWF4KE5FUykpICU+JQogIGRwbHlyOjpzZWxlY3QoSUQsIERlc2NyaXB0aW9uLCBORVMsIHAuYWRqdXN0LCBzZXRTaXplKQp0b3AxX2dzZWEKYGBgCldlIGNhbiBkcmF3IHRoZSBjdXJ2ZSBhc3NvY2lhdGVkIHdpdGggdGhpcyBnZW5lIHNldDoKCmBgYHtyIGJlc3RfZ2VuZV9zZXRfcGxvdCwgZmlnLndpZHRoID0gOCwgZmlnLmhlaWdodCA9IDV9CmVucmljaHBsb3Q6OmdzZWFwbG90MigKICB4ID0gZ3NlYSwKICBnZW5lU2V0SUQgPSB0b3AxX2dzZWEkSUQsCiAgdGl0bGUgPSB0b3AxX2dzZWEkRGVzY3JpcHRpb24KKQpgYGAKCiMjIFNlYXJjaCBmb3IgcGhsb2VtLXJlbGF0ZWQgZ2VuZSBzZXRzCgpXZSBzdGlsbCBmb2N1cyBvbiBwaGxvZW0tcmVsYXRlZCB0ZXJtczoKCmBgYHtyIHBobG9lbV9uYW1lczJ9CnBobG9lbV9uYW1lcyA9IGdyZXAoZ3NlYUByZXN1bHQkRGVzY3JpcHRpb24sCiAgICAgICAgICAgICAgICAgICAgcGF0dGVybiA9ICJwaGxvZW0iLAogICAgICAgICAgICAgICAgICAgIHZhbHVlID0gVFJVRSkKcGhsb2VtX25hbWVzCmBgYAoKV2hhdCBhcmUgdGhlIHNpZ25pZmljYW50IHJlc3VsdHMgYXNzb2NpYXRlZCB3aXRoIHRoZXNlIHRlcm1zID8KCmBgYHtyIGdzZWFfcGhsb2VtfQpnc2VhQHJlc3VsdCAlPiUKICBkcGx5cjo6ZmlsdGVyKERlc2NyaXB0aW9uICVpbiUgcGhsb2VtX25hbWVzKSAlPiUKICBkcGx5cjo6c2VsZWN0KElELCBEZXNjcmlwdGlvbiwgTkVTLCBwLmFkanVzdCwgc2V0U2l6ZSkKYGBgCldlIHdhbnQgdG8gdmlzdWFsaXplIHRoZSBHU0VBIGN1cnZlIGFzc29jaWF0ZWQgd2l0aCBvbmUgb2YgdGhlc2UgdGVybXM6CgpgYGB7ciwgZmlnLndpZHRoID0gOCwgZmlnLmhlaWdodCA9IDV9CmdlbmVfc2V0X2lkID0gIkdPOjAwMTAwODciCmdlbmVfc2V0X25hbWUgPSBnc2VhQHJlc3VsdCREZXNjcmlwdGlvblt3aGljaChnc2VhQHJlc3VsdCRJRCA9PSBnZW5lX3NldF9pZCldCgplbnJpY2hwbG90Ojpnc2VhcGxvdDIoCiAgeCA9IGdzZWEsCiAgZ2VuZVNldElEID0gZ2VuZV9zZXRfaWQsCiAgdGl0bGUgPSBnZW5lX3NldF9uYW1lCikKYGBgCgoKIyBCb251cwoKSW4gdGhpcyBzZWN0aW9uLCB3ZSBwcm9wb3NlIG90aGVyIHdheXMgdG8gdmlzdWFsaXplIHRoZSByZXN1bHRzIGZyb20gT1JBIChgZWdvYCBvYmplY3QpIG9yIEdTRUEgKGBnc2VhYCBvYmplY3QpLgoKIyMgVmlzdWFsaXphdGlvbgoKIyMjIE11bHRpcGxlIEdTRUEgY3VydmVzCgpgYGB7ciwgZmlnLndpZHRoID0gOCwgZmlnLmhlaWdodCA9IDV9CmVucmljaHBsb3Q6OmdzZWFwbG90MigKICB4ID0gZ3NlYSwKICBnZW5lU2V0SUQgPSBjKDE6MyksCiAgdGl0bGUgPSAiTW9zdCBlbnJpY2hlZCB0ZXJtcyIKKQpgYGAKCiMjIyBIZWF0bWFwCgpgYGB7ciwgZmlnLndpZHRoID0gMTAsIGZpZy5oZWlnaHQgPSA0fQplbnJpY2hwbG90OjpoZWF0cGxvdCgKICB4ID0gZWdvLCAgICAgICAgICAgICAgICAgICAgICAgICAgICMgT3VyIE9SQQogIHNob3dDYXRlZ29yeSA9IHBobG9lbV9uYW1lcywgICAgICAgIyBHZW5lIHNldHMgb2YgaW50ZXJlc3QKICBmb2xkQ2hhbmdlID0gc2V0TmFtZXMobm0gPSBkZV9nZW5lcyRJZCwKICAgICAgICAgICAgICAgICAgICAgICAgZGVfZ2VuZXMkbG9nMkZvbGRDaGFuZ2UpICMgT3VyIGZvbGQgY2hhbmdlcwopCmBgYAoKIyMjIFVwc2V0IHBsb3QKCmBgYHtyLCBmaWcud2lkdGggPSAxNSwgZmlnLmhlaWdodCA9IDV9CmVnbyA9IGVucmljaHBsb3Q6OnBhaXJ3aXNlX3Rlcm1zaW0oZWdvKQoKZW5yaWNocGxvdDo6dXBzZXRwbG90KHggPSBlZ28sICAgICMgT3VyIE9SQQogICAgICAgICAgICAgICAgICAgICAgbiA9IDEwKSAgICAgIyBOYiBvZiB0ZXJtcyB0byBkaXNwbGF5CmBgYAoKIyMjIEdlbmUtY29uY2VwdCBuZXR3b3JrCgpgYGB7ciwgZmlnLndpZHRoID0gMTUsIGZpZy5oZWlnaHQgPSAxNX0KZW5yaWNocGxvdDo6Y25ldHBsb3QoZWdvLAogICAgICAgICAgICAgICAgICAgICBzaG93Q2F0ZWdvcnkgPSBwaGxvZW1fbmFtZXMsCiAgICAgICAgICAgICAgICAgICAgIGZvbGRDaGFuZ2UgPSBzZXROYW1lcyhubSA9IGRlX2dlbmVzJElkLAogICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgZGVfZ2VuZXMkbG9nMkZvbGRDaGFuZ2UpKQpgYGAKCgoKIyMgQ29udmVyc2lvbiBiZXR3ZWVuIGdlbmUgaWRlbnRpZmllcnMKCldoZW4gaW50ZXJhY3Rpbmcgd2l0aCBkYXRhYmFzZXMsIHlvdSBtYXkgbmVlZCBUQUlSIElELCBFbnNlbWJsIElELCBFTlRSRVogSUQsIFVuaVByb3QgSUTigKYgRm9yIGluc3RhbmNlLCB3ZSBjb3VsZCBjb252ZXJ0IFRBSVIgSUQgdG8gRU5UUkVaIElEIGFuZCBnZW5lIHN5bWJvbDoKCmBgYHtyIGFubm90YXRpb259CmFubm90YXRpb24gPSBjbHVzdGVyUHJvZmlsZXI6OmJpdHIoCiAgZ2VuZUlEICAgPSBkZXNlcV9nZW5lcyRJZCwgICAgICAgICAgIyBPdXIgZ2VuZSBsaXN0CiAgZnJvbVR5cGUgPSAiVEFJUiIsICAgICAgICAgICAgICAgICAgIyBXZSBoYXZlIFRBSVIgSUQKICB0b1R5cGUgICA9IGMoIkVOVFJFWklEIiwgIlNZTUJPTCIpLCAjIFdoYXQgd2Ugd2FudAogIE9yZ0RiICAgID0gb3JnLkF0LnRhaXIuZGIpICAgICAgICAgICMgT3VyIGFubm90YXRpb24KCmhlYWQoYW5ub3RhdGlvbikKYGBgCgpXZSBtZXJnZSB0aGlzIGNvcnJlc3BvbmRlbmNlIHRhYmxlIHdpdGhvdXQgb3VyIGRhdGE6CgpgYGB7ciBkZXNlcV9nZW5lc193aXRoX3N5bWJvbH0KZGVzZXFfZ2VuZXNfd2l0aF9zeW1ib2wgPSBtZXJnZSgKICB4ID0gZGVzZXFfZ2VuZXMsCiAgeSA9IGFubm90YXRpb24sCiAgYnkueCA9ICJJZCIsICAgICAgICAjIEluIGRlc2VxX2dlbmVzLCBUQUlSIElEcyBhcmUgc3RvcmVkIGluIHRoZSBJZCBjb2x1bW4KICBieS55ID0gIlRBSVIiKSAgICAgICMgSW4gYW5ub3RhdGlvbiwgVEFJUiBJRHMgYXJlIHN0b3JlZCBpbiB0aGUgVEFJUiBjb2x1bW4KCmhlYWQoZGVzZXFfZ2VuZXNfd2l0aF9zeW1ib2wpCmBgYAoKSXQgbG9va3Mgc2ltaWxhciwgQlVUIG51bWJlciBvZiByb3dzIGRpZmZlcjoKCmBgYHtyIGRpbV9jaGFuZ2VkfQpkaW0oZGVzZXFfZ2VuZXMpCmRpbShkZXNlcV9nZW5lc193aXRoX3N5bWJvbCkKYGBgCgpUaGlzIGlzIGR1ZSB0byAxOm1hbnkgbWFwcGluZzoKCmBgYHtyIG9uZV90d29fbWFueX0KaGVhZChkZXNlcV9nZW5lc193aXRoX3N5bWJvbFssIGMoIklkIiwgIlNZTUJPTCIsICJFTlRSRVpJRCIpXSkKYGBgCgpBbmQgdGhlcmUgYXJlIGFsc28gTkEgdmFsdWVzLCB3aGljaCB3b24ndCBiZSB0YWtlbiBpbnRvIGFjY291bnQgaW4gdGhlIGRvd25zdHJlYW0gYW5hbHlzZXM6CgpgYGB7ciBzdW1tYXJ5X2Rlc2VxX2dlbmVzX3dpdGhfc3ltYm9sX3N5bWJvbH0KdGFibGUoaXMubmEoZGVzZXFfZ2VuZXNfd2l0aF9zeW1ib2wkU1lNQk9MKSkKYGBgCgpgYGB7ciBzdW1tYXJ5X2Rlc2VxX2dlbmVzX3dpdGhfc3ltYm9sX2VudHJlel9pZH0KdGFibGUoaXMubmEoZGVzZXFfZ2VuZXNfd2l0aF9zeW1ib2wkRU5UUkVaSUQpKQpgYGAKCiMjIE9SQSBhbmQgR1NFQSB3aXRoIGEgY3VzdG9tIGRhdGFiYXNlCgoKIyBSIFNlc3Npb24KClRvIGJlIGFibGUgdG8gcmUtcnVuIHRoZSBhbmFseXNpcyBvciB0byB1bmRlcnN0YW5kIHdoeSBvdXRwdXRzIGFyZSBkaWZmZXJlbnQgYmV0d2VlbiB0d28gY29tcGlsYXRpb25zLCBpdCBpcyBpbXBvcnRhbnQgdG8gZGlzcGxheSB0aGUgdmVyc2lvbiBvZiB0aGUgcGFja2FnZXMgd2UgdXNlZDoKCmBgYHtyIHNlc3Npb25pbmZvfQpzZXNzaW9uSW5mbygpCmBgYAoK

Practial Session - Gene Set Analysis

EBAII n1 2025

Environment

Data

Gene identifiers

Over-representation analysis

Explore the GO:BP database

Gene set enrichment analysis

Explore the GO:BP database

Visualize results

Bonus

Visualization

Multiple GSEA curves

Heatmap

Upset plot

Gene-concept network

Conversion between gene identifiers

ORA and GSEA with a custom database

R Session