Objectives

Generate tables of DE results

Understand what a p-value represents.

Understand multiple hypothesis correction application and importance

Differential Expression Workflow

Now we test for differential expression between our groups of interest and return a table of results.

Question

Before we start, what do you think is the most challenging part of a differential expression analysis? Post in the thread on Slack.

Generating DE results

Now that we have reviewed the plots by sample and determined that our data passed our quality control checks, specifically that the patterns we observe are likely due to our experimental treatments over technical or other confounding factors, we can focus on differential expression testing.

This illustration from the HCB training materials illustrates the basis of the differential expression procedure, where our goal is to compare the distribution of an expressed gene across samples in each treatment groups. Image credit: Paul Pavlidis, UBC

Only where the distributions of each group are sufficiently separated will a gene be considered differentially expressed. This is where having sufficient replicates to overcome within group variance is important, as the more replicates we have in each group the better we can determine the distributions of expression for each group.

DESeq2 statistical testing

We have already fit our DESeq2 model, specifying our model as ~ condition and our next step is to identify genes with significantly different expression between our contrasts of interest. To determine significance, a statistical test is required.

The first step for any statistical test is to define the null hypothesis. In this case, the null hypothesis would be that there is no difference in the expression of a gene between two groups of samples, such as illustrated at the bottom of the first figure in this module. The next step is to use a statistical test to determine if, based on the observed data, the null hypothesis can be rejected.

To do this, DESeq2 applies the Wald test to compare between two groups. A Wald test statistic is computed as well as the probability that the observed value or more extreme test statistic would be observed. This probability is called the p-value of the test.

If the p-value is smaller than a pre-defined threshold, we would reject the null hypothesis and state that there is evidence against the null, i.e. the gene is differentially expressed. However, if the p-value is larger than our threshold, we would fail to reject the null hypothesis, meaning that we lack evidence that the expression of this gene is different. Note, this is distinct from the assertion that the expression is the same in both groups.

For a more detailed overview of the statistical comparisons , please refer to this HBC tutorial or the DESeq2 vignette.

Generating results

We can check what comparisons were automatically generated during fitting using the resultsNames() function.

resultsNames(dds)

[1] "Intercept"               "condition_plus_vs_minus"

There is only the one comparison in the results, so we will refer to it in the name parameter of the results() function, and assign the result as an object.

results_plus_vs_minus = results(dds, name = 'condition_plus_vs_minus')
head(results_plus_vs_minus)

log2 fold change (MLE): condition plus vs minus 
Wald test p-value: condition plus vs minus 
DataFrame with 6 rows and 6 columns
                      baseMean log2FoldChange     lfcSE      stat    pvalue      padj
                     <numeric>      <numeric> <numeric> <numeric> <numeric> <numeric>
ENSMUSG00000000001  1489.83039      -0.297760  0.210310 -1.415813  0.156830  0.868577
ENSMUSG00000000028  1748.93544      -0.226421  0.176795 -1.280693  0.200302  0.902896
ENSMUSG00000000031  2151.87715      -0.457628  0.764579 -0.598537  0.549482  0.995389
ENSMUSG00000000037    24.91672      -0.579128  0.561259 -1.031837  0.302148  0.950617
ENSMUSG00000000049     7.78377       0.899490  1.553062  0.579172  0.562473  0.998037
ENSMUSG00000000056 19653.54030       0.174048  0.203529  0.855154  0.392466  0.982477

In the results table, the row names are gene identifiers (in theis case ENSEMBL IDs because that’s what the GTF we used in the call to RSEM+STAR used), and the columns have the following definitions:

baseMean is the average of the normalized count values, divided by size factors and taken over all samples, and can be interpreted as the relative expression level of that gene across all samples.
log2FoldChange is the log2 transformed ratio of the expression of the numerator group (first group) over the denominator group (second group after “vs”). Note that in our comparison, the log2FoldChange column compares the expression of the numerator group (plus) over the denominator group (minus). If the value is positive, that means the expression of that gene is greater across the plus samples than across the minus samples. If the value is negative, that means the expression of that gene is greater across the minus samples.
lfcSE is the standard error for the log2 fold change estimate.
stat is the calculated Wald statistic for that gene.
pvalue is the nominal significance for that gene.
padj is the adjusted p-value and is what we use for determining significantly differently expressed genes.

Note: results() defaults

If no arguments are passed to results(), then the log2 fold changes and Wald test p-value will be for the last variable in the design formula, and if this is a factor, the comparison will be the last level over the reference level. If you specify name, as we did above, then the behavior is given by the name used from resultsNames().

There are multiple ways to specify the test to be done using the results() function. It is especially helpful to know this when fitting more complex models and testing more complex contrasts. To demonstrate this, consider this description from the help for results():

contrast: a character vector with exactly three elements: the name of a factor in the design formula, the name of the numerator level for the fold change, and the name of the denominator level for the fold change

So an alternative way to test the same contrast as above (i.e. plus / minus) is:

alt_results_plus_vs_minus = results(dds, contrast = c('condition', 'plus', 'minus'))
head(alt_results_plus_vs_minus)

log2 fold change (MLE): condition plus vs minus 
Wald test p-value: condition plus vs minus 
DataFrame with 6 rows and 6 columns
                      baseMean log2FoldChange     lfcSE      stat    pvalue      padj
                     <numeric>      <numeric> <numeric> <numeric> <numeric> <numeric>
ENSMUSG00000000001  1489.83039      -0.297760  0.210310 -1.415813  0.156830  0.868577
ENSMUSG00000000028  1748.93544      -0.226421  0.176795 -1.280693  0.200302  0.902896
ENSMUSG00000000031  2151.87715      -0.457628  0.764579 -0.598537  0.549482  0.995389
ENSMUSG00000000037    24.91672      -0.579128  0.561259 -1.031837  0.302148  0.950617
ENSMUSG00000000049     7.78377       0.899490  1.553062  0.579172  0.562473  0.998037
ENSMUSG00000000056 19653.54030       0.174048  0.203529  0.855154  0.392466  0.982477

This way of calling results() is especially helpful when the levels of the column of interest contain more than two levels because you can specify exactly which levels to test with little confusion.

Question

Why should we use values from this column instead of the ‘pvalue’ column? Post in the Slack thread.

Multiple hypothesis testing and FDR correction

Each p-value is the result of a single test for a single gene. If we used the p-value directly from the Wald test with a significance cut-off of p < 0.05, that means there is a 5% chance it is a false positives.

The more genes we test, the greater chance we have of seeing a significant results. So if we are testing 20,000 genes for differential expression, we would expect to see ~1,000 significant genes just by chance.

This is the multiple testing problem and is problematic because we would need to sift through our “significant” genes to identify which ones are true positives.

To address this we need to correct for multiple hypothesis testing to reduce the number of false positives, and while there are a few common approaches, the default method is False Discovery Rate(FDR) (aka: Benjamini-Hochberg correction) which is symbolized as ‘BH’ in DESeq2.

Benjamini and Hochberg (1995) defined the concept of FDR and created an algorithm to control it below a specified level. An interpretation of the BH method is implemented in DESeq2 in which genes are ranked by p-value, then each ranked p-value is multiplied by the number of total tests divided by rank.

Note: From the results function help page and HBC tutorial that includes overview of multiple hypothesis correction, we can change the multiple hypothesis correction method to an alternative option using the pAdjustMethod = argument.

The default FDR rate cutoff for DESeq2 is alpha = 0.05. By setting the cutoff to < 0.05, we expect that the proportion of false positives amongst our differentially expressed genes is now controlled to 5%. For example, if we call 500 genes as differentially expressed with this FDR cutoff, we expect only 25 of them to be false positives. DESeq2 vignette’s includes a further discussion of filtering and multiple testing

Note on padj values set to NA

As discussed in the HBC tutorial as well as the DESeq2 vignette, DESeq2 reduces the number of genes that will be tested by removing genes with low number of counts and outlier samples.

If within a row, all samples have zero counts, the baseMean column will be zero, and the log2 fold change estimates, p-value and adjusted p-value will all be set to NA.

If a row contains a sample with an extreme count outlier then the p-value and adjusted p-value will be set to NA. These outlier counts are detected by Cook’s distance.

If a row is filtered by automatic independent filtering, e.g. for having a low mean normalized count, then only the adjusted p-value will be set to NA.

Now that we’ve generated our differential comparisons and have an understanding of our results, including multiple hypothesis correction, we can proceed with generating summary figures and tables for our differential expression analysis.

Summary

In this section, we:

Performed statistical tests for comparisons of interest
Generated tables of differential expression results - i.e. fold changes and adjusted pvalues for each gene in dataset
Discussed importance and application of multiple hypothesis correction

Sources

HBC DGE training module, part 1: https://hbctraining.github.io/DGE_workshop/lessons/04_DGE_DESeq2_analysis.html
HBC DGE training module, part 2: https://hbctraining.github.io/DGE_workshop/lessons/05_DGE_DESeq2_analysis2.html
DESeq2 vignette: http://bioconductor.org/packages/devel/bioc/vignettes/DESeq2/inst/doc/DESeq2.html#differential-expression-analysis

These materials have been adapted and extended from materials listed above. These are open access materials distributed under the terms of the Creative Commons Attribution license (CC BY 4.0), which permits unrestricted use, distribution, and reproduction in any medium, provided the original author and source are credited.

LS0tCnRpdGxlOiAiTW9kdWxlIDEwOiBEaWZmZXJlbnRpYWwgRXhwcmVzc2lvbiBSZXN1bHRzIgphdXRob3I6ICJVTSBCaW9pbmZvcm1hdGljcyBDb3JlIgpkYXRlOiAiYHIgU3lzLkRhdGUoKWAiCm91dHB1dDoKICAgICAgICBodG1sX2RvY3VtZW50OgogICAgICAgICAgICBpbmNsdWRlczoKICAgICAgICAgICAgICAgIGluX2hlYWRlcjogaGVhZGVyLmh0bWwKICAgICAgICAgICAgdGhlbWU6IHBhcGVyCiAgICAgICAgICAgIHRvYzogdHJ1ZQogICAgICAgICAgICB0b2NfZGVwdGg6IDQKICAgICAgICAgICAgdG9jX2Zsb2F0OiB0cnVlCiAgICAgICAgICAgIG51bWJlcl9zZWN0aW9uczogZmFsc2UKICAgICAgICAgICAgZmlnX2NhcHRpb246IHRydWUKICAgICAgICAgICAgbWFya2Rvd246IEdGTQogICAgICAgICAgICBjb2RlX2Rvd25sb2FkOiB0cnVlCi0tLQoKPHN0eWxlIHR5cGU9InRleHQvY3NzIj4KYm9keSwgdGQgewogICBmb250LXNpemU6IDE4cHg7Cn0KY29kZS5yewogIGZvbnQtc2l6ZTogMTJweDsKfQpwcmUgewogIGZvbnQtc2l6ZTogMTJweAp9Cjwvc3R5bGU+CgpgYGB7ciwgaW5jbHVkZSA9IEZBTFNFfQpzb3VyY2UoIi4uL2Jpbi9jaHVuay1vcHRpb25zLlIiKQprbml0cl9maWdfcGF0aCgiMTAtIikKYGBgCgo+ICMgT2JqZWN0aXZlcyB7LnVubGlzdGVkIC51bm51bWJlcmVkfQo+ICogR2VuZXJhdGUgdGFibGVzIG9mIERFIHJlc3VsdHMKPiAqIFVuZGVyc3RhbmQgd2hhdCBhIHAtdmFsdWUgcmVwcmVzZW50cy4KPiAqIFVuZGVyc3RhbmQgbXVsdGlwbGUgaHlwb3RoZXNpcyBjb3JyZWN0aW9uIGFwcGxpY2F0aW9uIGFuZCBpbXBvcnRhbmNlCgoKYGBge3IgTW9kdWxlcywgZXZhbD1UUlVFLCBlY2hvPUZBTFNFLCBtZXNzYWdlPUZBTFNFLCB3YXJuaW5nPUZBTFNFfQpsaWJyYXJ5KERFU2VxMikKbGlicmFyeSh0aWR5cikKbGlicmFyeShkcGx5cikKIyBsb2FkKCJyZGF0YS9SdW5uaW5nRGF0YS5SRGF0YSIpCmBgYAoKIyBEaWZmZXJlbnRpYWwgRXhwcmVzc2lvbiBXb3JrZmxvdyB7LnVubGlzdGVkIC51bm51bWJlcmVkfQoKTm93IHdlIHRlc3QgZm9yIGRpZmZlcmVudGlhbCBleHByZXNzaW9uIGJldHdlZW4gb3VyIGdyb3VwcyBvZiBpbnRlcmVzdCBhbmQgcmV0dXJuIGEgdGFibGUgb2YgcmVzdWx0cy4KCiFbXSguL2ltYWdlcy93YXlmaW5kZXIvd2F5ZmluZGVyLTEwLnBuZyl7d2lkdGg9NzUlfQoKLS0tCgo+ICMgUXVlc3Rpb24gey51bmxpc3RlZCAudW5udW1iZXJlZH0KPiBCZWZvcmUgd2Ugc3RhcnQsIHdoYXQgZG8geW91IHRoaW5rIGlzIHRoZSBtb3N0IGNoYWxsZW5naW5nIHBhcnQgb2YgYSBkaWZmZXJlbnRpYWwgZXhwcmVzc2lvbiBhbmFseXNpcz8gUG9zdCBpbiB0aGUgdGhyZWFkIG9uIFNsYWNrLgoKIyBHZW5lcmF0aW5nIERFIHJlc3VsdHMKCk5vdyB0aGF0IHdlIGhhdmUgcmV2aWV3ZWQgdGhlIHBsb3RzIGJ5IHNhbXBsZSBhbmQgZGV0ZXJtaW5lZCB0aGF0IG91ciBkYXRhIHBhc3NlZCBvdXIgcXVhbGl0eSBjb250cm9sIGNoZWNrcywgc3BlY2lmaWNhbGx5IHRoYXQgdGhlIHBhdHRlcm5zIHdlIG9ic2VydmUgYXJlIGxpa2VseSBkdWUgdG8gb3VyIGV4cGVyaW1lbnRhbCB0cmVhdG1lbnRzIG92ZXIgdGVjaG5pY2FsIG9yIG90aGVyIGNvbmZvdW5kaW5nIGZhY3RvcnMsIHdlIGNhbiBmb2N1cyBvbiBkaWZmZXJlbnRpYWwgZXhwcmVzc2lvbiB0ZXN0aW5nLgoKVGhpcyBpbGx1c3RyYXRpb24gZnJvbSB0aGUgSENCIHRyYWluaW5nIG1hdGVyaWFscyBpbGx1c3RyYXRlcyB0aGUgYmFzaXMgb2YgdGhlIGRpZmZlcmVudGlhbCBleHByZXNzaW9uIHByb2NlZHVyZSwgd2hlcmUgb3VyIGdvYWwgaXMgdG8gY29tcGFyZSB0aGUgZGlzdHJpYnV0aW9uIG9mIGFuIGV4cHJlc3NlZCBnZW5lIGFjcm9zcyBzYW1wbGVzIGluIGVhY2ggdHJlYXRtZW50IGdyb3Vwcy4KIVsqSW1hZ2UgY3JlZGl0OiBQYXVsIFBhdmxpZGlzLCBVQkMqXSguL2ltYWdlcy9kZV90aGVvcnlfY29ycmVjdGVkLnBuZykKCk9ubHkgd2hlcmUgdGhlIGRpc3RyaWJ1dGlvbnMgb2YgZWFjaCBncm91cCBhcmUgc3VmZmljaWVudGx5IHNlcGFyYXRlZCB3aWxsIGEgZ2VuZSBiZSBjb25zaWRlcmVkIGRpZmZlcmVudGlhbGx5IGV4cHJlc3NlZC4gVGhpcyBpcyB3aGVyZSBoYXZpbmcgc3VmZmljaWVudCByZXBsaWNhdGVzIHRvIG92ZXJjb21lIHdpdGhpbiBncm91cCB2YXJpYW5jZSBpcyBpbXBvcnRhbnQsIGFzIHRoZSBtb3JlIHJlcGxpY2F0ZXMgd2UgaGF2ZSBpbiBlYWNoIGdyb3VwIHRoZSBiZXR0ZXIgd2UgY2FuIGRldGVybWluZSB0aGUgZGlzdHJpYnV0aW9ucyBvZiBleHByZXNzaW9uIGZvciBlYWNoIGdyb3VwLgoKIyMgREVTZXEyIHN0YXRpc3RpY2FsIHRlc3RpbmcKCldlIGhhdmUgYWxyZWFkeSBmaXQgb3VyIERFU2VxMiBtb2RlbCwgc3BlY2lmeWluZyBvdXIgbW9kZWwgYXMgYH4gY29uZGl0aW9uYCBhbmQgb3VyIG5leHQgc3RlcCBpcyB0byBpZGVudGlmeSBnZW5lcyB3aXRoIHNpZ25pZmljYW50bHkgZGlmZmVyZW50IGV4cHJlc3Npb24gYmV0d2VlbiBvdXIgY29udHJhc3RzIG9mIGludGVyZXN0LiBUbyBkZXRlcm1pbmUgc2lnbmlmaWNhbmNlLCBhIHN0YXRpc3RpY2FsIHRlc3QgaXMgcmVxdWlyZWQuCgpUaGUgZmlyc3Qgc3RlcCBmb3IgYW55IHN0YXRpc3RpY2FsIHRlc3QgaXMgdG8gZGVmaW5lIHRoZSAqbnVsbCBoeXBvdGhlc2lzKi4gSW4gdGhpcyBjYXNlLCB0aGUgbnVsbCBoeXBvdGhlc2lzIHdvdWxkIGJlIHRoYXQgdGhlcmUgaXMgbm8gZGlmZmVyZW5jZSBpbiB0aGUgZXhwcmVzc2lvbiBvZiBhIGdlbmUgYmV0d2VlbiB0d28gZ3JvdXBzIG9mIHNhbXBsZXMsIHN1Y2ggYXMgaWxsdXN0cmF0ZWQgYXQgdGhlIGJvdHRvbSBvZiB0aGUgZmlyc3QgZmlndXJlIGluIHRoaXMgbW9kdWxlLiBUaGUgbmV4dCBzdGVwIGlzIHRvIHVzZSBhIHN0YXRpc3RpY2FsIHRlc3QgdG8gZGV0ZXJtaW5lIGlmLCBiYXNlZCBvbiB0aGUgb2JzZXJ2ZWQgZGF0YSwgdGhlIG51bGwgaHlwb3RoZXNpcyBjYW4gYmUgcmVqZWN0ZWQuCgpUbyBkbyB0aGlzLCBbREVTZXEyIGFwcGxpZXMgdGhlIFdhbGQgdGVzdF0oaHR0cDovL2Jpb2NvbmR1Y3Rvci5vcmcvcGFja2FnZXMvZGV2ZWwvYmlvYy92aWduZXR0ZXMvREVTZXEyL2luc3QvZG9jL0RFU2VxMi5odG1sI3RoZW9yeS1iZWhpbmQtZGVzZXEyKSB0byBjb21wYXJlIGJldHdlZW4gdHdvIGdyb3Vwcy4gQSBXYWxkIHRlc3Qgc3RhdGlzdGljIGlzIGNvbXB1dGVkIGFzIHdlbGwgYXMgdGhlIHByb2JhYmlsaXR5IHRoYXQgdGhlIG9ic2VydmVkIHZhbHVlIG9yIG1vcmUgZXh0cmVtZSB0ZXN0IHN0YXRpc3RpYyB3b3VsZCBiZSBvYnNlcnZlZC4gVGhpcyBwcm9iYWJpbGl0eSBpcyBjYWxsZWQgdGhlIHAtdmFsdWUgb2YgdGhlIHRlc3QuCgpJZiB0aGUgcC12YWx1ZSBpcyBzbWFsbGVyIHRoYW4gYSBwcmUtZGVmaW5lZCB0aHJlc2hvbGQsIHdlIHdvdWxkIHJlamVjdCB0aGUgbnVsbCBoeXBvdGhlc2lzIGFuZCBzdGF0ZSB0aGF0IHRoZXJlIGlzIGV2aWRlbmNlIGFnYWluc3QgdGhlIG51bGwsIGkuZS4gdGhlIGdlbmUgaXMgZGlmZmVyZW50aWFsbHkgZXhwcmVzc2VkLiBIb3dldmVyLCBpZiB0aGUgcC12YWx1ZSBpcyBsYXJnZXIgdGhhbiBvdXIgdGhyZXNob2xkLCB3ZSB3b3VsZCAqZmFpbCB0byByZWplY3QqIHRoZSBudWxsIGh5cG90aGVzaXMsIG1lYW5pbmcgdGhhdCB3ZSBsYWNrIGV2aWRlbmNlIHRoYXQgdGhlIGV4cHJlc3Npb24gb2YgdGhpcyBnZW5lIGlzIGRpZmZlcmVudC4gTm90ZSwgdGhpcyBpcyBkaXN0aW5jdCBmcm9tIHRoZSBhc3NlcnRpb24gdGhhdCB0aGUgZXhwcmVzc2lvbiBpcyB0aGUgc2FtZSBpbiBib3RoIGdyb3Vwcy4KCkZvciBhIG1vcmUgZGV0YWlsZWQgb3ZlcnZpZXcgb2YgdGhlIHN0YXRpc3RpY2FsIGNvbXBhcmlzb25zICwgcGxlYXNlIHJlZmVyIHRvIFt0aGlzIEhCQyB0dXRvcmlhbF0oaHR0cHM6Ly9oYmN0cmFpbmluZy5naXRodWIuaW8vREdFX3dvcmtzaG9wL2xlc3NvbnMvMDVfREdFX0RFU2VxMl9hbmFseXNpczIuaHRtbCkgb3IgdGhlIFtERVNlcTIgdmlnbmV0dGVdKGh0dHA6Ly9iaW9jb25kdWN0b3Iub3JnL3BhY2thZ2VzL2RldmVsL2Jpb2MvdmlnbmV0dGVzL0RFU2VxMi9pbnN0L2RvYy9ERVNlcTIuaHRtbCN0aGVvcnktYmVoaW5kLWRlc2VxMikuCgojIyBHZW5lcmF0aW5nIHJlc3VsdHMKCldlIGNhbiBjaGVjayB3aGF0IGNvbXBhcmlzb25zIHdlcmUgYXV0b21hdGljYWxseSBnZW5lcmF0ZWQgZHVyaW5nIGZpdHRpbmcgdXNpbmcgdGhlIGByZXN1bHRzTmFtZXMoKWAgZnVuY3Rpb24uCmBgYHtyIFJlc3VsdHMxfQpyZXN1bHRzTmFtZXMoZGRzKQpgYGAKClRoZXJlIGlzIG9ubHkgdGhlIG9uZSBjb21wYXJpc29uIGluIHRoZSByZXN1bHRzLCBzbyB3ZSB3aWxsIHJlZmVyIHRvIGl0IGluIHRoZSBgbmFtZWAgcGFyYW1ldGVyIG9mIHRoZSBgcmVzdWx0cygpYCBmdW5jdGlvbiwgYW5kIGFzc2lnbiB0aGUgcmVzdWx0IGFzIGFuIG9iamVjdC4KCmBgYHtyIFNldHNSZXN1bHR9CnJlc3VsdHNfcGx1c192c19taW51cyA9IHJlc3VsdHMoZGRzLCBuYW1lID0gJ2NvbmRpdGlvbl9wbHVzX3ZzX21pbnVzJykKaGVhZChyZXN1bHRzX3BsdXNfdnNfbWludXMpCmBgYAoKSW4gdGhlIHJlc3VsdHMgdGFibGUsIHRoZSByb3cgbmFtZXMgYXJlIGdlbmUgaWRlbnRpZmllcnMgKGluIHRoZWlzIGNhc2UgRU5TRU1CTCBJRHMgYmVjYXVzZSB0aGF0J3Mgd2hhdCB0aGUgR1RGIHdlIHVzZWQgaW4gdGhlIGNhbGwgdG8gUlNFTStTVEFSIHVzZWQpLCBhbmQgdGhlIGNvbHVtbnMgaGF2ZSB0aGUgZm9sbG93aW5nIGRlZmluaXRpb25zOgoKMS4gYGJhc2VNZWFuYCBpcyB0aGUgYXZlcmFnZSBvZiB0aGUgbm9ybWFsaXplZCBjb3VudCB2YWx1ZXMsIGRpdmlkZWQgYnkgc2l6ZSBmYWN0b3JzIGFuZCB0YWtlbiBvdmVyIGFsbCBzYW1wbGVzLCBhbmQgY2FuIGJlIGludGVycHJldGVkIGFzIHRoZSByZWxhdGl2ZSBleHByZXNzaW9uIGxldmVsIG9mIHRoYXQgZ2VuZSBhY3Jvc3MgYWxsIHNhbXBsZXMuCjIuIGBsb2cyRm9sZENoYW5nZWAgaXMgdGhlIGxvZzIgdHJhbnNmb3JtZWQgcmF0aW8gb2YgdGhlIGV4cHJlc3Npb24gb2YgdGhlIG51bWVyYXRvciBncm91cCAoZmlyc3QgZ3JvdXApIG92ZXIgdGhlIGRlbm9taW5hdG9yIGdyb3VwIChzZWNvbmQgZ3JvdXAgYWZ0ZXIgInZzIikuIE5vdGUgdGhhdCBpbiBvdXIgY29tcGFyaXNvbiwgdGhlIGBsb2cyRm9sZENoYW5nZWAgY29sdW1uIGNvbXBhcmVzIHRoZSBleHByZXNzaW9uIG9mIHRoZSBudW1lcmF0b3IgZ3JvdXAgKGBwbHVzYCkgb3ZlciB0aGUgZGVub21pbmF0b3IgZ3JvdXAgKGBtaW51c2ApLiBJZiB0aGUgdmFsdWUgaXMgcG9zaXRpdmUsIHRoYXQgbWVhbnMgdGhlIGV4cHJlc3Npb24gb2YgdGhhdCBnZW5lIGlzIGdyZWF0ZXIgYWNyb3NzIHRoZSBgcGx1c2Agc2FtcGxlcyB0aGFuIGFjcm9zcyB0aGUgYG1pbnVzYCBzYW1wbGVzLiBJZiB0aGUgdmFsdWUgaXMgbmVnYXRpdmUsIHRoYXQgbWVhbnMgdGhlIGV4cHJlc3Npb24gb2YgdGhhdCBnZW5lIGlzIGdyZWF0ZXIgYWNyb3NzIHRoZSBgbWludXNgIHNhbXBsZXMuCjMuIGBsZmNTRWAgaXMgdGhlIHN0YW5kYXJkIGVycm9yIGZvciB0aGUgbG9nMiBmb2xkIGNoYW5nZSBlc3RpbWF0ZS4KNC4gYHN0YXRgIGlzIHRoZSBjYWxjdWxhdGVkIFdhbGQgc3RhdGlzdGljIGZvciB0aGF0IGdlbmUuCjUuIGBwdmFsdWVgIGlzIHRoZSAqbm9taW5hbCogc2lnbmlmaWNhbmNlIGZvciB0aGF0IGdlbmUuCjYuIGBwYWRqYCBpcyB0aGUgKmFkanVzdGVkIHAtdmFsdWUqIGFuZCBpcyB3aGF0IHdlIHVzZSBmb3IgZGV0ZXJtaW5pbmcgc2lnbmlmaWNhbnRseSBkaWZmZXJlbnRseSBleHByZXNzZWQgZ2VuZXMuCgo+ICMgTm90ZTogYHJlc3VsdHMoKWAgZGVmYXVsdHMgey51bmxpc3RlZCAudW5udW1iZXJlZH0KPiBJZiBubyBhcmd1bWVudHMgYXJlIHBhc3NlZCB0byBgcmVzdWx0cygpYCwgdGhlbiB0aGUgbG9nMiBmb2xkIGNoYW5nZXMgYW5kIFdhbGQgdGVzdCBwLXZhbHVlIHdpbGwgYmUgZm9yIHRoZSAqKmxhc3QgdmFyaWFibGUqKiBpbiB0aGUgZGVzaWduIGZvcm11bGEsIGFuZCBpZiB0aGlzIGlzIGEgZmFjdG9yLCB0aGUgY29tcGFyaXNvbiB3aWxsIGJlIHRoZSAqKmxhc3QgbGV2ZWwqKiBvdmVyIHRoZSAqKnJlZmVyZW5jZSBsZXZlbCoqLiBJZiB5b3Ugc3BlY2lmeSBgbmFtZWAsIGFzIHdlIGRpZCBhYm92ZSwgdGhlbiB0aGUgYmVoYXZpb3IgaXMgZ2l2ZW4gYnkgdGhlIG5hbWUgdXNlZCBmcm9tIGByZXN1bHRzTmFtZXMoKWAuCgpUaGVyZSBhcmUgbXVsdGlwbGUgd2F5cyB0byBzcGVjaWZ5IHRoZSB0ZXN0IHRvIGJlIGRvbmUgdXNpbmcgdGhlIGByZXN1bHRzKClgIGZ1bmN0aW9uLiBJdCBpcyBlc3BlY2lhbGx5IGhlbHBmdWwgdG8ga25vdyB0aGlzIHdoZW4gZml0dGluZyBtb3JlIGNvbXBsZXggbW9kZWxzIGFuZCB0ZXN0aW5nIG1vcmUgY29tcGxleCBjb250cmFzdHMuIFRvIGRlbW9uc3RyYXRlIHRoaXMsIGNvbnNpZGVyIHRoaXMgZGVzY3JpcHRpb24gZnJvbSB0aGUgaGVscCBmb3IgYHJlc3VsdHMoKWA6Cgo+IGBjb250cmFzdGA6IGEgY2hhcmFjdGVyIHZlY3RvciB3aXRoIGV4YWN0bHkgdGhyZWUgZWxlbWVudHM6IHRoZSBuYW1lIG9mIGEgZmFjdG9yIGluIHRoZSBkZXNpZ24gZm9ybXVsYSwgdGhlIG5hbWUgb2YgdGhlIG51bWVyYXRvciBsZXZlbCBmb3IgdGhlIGZvbGQgY2hhbmdlLCBhbmQgdGhlIG5hbWUgb2YgdGhlIGRlbm9taW5hdG9yIGxldmVsIGZvciB0aGUgZm9sZCBjaGFuZ2UKClNvIGFuIGFsdGVybmF0aXZlIHdheSB0byB0ZXN0IHRoZSBzYW1lIGNvbnRyYXN0IGFzIGFib3ZlIChpLmUuIGBwbHVzYCAvIGBtaW51c2ApIGlzOgoKYGBge3IgU2V0c1Jlc3VsdHNBbHR9CmFsdF9yZXN1bHRzX3BsdXNfdnNfbWludXMgPSByZXN1bHRzKGRkcywgY29udHJhc3QgPSBjKCdjb25kaXRpb24nLCAncGx1cycsICdtaW51cycpKQpoZWFkKGFsdF9yZXN1bHRzX3BsdXNfdnNfbWludXMpCmBgYAoKVGhpcyB3YXkgb2YgY2FsbGluZyBgcmVzdWx0cygpYCBpcyBlc3BlY2lhbGx5IGhlbHBmdWwgd2hlbiB0aGUgbGV2ZWxzIG9mIHRoZSBjb2x1bW4gb2YgaW50ZXJlc3QgY29udGFpbiBtb3JlIHRoYW4gdHdvIGxldmVscyBiZWNhdXNlIHlvdSBjYW4gc3BlY2lmeSBleGFjdGx5IHdoaWNoIGxldmVscyB0byB0ZXN0IHdpdGggbGl0dGxlIGNvbmZ1c2lvbi4KCj4gIyBRdWVzdGlvbiB7LnVubGlzdGVkIC51bm51bWJlcmVkfQo+IFdoeSBzaG91bGQgd2UgdXNlIHZhbHVlcyBmcm9tIHRoaXMgY29sdW1uIGluc3RlYWQgb2YgdGhlICdwdmFsdWUnIGNvbHVtbj8gUG9zdCBpbiB0aGUgU2xhY2sgdGhyZWFkLgoKIyMjIE11bHRpcGxlIGh5cG90aGVzaXMgdGVzdGluZyBhbmQgRkRSIGNvcnJlY3Rpb24KCkVhY2ggcC12YWx1ZSBpcyB0aGUgcmVzdWx0IG9mIGEgc2luZ2xlIHRlc3QgZm9yIGEgc2luZ2xlIGdlbmUuIElmIHdlIHVzZWQgdGhlIHAtdmFsdWUgZGlyZWN0bHkgZnJvbSB0aGUgV2FsZCB0ZXN0IHdpdGggYSBzaWduaWZpY2FuY2UgY3V0LW9mZiBvZiBwIDwgMC4wNSwgdGhhdCBtZWFucyB0aGVyZSBpcyBhIDUlIGNoYW5jZSBpdCBpcyBhIGZhbHNlIHBvc2l0aXZlcy4KClRoZSBtb3JlIGdlbmVzIHdlIHRlc3QsIHRoZSBncmVhdGVyIGNoYW5jZSB3ZSBoYXZlIG9mIHNlZWluZyBhIHNpZ25pZmljYW50IHJlc3VsdHMuIFNvIGlmIHdlIGFyZSB0ZXN0aW5nIDIwLDAwMCBnZW5lcyBmb3IgZGlmZmVyZW50aWFsIGV4cHJlc3Npb24sIHdlIHdvdWxkIGV4cGVjdCB0byBzZWUgfjEsMDAwIHNpZ25pZmljYW50IGdlbmVzIGp1c3QgYnkgY2hhbmNlLgoKVGhpcyBpcyB0aGUgbXVsdGlwbGUgdGVzdGluZyBwcm9ibGVtIGFuZCBpcyBwcm9ibGVtYXRpYyBiZWNhdXNlIHdlIHdvdWxkIG5lZWQgdG8gc2lmdCB0aHJvdWdoIG91ciDigJxzaWduaWZpY2FudOKAnSBnZW5lcyB0byBpZGVudGlmeSB3aGljaCBvbmVzIGFyZSB0cnVlIHBvc2l0aXZlcy4KClRvIGFkZHJlc3MgdGhpcyB3ZSBuZWVkIHRvIGNvcnJlY3QgZm9yIFttdWx0aXBsZSBoeXBvdGhlc2lzIHRlc3RpbmddKGh0dHBzOi8vbXVsdGl0aHJlYWRlZC5zdGl0Y2hmaXguY29tL2Jsb2cvMjAxNS8xMC8xNS9tdWx0aXBsZS1oeXBvdGhlc2lzLXRlc3RpbmcvKSB0byByZWR1Y2UgdGhlIG51bWJlciBvZiBmYWxzZSBwb3NpdGl2ZXMsIGFuZCB3aGlsZSB0aGVyZSBhcmUgYSBmZXcgY29tbW9uIGFwcHJvYWNoZXMsIHRoZSBkZWZhdWx0IG1ldGhvZCBpcyBGYWxzZSBEaXNjb3ZlcnkgUmF0ZShGRFIpIChha2E6IEJlbmphbWluaS1Ib2NoYmVyZyBjb3JyZWN0aW9uKSB3aGljaCBpcyBzeW1ib2xpemVkIGFzICdCSCcgaW4gREVTZXEyLgoKW0JlbmphbWluaSBhbmQgSG9jaGJlcmcgKDE5OTUpXShodHRwczovL3Jzcy5vbmxpbmVsaWJyYXJ5LndpbGV5LmNvbS9kb2kvMTAuMTExMS9qLjI1MTctNjE2MS4xOTk1LnRiMDIwMzEueCkgZGVmaW5lZCB0aGUgY29uY2VwdCBvZiBGRFIgYW5kIGNyZWF0ZWQgYW4gYWxnb3JpdGhtIHRvIGNvbnRyb2wgaXQgYmVsb3cgYSBzcGVjaWZpZWQgbGV2ZWwuIEFuIGludGVycHJldGF0aW9uIG9mIHRoZSBCSCBtZXRob2QgaXMgaW1wbGVtZW50ZWQgaW4gREVTZXEyIGluIHdoaWNoIGdlbmVzIGFyZSByYW5rZWQgYnkgcC12YWx1ZSwgdGhlbiBlYWNoIHJhbmtlZCBwLXZhbHVlIGlzIG11bHRpcGxpZWQgYnkgdGhlIG51bWJlciBvZiB0b3RhbCB0ZXN0cyBkaXZpZGVkIGJ5IHJhbmsuCgoqKk5vdGUqKjogRnJvbSB0aGUgYHJlc3VsdHNgIGZ1bmN0aW9uIGhlbHAgcGFnZSBhbmQgW0hCQyB0dXRvcmlhbCB0aGF0IGluY2x1ZGVzIG92ZXJ2aWV3IG9mIG11bHRpcGxlIGh5cG90aGVzaXMgY29ycmVjdGlvbl0oaHR0cHM6Ly9oYmN0cmFpbmluZy5naXRodWIuaW8vREdFX3dvcmtzaG9wL2xlc3NvbnMvMDVfREdFX0RFU2VxMl9hbmFseXNpczIuaHRtbCksIHdlIGNhbiBjaGFuZ2UgdGhlIG11bHRpcGxlIGh5cG90aGVzaXMgY29ycmVjdGlvbiBtZXRob2QgdG8gYW4gYWx0ZXJuYXRpdmUgb3B0aW9uIHVzaW5nIHRoZSBgcEFkanVzdE1ldGhvZCA9YCBhcmd1bWVudC4KClRoZSBkZWZhdWx0IEZEUiByYXRlIGN1dG9mZiBmb3IgREVTZXEyIGlzIGBhbHBoYSA9IDAuMDVgLiBCeSBzZXR0aW5nIHRoZSBjdXRvZmYgdG8gPCAwLjA1LCB3ZSBleHBlY3QgdGhhdCB0aGUgcHJvcG9ydGlvbiBvZiBmYWxzZSBwb3NpdGl2ZXMgYW1vbmdzdCBvdXIgZGlmZmVyZW50aWFsbHkgZXhwcmVzc2VkIGdlbmVzIGlzIG5vdyBjb250cm9sbGVkIHRvIDUlLiBGb3IgZXhhbXBsZSwgaWYgd2UgY2FsbCA1MDAgZ2VuZXMgYXMgZGlmZmVyZW50aWFsbHkgZXhwcmVzc2VkIHdpdGggdGhpcyBGRFIgY3V0b2ZmLCB3ZSBleHBlY3Qgb25seSAyNSBvZiB0aGVtIHRvIGJlIGZhbHNlIHBvc2l0aXZlcy4gREVTZXEyIHZpZ25ldHRlJ3MgaW5jbHVkZXMgYSBbZnVydGhlciBkaXNjdXNzaW9uIG9mIGZpbHRlcmluZyBhbmQgbXVsdGlwbGUgdGVzdGluZ10oaHR0cDovL2Jpb2NvbmR1Y3Rvci5vcmcvcGFja2FnZXMvZGV2ZWwvYmlvYy92aWduZXR0ZXMvREVTZXEyL2luc3QvZG9jL0RFU2VxMi5odG1sI2luZGVwZW5kZW50LWZpbHRlcmluZy1hbmQtbXVsdGlwbGUtdGVzdGluZykKCj4gIyBOb3RlIG9uIGBwYWRqYCB2YWx1ZXMgc2V0IHRvIE5BIHsudW5saXN0ZWQgLnVubnVtYmVyZWR9Cj4KPiBBcyBkaXNjdXNzZWQgaW4gdGhlIFtIQkMgdHV0b3JpYWxdKGh0dHBzOi8vaGJjdHJhaW5pbmcuZ2l0aHViLmlvL0RHRV93b3Jrc2hvcC9sZXNzb25zLzA1X0RHRV9ERVNlcTJfYW5hbHlzaXMyLmh0bWwpIGFzIHdlbGwgYXMgdGhlIFtERVNlcTIgdmlnbmV0dGVdKGh0dHA6Ly9iaW9jb25kdWN0b3Iub3JnL3BhY2thZ2VzL2RldmVsL2Jpb2MvdmlnbmV0dGVzL0RFU2VxMi9pbnN0L2RvYy9ERVNlcTIuaHRtbCNpLXdhbnQtdG8tYmVuY2htYXJrLWRlc2VxMi1jb21wYXJpbmctdG8tb3RoZXItZGUtdG9vbHMuKSwgREVTZXEyIHJlZHVjZXMgdGhlIG51bWJlciBvZiBnZW5lcyB0aGF0IHdpbGwgYmUgdGVzdGVkIGJ5IHJlbW92aW5nIGdlbmVzIHdpdGggbG93IG51bWJlciBvZiBjb3VudHMgYW5kIG91dGxpZXIgc2FtcGxlcy4KPgo+ICogSWYgd2l0aGluIGEgcm93LCBhbGwgc2FtcGxlcyBoYXZlIHplcm8gY291bnRzLCB0aGUgYmFzZU1lYW4gY29sdW1uIHdpbGwgYmUgemVybywgYW5kIHRoZSBsb2cyIGZvbGQgY2hhbmdlIGVzdGltYXRlcywgcC12YWx1ZSBhbmQgYWRqdXN0ZWQgcC12YWx1ZSB3aWxsIGFsbCBiZSBzZXQgdG8gTkEuCj4gKiBJZiBhIHJvdyBjb250YWlucyBhIHNhbXBsZSB3aXRoIGFuIGV4dHJlbWUgY291bnQgb3V0bGllciB0aGVuIHRoZSBwLXZhbHVlIGFuZCBhZGp1c3RlZCBwLXZhbHVlIHdpbGwgYmUgc2V0IHRvIE5BLiBUaGVzZSBvdXRsaWVyIGNvdW50cyBhcmUgZGV0ZWN0ZWQgYnkgW0Nvb2vigJlzIGRpc3RhbmNlXShodHRwczovL2VuLndpa2lwZWRpYS5vcmcvd2lraS9Db29rJTI3c19kaXN0YW5jZSkuCj4gKiBJZiBhIHJvdyBpcyBmaWx0ZXJlZCBieSBhdXRvbWF0aWMgaW5kZXBlbmRlbnQgZmlsdGVyaW5nLCBlLmcuIGZvciBoYXZpbmcgYSBsb3cgbWVhbiBub3JtYWxpemVkIGNvdW50LCB0aGVuIG9ubHkgdGhlIGFkanVzdGVkIHAtdmFsdWUgd2lsbCBiZSBzZXQgdG8gTkEuCgpOb3cgdGhhdCB3ZSd2ZSBnZW5lcmF0ZWQgb3VyIGRpZmZlcmVudGlhbCBjb21wYXJpc29ucyBhbmQgaGF2ZSBhbiB1bmRlcnN0YW5kaW5nIG9mIG91ciByZXN1bHRzLCBpbmNsdWRpbmcgbXVsdGlwbGUgaHlwb3RoZXNpcyBjb3JyZWN0aW9uLCB3ZSBjYW4gcHJvY2VlZCB3aXRoIGdlbmVyYXRpbmcgc3VtbWFyeSBmaWd1cmVzIGFuZCB0YWJsZXMgZm9yIG91ciBkaWZmZXJlbnRpYWwgZXhwcmVzc2lvbiBhbmFseXNpcy4KCi0tLQoKIyBTdW1tYXJ5CgpJbiB0aGlzIHNlY3Rpb24sIHdlOgoKKiBQZXJmb3JtZWQgc3RhdGlzdGljYWwgdGVzdHMgZm9yIGNvbXBhcmlzb25zIG9mIGludGVyZXN0CiogR2VuZXJhdGVkIHRhYmxlcyBvZiBkaWZmZXJlbnRpYWwgZXhwcmVzc2lvbiByZXN1bHRzIC0gaS5lLiBmb2xkIGNoYW5nZXMgYW5kIGFkanVzdGVkIHB2YWx1ZXMgZm9yIGVhY2ggZ2VuZSBpbiBkYXRhc2V0CiogRGlzY3Vzc2VkIGltcG9ydGFuY2UgYW5kIGFwcGxpY2F0aW9uIG9mIG11bHRpcGxlIGh5cG90aGVzaXMgY29ycmVjdGlvbgoKTm93IHRoYXQgd2UndmUgZ2VuZXJhdGVkIG91ciBkaWZmZXJlbnRpYWwgY29tcGFyaXNvbnMgYW5kIGhhdmUgYW4gdW5kZXJzdGFuZGluZyBvZiBvdXIgcmVzdWx0cywgaW5jbHVkaW5nIG11bHRpcGxlIGh5cG90aGVzaXMgY29ycmVjdGlvbiwgd2UgY2FuIHByb2NlZWQgd2l0aCBnZW5lcmF0aW5nIHN1bW1hcnkgZmlndXJlcyBhbmQgdGFibGVzIGZvciBvdXIgZGlmZmVyZW50aWFsIGV4cHJlc3Npb24gYW5hbHlzaXMuCgotLS0KCiMgU291cmNlcwoKKiBIQkMgREdFIHRyYWluaW5nIG1vZHVsZSwgcGFydCAxOiBodHRwczovL2hiY3RyYWluaW5nLmdpdGh1Yi5pby9ER0Vfd29ya3Nob3AvbGVzc29ucy8wNF9ER0VfREVTZXEyX2FuYWx5c2lzLmh0bWwKKiBIQkMgREdFIHRyYWluaW5nIG1vZHVsZSwgcGFydCAyOiBodHRwczovL2hiY3RyYWluaW5nLmdpdGh1Yi5pby9ER0Vfd29ya3Nob3AvbGVzc29ucy8wNV9ER0VfREVTZXEyX2FuYWx5c2lzMi5odG1sCiogREVTZXEyIHZpZ25ldHRlOiBodHRwOi8vYmlvY29uZHVjdG9yLm9yZy9wYWNrYWdlcy9kZXZlbC9iaW9jL3ZpZ25ldHRlcy9ERVNlcTIvaW5zdC9kb2MvREVTZXEyLmh0bWwjZGlmZmVyZW50aWFsLWV4cHJlc3Npb24tYW5hbHlzaXMKCi0tLQoKIVtdKC4vaW1hZ2VzL3NpZ25pZmljYW50X3hrY2QucG5nKQoKYGBge3IgV3JpdGVPdXQuUkRhdGEsIGV2YWw9VFJVRSwgZWNobz1GQUxTRSwgbWVzc2FnZT1GQUxTRSwgd2FybmluZz1GQUxTRX0KIyBIaWRkZW4gY29kZSBibG9jayB0byB3cml0ZSBvdXQgZGF0YSBmb3Iga25pdHRpbmcKIyBzYXZlLmltYWdlKGZpbGUgPSAicmRhdGEvUnVubmluZ0RhdGEuUkRhdGEiKQpgYGAKCi0tLQoKVGhlc2UgbWF0ZXJpYWxzIGhhdmUgYmVlbiBhZGFwdGVkIGFuZCBleHRlbmRlZCBmcm9tIG1hdGVyaWFscyBsaXN0ZWQgYWJvdmUuIFRoZXNlIGFyZSBvcGVuIGFjY2VzcyBtYXRlcmlhbHMgZGlzdHJpYnV0ZWQgdW5kZXIgdGhlIHRlcm1zIG9mIHRoZSBbQ3JlYXRpdmUgQ29tbW9ucyBBdHRyaWJ1dGlvbiBsaWNlbnNlIChDQyBCWSA0LjApXShodHRwOi8vY3JlYXRpdmVjb21tb25zLm9yZy9saWNlbnNlcy9ieS80LjAvKSwgd2hpY2ggcGVybWl0cyB1bnJlc3RyaWN0ZWQgdXNlLCBkaXN0cmlidXRpb24sIGFuZCByZXByb2R1Y3Rpb24gaW4gYW55IG1lZGl1bSwgcHJvdmlkZWQgdGhlIG9yaWdpbmFsIGF1dGhvciBhbmQgc291cmNlIGFyZSBjcmVkaXRlZC4K

Module 10: Differential Expression Results

UM Bioinformatics Core

2022-08-09

Objectives

Differential Expression Workflow

Question

Generating DE results

DESeq2 statistical testing

Generating results

Note: `results()` defaults

Question

Multiple hypothesis testing and FDR correction

Note on `padj` values set to NA

Summary

Sources

Module 10: Differential Expression Results

UM Bioinformatics Core

2022-08-09

Objectives

Differential Expression Workflow

Question

Generating DE results

DESeq2 statistical testing

Generating results

Note: results() defaults

Question

Multiple hypothesis testing and FDR correction

Note on padj values set to NA

Summary

Sources

Note: `results()` defaults

Note on `padj` values set to NA