大得不同：推荐系统模型与NLP模型

时间：2021-07-24 00:16:44 阅读：28 评论：0 收藏：0 [点我收藏+]

大得不同：推荐系统模型与NLP模型

推荐系统和自然语言处理是大模型高发的两大应用领域，在大的特征下，它们又有各自的特点。下面以推荐系统的代表模型DLRM(Deep Learning Recommendation Model)和GPT-3(Generative Pre-Training)为例说明。

DLRM vs GPT-3

技术分享图片

可以看到，推荐系统模型参数大部分在embeddings部分，而NLP模型参数大部分在FC(transformer)部分。可以认为推荐系统比NLP更稀疏(sparse)、且memory intensive得多。

Transformer block

基本结构

技术分享图片

basic参数

or : total number of transformer blocks

or : number of units in each bottleneck layer, and number of units of each Q/K/V input

or : number of heads of each transformer block

or : input sequence length

derived参数

: dimension of each attention head,

: intermediate layer units of feed forward layer,