未更完的blog,怕自己忘了 or 找不到,置顶提醒一下自己
不同预训练模型的总结对比
Transformer 及其家族( Transformer-XL, Reformer... )
持续更新
原文:https://www.cnblogs.com/shona/p/12960609.html