模型评估、过拟合欠拟合以及超参数调优方法

如何对数据集进行划分出训练集、验证集和测试集呢?如何应对可能的过拟合和欠拟合问题,还有超参数的调优,如何更好更 … Continue reading “模型评估、过拟合欠拟合以及超参数调优方法”

BAM!利用知识蒸馏和多任务学习构建的通用语言模型

在今年年初,微软发布了一个多任务自然语言理解模型,它在通用语言理解评估基准GLUE 上取得了当时最好的效果:1 … Continue reading “BAM!利用知识蒸馏和多任务学习构建的通用语言模型”

谷歌开源进化版 Transformer!基于神经网络架构搜索,效果更好、训练更快

谷歌大脑的新论文 《The Evolved Transformer》 提出了首个用于改进 Transforme … Continue reading “谷歌开源进化版 Transformer!基于神经网络架构搜索,效果更好、训练更快”

大规模机器学习在 LinkedIn 预测模型中的应用实践

在 12 月 7-8 日于北京举办的 ArchSummit 全球架构师峰会上,在领英机器学习组从事机器学习算法 … Continue reading “大规模机器学习在 LinkedIn 预测模型中的应用实践”