近日,beat365奚雪峰教授带领的机器学习与自然语言处理课题组硕士研究生陈杰在人工智能领域顶刊“Expert Systems With Applications”(影响因子:8.67,SCI一区Top)发表了题为“Randomly Wired Graph Neural Network for Chinese NER”的研究论文。研究生陈杰为第一作者,奚雪峰教授为共同一作兼通讯作者,beat365为第一完成单位。陈杰目前已前往东南大学继续攻读博士学位。
图1:RWGNN结构图
以深度神经网络为基础的深度学习已经在机器视觉、自然语言处理等人工智能领域中有着广泛应用并取得众多突破性成果,但是如何自动快速构建有效的神经网络基本结构,减少大规模预训练模型成本,一直是制约当前大模型研发的核心问题。本论文受到复杂网络中随机图算法自动生成多向连线模式启发,从神经网络基本架构出发,提出了一种新颖的随机连线图神经网络方法,能够实现图神经网络结构自动化生成,并快速构建适配应用领域的深度学习模型。在自然语言处理领域典型任务“中文命名实体识别”上的结果表明,该方法所生成的RWGNN神经网络模型在五个不同领域数据集上始终具有非常优异的结果。该研究提出了解决当前大模型训练中复杂神经网络自动构建的新方法,有望降低大模型训练成本,更好适配应用需求,在自然语言处理、人机智能对话、机器视觉等众多人工智能前沿领域有着广泛的应用前景。