自然语言处理通用框架BERT原理解读
特征分配与softmax机制