基于Bert+BiLSTM+CRF相关理论讲解
Self-attention遗留的问题讲解