Full Picture

Extension usage examples:

Here's how our browser extension sees the article:
May be slightly imbalanced

Article summary:

1. 本文研究了将中医临床记录分类为5个主要疾病类别的问题,探讨了多种最先进的深度学习模型,发现双向语言表征可以获得比其他深度学习模型和其他最先进方法更好的效果。

2. 提出了一种新的训练流程,将BERT语言模型与中医领域语料库相结合,并使用原始中文字作为输入,无需预处理或特征工程。

3. 该方法在7037条标准中医临床记录上实验,实测出有效的准确性、宏F1分数和微F1分数。

Article analysis:

本文是一项关于使用BERT和特定领域语料库对传统中医临床记录进行分类的重要工作。作者通过对7037条标准中医临床记录进行实验,并提供了一套开源代码(https://github.com/yao8839836/tcm_bert )来证明他们所提出的方法能够有效地对传统中医临床记录进行分类。

尽管本文是一项重要工作,但也存在一些不可避免的问题。首先,由于使用BERT时必须考虑大量参数(如学习速度、正则化、dropout、batch size 等),因此在实骅时难以保证所有参数都能够得到合理的优化。此外, 作者使用7037条标准中医临床记录来测试他们所提出的方法, 但是并没有考察不同大小样本集上方法的性能, 因此无法保证方法在不同大小样本集上都能够表