使用说明

思路

RoBERTa相比于BERT的更改有一项是动态mask，各自的实现方式如下

我这里实现的方式是数据生成和模型训练同时进行，数据生成读入txt文件并转换成待训练文件，模型训练随机选择一份待训练模型进行训练，训练完即销毁，这样使得数据生成对同一份txt文件先后会使用不同的mask方式来生成训练文件，来实现动态mask

先运行起来pretrain_roberta_mlm_data_gen.py（一直运行，一直在生成数据），其中dir_corpus是读入的txt语料地址，dir_training_data是保存的文件目录（生成的待训练数据地址）
运行pretrain_roberta_mlm.py，其中dir_training_data即为pretrain_roberta_mlm_data_gen.py中的dir_training_data
训练过程中，两个进程一直跑着，一般我会一个terminal跑数据生成，另一个termimal跑模型训练