VDCNN-for-text-classification

Modifications

Average pooling with dropout before output layer replaces size 2048 fully connected layers
Alphabet distinguishes between unknown, padded and space characters
Depth increased

To retrain each model, run the corresponding shell script. eg:

$ bash train_ag_news.sh

Best reported in paper / my model

	imdb	ag_news	yahoo_answer
VDCNN (17 layers, avg-pooling + dropout)		91.33 / -	-/

K-max-pool implementation screws with learning rate. Using mxnet's native pooling fixes issue.
Add bucketing to massively reduce training time.
Benchmark on AG news dataset

Name		Name	Last commit message	Last commit date
Latest commit History 35 Commits
data		data
.gitignore		.gitignore
README.md		README.md
train.sh		train.sh
train_ag_news.sh		train_ag_news.sh
train_yahoo_answers.sh		train_yahoo_answers.sh
vdcnn.py		vdcnn.py