Web crawler

Features

Multithread, each crawler instanse is a thread which works with specific frontier queue
Redis storage for frontier, hots data and visited urls
SEO data stores in a specific file in project folder
Fast data processing by regex
You can configure:
- Time between fething
- Max number of crawlers
- Save file location

You should have installed redis-server which will be running on port 6379

Name		Name	Last commit message	Last commit date
Latest commit History 195 Commits
gradle/wrapper		gradle/wrapper
src		src
.gitignore		.gitignore
README.md		README.md
build.gradle.kts		build.gradle.kts
dump.rdb		dump.rdb
gradle.properties		gradle.properties
gradlew		gradlew
gradlew.bat		gradlew.bat
settings.gradle.kts		settings.gradle.kts